- Nova funció d'Alexa+ a Fire TV que permet saltar a escenes concretes descrivint-les amb la veu.
- La IA es recolza a Amazon Bedrock, models com Nova i Claude, subtítols i X-Ray per entendre quin moment vols veure.
- De moment només funciona amb milers de pel·lícules de Prime Video als Estats Units i Canadà.
- Amazon planeja ampliar la funció a més títols, sèries i més països, inclosa la versió en espanyol.
Veure una pel·lícula a casa i tractar de trobar aquesta escena concreta que tens al cap sol acabar en una batalla amb el comandament: avançar, retrocedir, pausar, tornar a començar… i, de vegades, ni així trobes amb el moment exacte. Amazon vol treure drama a aquest procés amb una novetat a Fire TV que es recolza en la intel·ligència artificial d'Alexa.
La companyia ha començat a desplegar una funció que permet saltar directament a escenes específiques d'una pel·lícula a Prime Video descrivint-les amb la veu a Alexa+, sense haver de tocar la barra de progrés. El sistema entén referències a personatges, frases mítiques o situacions de la trama i porta la reproducció just al punt que li has demanat. De moment, això sí, la disponibilitat es limita als Estats Units i al Canadà, i per això a Espanya i la resta d'Europa toca esperar.
Com funciona la nova funció d'IA a Amazon Fire TV?

La clau d'aquesta novetat és a Alexa+, la versió potenciada amb IA de l'assistent d'Amazon integrada a dispositius Fire TV i l'app de Prime Video. En lloc de fer servir ordres rígides, l'usuari pot descriure l'escena «com li explicaria a un amic» i deixar que el sistema faci la resta. Per exemple, és possible dir coses com: «Salta a l'escena de les targetes a Love Actually» o «Veu a la part de mare meva on Sophie canta “Honey Honey”».
Darrere d'aquesta experiència hi ha diversos elements tècnics treballant alhora. Amazon explica que Alexa+ utilitza models de llenguatge avançats com Amazon Nova i Anthropic Claude, executats sobre la seva plataforma d'IA generativa Amazon Bedrock, per comprendre el context del que dius i complementats amb models d'IA visual. A això se sumen els subtítols, les dades de X-Ray, la informació de repartiment i detalls d'escenes, que ajuden a localitzar el fragment correcte dins de la pel·lícula.
Gràcies a aquesta combinació, el sistema és capaç de reconèixer la pel·lícula fins i tot quan l'usuari no esmenta el títol de manera explícita. Si algú diu «Posa l'escena en què Joshua pregunta “juguem a un joc?”», Alexa+ entén que es refereix a Jocs de guerra i avança la reproducció fins aquell moment. El mateix passa amb frases icòniques de cintes com Die Hard o amb descripcions d'escenes molt concretes, sempre que estiguin degudament indexades.
Ara com ara, el salt d'escena està limitat a milers de pel·lícules del catàleg de Prime Video que estiguin incloses a la subscripció, llogades o comprades digitalment a través de la plataforma. La funció no s'estén, almenys de moment, a aplicacions de tercers com Netflix o Disney+, ni títols emmagatzemats en altres serveis.
La intenció d'Amazon és que tot el procés sigui pràcticament immediat: en rebre la instrucció de veu, Alexa+ creua les dades de l'escena descrita amb la informació semàntica i visual prèviament analitzada, troba el punt temporal concret i reprèn la reproducció des d'allà, sense pantalles intermèdies ni menús addicionals.
Alexa+ com a assistent audiovisual intel·ligent a Fire TV

Aquesta capacitat per saltar d'escena en escena forma part d'un paquet més ampli de millores que Amazon desplega amb Alexa+. La companyia vol convertir Fire TV en un centre d´entreteniment més interactiu, en què l'usuari pugui recolzar-se en la veu per molt més que pausar o canviar de capítol.
A més de localitzar moments específics, Alexa+ és capaç de respondre preguntes relacionades amb el que apareix a la pantalla, com qui és un actor, on es va rodar una determinada seqüència o quina cançó sona en una escena concreta. Aquesta informació se serveix utilitzant la infraestructura de X-Ray i altres bases de dades internes, de manera que es mostren dades contextuals sense necessitat de sortir de la reproducció.
En continguts esportius, la idea és semblant: Alexa+ pot proporcionar estadístiques en temps real, detalls dels jugadors o informació del partit mentre segueix mostrant el vídeo, intenta no interrompre l'experiència principal. Tot això es recolza en el mateix enfocament de l'IA generativa i la comprensió del context aplicat ara al cinema, les sèries i els esdeveniments en directe.
La filosofia que repeteix Amazon als seus anuncis és clara: la missió de Fire TV és «oferir el que vols veure, ràpid». El salt a escenes per veu encaixa en aquesta línia, al reduir el temps que l'espectador passa navegant per menús o rebobinant i concentrar-lo en el contingut que realment us interessa. És una manera d'apropar l'experiència d'un cercador intel·ligent al sofà del saló.
Davant d'altres assistents presents a televisors i reproductors, com els de Google TV, la diferència està en el grau d'integració amb Prime Video. Mentre que solucions com Gemini tendeixen a derivar a clips de YouTube quan se'ls demana una escena, Alexa+ actua directament sobre la reproducció de la pel·lícula que s'està veient a la pròpia plataforma d'Amazon.
Limitacions actuals: regions, catàleg i cost
Tot i que crida l'atenció la funció, ara com ara té diversos límits pràctics que convé tenir en compte. El primer és geogràfic: el salt d'escenes mitjançant Alexa+ només està disponible als Estats Units i al Canadà. La pròpia companyia ha indicat que la versió en espanyol i el desplegament en altres mercats, com Espanya i Llatinoamèrica, arribaran més endavant, sense una data precisa al calendari.
El segon límit és el catàleg compatible. Tot i que Amazon parla de «milers de títols», la funció se centra per ara en pel·lícules de Prime Video, quedant fora les sèries i determinats continguts que encara no han estat indexats amb el nivell de detall que exigeix aquest tipus de cerca. L'empresa assegura que anirà ampliant progressivament el nombre d'obres admeses i incorporarà programes de televisió en el futur.
També cal tenir en compte el model daccés a Alexa+. Aquesta versió avançada de l'assistent s'ofereix com servei de pagament mensual o com a part d'alguns nivells de subscripció d'Amazon, cosa que suscita debat quant a la seva relació qualitat-preu, sobretot per als que ja paguen Prime. És previsible que, de cara a la seva expansió internacional, la companyia ajusti paquets i condicions en funció de cada regió.
Una altra limitació rellevant és que el salt d'escena només funciona dins de l'ecosistema d'Amazon: no és possible utilitzar-lo amb biblioteques digitals comprades a altres botigues ni amb plataformes de streaming externes. Encara que això pugui resultar lògic des del punt de vista tècnic i comercial, també marca una frontera clara davant dels que utilitzen el Fire TV com a concentrador de diferents aplicacions.
Finalment, el sistema encara depèn que les escenes siguin prou conegudes o estiguin ben descrites a les metadades. En pel·lícules menys populars o amb estructures narratives complexes, és possible que la precisió no sigui sempre perfecta, una cosa que Amazon haurà d'anar polint a mesura que reculli més exemples d'ús real.
Impacte potencial a l'experiència de streaming a Espanya i Europa
Tot i que la funció encara no ha creuat l'Atlàntic, la seva arribada tindria implicacions interessants per al mercat europeu del transmissió. A països com Espanya, on conviuen diversos serveis de vídeo sota demanda i els dispositius Fire TV tenen una presència notable, una millora d'aquest tipus es pot convertir en un element diferenciador a l'hora d'escollir ecosistema.
Per a l'usuari mitjà, acostumat a fer servir el comandament a distància o, amb sort, ordres bàsiques de veu, poder demanar una escena concreta en català amb frases naturals pot canviar la manera com es revisen pel·lícules, es busquen moments memorables o s'ensenyen fragments a amics i familiars. Una cosa tan quotidiana com recordar «l'escena de la persecució de la roca a A la recerca de l'arca perduda» i saltar-hi sense esforç encaixa bé amb els hàbits de consum actuals.
A nivell tecnològic, la irrupció d‟aquestes funcions planteja preguntes sobre com s'indexen i analitzen els continguts audiovisuals a Europa, un entorn subjecte a normatives de protecció de dades i drets d'autor específiques. Amazon ja fa servir X-Ray i altres eines internes per extreure informació de les obres que distribueix, i la seva ampliació a models d'IA generativa podria reforçar aquesta tendència, sempre sota el marc regulador aplicable.
Per a altres actors del mercat, des de fabricants de televisors amb sistemes propis fins a plataformes de streaming rivals, el moviment d'Amazon pot servir de pressió competitiva per desenvolupar alternatives similars. No seria estrany que vegem, els propers anys, intents de replicar aquest tipus de cerca semàntica d'escenes en altres serveis, ja sigui mitjançant assistents de veu integrats o aplicacions específiques.
Alhora, en regions amb una forta producció audiovisual local, com Espanya, Itàlia, França o els països nòrdics, l'efectivitat d'aquestes funcions dependrà de com de bé s'adaptin a cada idioma, accent i forma d'expressar-se. El repte no només és traduir la interfície, sinó entendre referències culturals, expressions col·loquials i maneres de descriure una escena pròpies de cada zona.
Una pista clara de cap a on va la televisió connectada

El salt d'escenes controlat per veu a l'Amazon Fire TV no deixa de ser la punta de llança d'una tendència més àmplia: la integració profunda de la IA conversacional a la televisió connectada. El que avui es limita a localitzar moments concrets podria, amb el temps, evolucionar cap a experiències més complexes, com ara crear compilacions personalitzades d'escenes o navegar per una saga sencera a base de preguntes i respostes.
En el cas d'Amazon, Alexa+ ja apunta en aquesta direcció en combinar comprensió del llenguatge, anàlisi d'imatge i dades contextuals. A mesura que s?ampliïn les capacitats de l?assistent, és raonable pensar en funcions que permetin, per exemple, saltar només a escenes on apareix un actor específic, o repassar totes les jugades clau d?un partit sense que l?usuari hagi de buscar manualment cada moment.
Per als creadors de contingut i les productores europees, aquest tipus d'eines pot obrir vies addicionals per posar en valor escenes icòniques, cameos o referències internes, ja que seran més fàcilment accessibles amb una simple ordre de veu. També obliga a cuidar encara més les metadades i la manera com es documenten les obres, atès que la IA s'alimenta precisament d'aquesta informació.
Des del punt de vista de l'usuari final, l'adopció generalitzada d'aquestes funcions pot canviar la relació amb el contingut. En lloc de veure les pel·lícules sempre de principi a fi, és possible que guanyin pes els visionats fragmentats, de moment saltant segons l'estat d'ànim o la curiositat de l'espectador. És una evolució que ja s?intueix amb els clips virals i els resums, ara traslladada al saló de casa.
L'aposta d'Amazon per permetre que Alexa entengui descripcions d'escenes i actuï sobre elles situa Fire TV un pas més a prop de ser un intermediari intel·ligent entre l'espectador i l'enorme biblioteca de continguts que avui ofereixen les plataformes. Si la companyia aconsegueix traslladar aquesta experiència, afinada i ben localitzada, a mercats com l?espanyol, és probable que més d?un comenci a mirar el comandament a distància amb altres ulls.
Sóc un apassionat de la tecnologia que ha convertit els seus interessos frikis en professió. Porto més de 10 anys de la meva vida utilitzant tecnologia d'avantguarda i traslladant tota mena de programes per pura curiositat. Ara he especialitzat en tecnologia d'ordinador i videojocs. Això és perquè des de fa més de 5 anys que treballo redactant per a diverses webs en matèria de tecnologia i videojocs, creant articles que busquen donar-te la informació que necessites amb un llenguatge comprensible per tothom.
Si tens qualsevol pregunta, els meus coneixements van des de tot allò relacionat amb el sistema operatiu Windows així com Android per a mòbils. I és que el meu compromís és amb tu, sempre estic disposat a dedicar-te uns minuts i ajudar-te a resoldre qualsevol dubte que tinguis a aquest món d'internet.
