VSN utilitza la intel·ligència artificial per catalogar l'arxiu d'RTVE

L'empresa audiovisual de Terrassa ha guanyat un concurs públic per a un projecte consistent en el "metadatatge" automàtic d'11.000 hores de contingut de la ràdio-televisió pública

  • Gran nivell de ciclisme en el Memorial Ramon Tejedor
Publicat el 07 de juliol de 2022 a les 10:12
Actualitzat el 07 de juliol de 2022 a les 16:40
L’empresa terrassenca VSN (Video Stream Networks SL), tecnològica especialitzada a desenvolupar solucions avançades de programari per a les indústries “broadcast”, mèdia i d’entreteniment, ha ajudat a RTVE a incorporar la intel·ligència artificial en el seu fons documental. La companyia egarenca va guanyar un concurs de la radio-televisió pública, que buscava catalogar automàticament 11.000 hores de contingut produït per TVE en la dècada dels 60 i 70 usant la intel·ligència artificial. La corporació pública no només buscava una solució per automatitzar l'extracció de les metadades inherents al seu contingut audiovisual, sinó que el projecte buscava trobar un sistema que li permetés simplificar la presentació d'aquesta informació per a ajudar el seu servei de documentació a validar les dades extretes pel sistema. Per al projecte, l'empresa de Terrassa s'ha valgut de la integració dels principals motors d'intel·ligència artificial del mercat que permet la seva plataforma de gestió de mèdia VSNExplorer MAM i la possibilitat de presentar un servei al núvol amb aquesta tecnologia. VSN ha treballat amb el motor de la empresa Etiqmedia per al processament de les metadades procedents d'audio i amb Azure per a les provinents del vídeo. El projecte s'ha desenvolupat en dues fases: una primera de prova, que es va realitzar durant quatre mesos, i la posterior implantació definitiva del servei, que va començar el mes d'octubre de 2021 i que té un any de durada. Durant el procés de catalogació, els documents procedents de l'arxiu d'RTVE s'ingesten a la plataforma VSNExplorer MAM, incloent un arxiu de mèdia i un document XML amb informació sobre el contingut. Quan aquest contingut entra en el sistema, el procés de metadatatge automàtic posa en marxa el motor d'intel·ligència artificial, que mostra tota la informació extreta en una única interfície centralitzada. En termes d'àudio, aquesta tecnologia és capaç d'extreure en pocs minuts una transcripció total en text, la seva capitalització i accentuació, el reconeixement de les persones, llocs, esdeveniments, productes, organitzacions i dates que s'esmenten, així com paraules clau i una classificació automàtica del contingut. En vídeo, la visió artificial és capaç de realitzar reconeixement facial,  identificar i catalogar l'escena, juntament amb els objectes, etiquetes i rètols que apareixen en les imatges. Tota aquesta informació es mostra i es troba disponible en la interfície web de VSNExplorer MAM per a realitzar un control de qualitat sobre aquesta. D'aquesta manera, els documentalistes d'RTVE poden consultar i editar els resultats obtinguts perquè s'ajustin als paràmetres de catalogació desitjats d'una forma senzilla i ràpida. Per exemple, poden corregir la transcripció de l'àudio o introduir personatges que la intel·ligència artificial hagi passat per alt, expliquen des de la companyia, amb seu al Parc Audiovisual de Catalunya. Una vegada finalitzat el procés, VSNExplorer MAM crea diversos arxius XML amb tota aquesta informació que s'envien de tornada a l'arxiu d'RTVE. D'aquesta manera, els actius de la cadena pública incorporen després del procés unes metadades que permeten una catalogació completa, facilitant la seva cerca i recuperació per als usuaris d'RTVE. “Per al Fons Documental RTVE, aquest projecte no sols permet fer accessibles milers d'hores de continguts de gran interès, sinó que a més constitueix una oportunitat única d'influir en el desenvolupament de les tecnologies que seran quotidianes en un futur, sent a més pioners en la seva implantació en el treball diari de l'arxiu”, assegura Virginia Bazán Gil, responsable de projectes en el Fons Documental RTVE. “Les característiques d'aquest projecte mostren tot el que la intel·ligència artificial integrada en un sistema MAM pot aportar a la catalogació de contingut en grans arxius documentals. Gràcies a la tecnologia desenvolupada pel nostre equip, VSN i VSNExplorer MAM ja estan preparats per a incorporar els avantatges que permet aquesta tecnologia”, comenta Antonio Brotons, cap de projecte de VSN