Meta ha presentat un model d'intel·ligència artificial (IA) que és capaç de traduir veu i text en 101 idiomes i fer traduccions en temps real de veu a veu en 36 llengües, entre elles, el català. Aquesta intel·ligència artificial, que aviat estarà disponible per a tot el públic, imita la veu dels interlocutors, filtra més del 40% dels sorolls i, en contra de l'estratègia en xarxes de Mark Zuckerberg, mitiga la “toxicitat”, moderant els missatges violents. Aquest model, que rep el nom de SEAMLESSM4T i que no es podrà usar amb finalitats comercials, ha rebut molt bones perspectives per parts dels experts que asseguren que supera els existents, i que podria aplanar el camí cap a les traduccions universals ràpides.
La primera versió del model es va anunciar l'agost de 2023, i aquest dimecres un article publicat a la revista Nature, ha rebut diverses innovacions en la unificació de l'entorn d'ús, els idiomes inclosos, els filtres de soroll i la diversitat d'accents. SEAMLESSM4T pot reconèixer fins a 101 idiomes (escrits o parlats) i és capaç de traduir-ne 36 en format de veu i 96 en un arxiu de text. "Tradueix entre un 8% i un 23% amb més de precisió que els sistemes existents, pot filtrar el soroll de fons, entre un 42% i un 66% més, i s'ajusta a la variació de veus", explica Marta Costa-Jussà, investigadora de la divisió d'intel·ligència artificial de Meta.
No segueix el mateix camí que amb les xarxes
La companyia de Zuckerberg ha eliminat el sistema de verificació de dades i la moderació de continguts en les seves plataformes de comunicació, obrint la porta a boles, biaixos i discursos d'odi. En canvi, amb el sistema de traducció simultània, ha optat per l'estratègia totalment contrària centrant-se en la “mitigació de la toxicitat”, perquè aquesta pot inferir al sistema durant l'aprenentatge automàtic o en la traducció. Meta considera toxicitat les blasfèmies o respostes que poden incitar a l'odi, la violència o l'abús contra una persona o un grup (com una religió, raça o gènere). Per mitigar-ho, ha desenvolupat una eina denominada Etox, entrenada per detectar elements tòxics en la parla.
Una altra de les limitacions que intenta superar el nou sistema és l'escassetat d'idiomes operatius. Encara que més de la meitat de la humanitat parla principalment mitja dotzena d'idiomes, la diversitat és tan àmplia que queden fora del servei més de 7.000 llengües existents al món. El model de meta ha intentat pal·liar aquesta deficiència incorporant fins a 101 llengües, malgrat l'escassetat de dades d'àudio i models per a incorporar-los a la IA. Meta es troba ara mateix en una missió per fer-se amb el mercat de la intel·ligència artificial, i ja anunciat que la companyia tindrà el seu propi cercador impulsat per IA i unes ulleres intel·ligents, en col·laboració amb Ray Ban, que funcionen amb IA.