El catalán ya es la lengua con más horas grabadas en el repositorio de voces Common Voice, según ha anunciado Òmnium Cultural este miércoles a través de las redes sociales. La entidad cultural ha destacado que se trata de un proyecto "clave para conseguir que las nuevas tecnologías y los dispositivos de inteligencia artificial nos entiendan y hablen catalán". En total, la lengua catalana cuenta con cerca de 3.200 horas grabadas en el repositorio Common Voice y 2.400 horas validadas, unas cifras que la sitúan al frente del registro, junto con el inglés.

Diferentes organismos en defensa de la lengua catalana han llevado a cabo acciones a lo largo de los últimos meses para conseguir aumentar la cifra de horas grabadas en este repositorio de voces, un hito que han logrado hasta situar el catalán como la lengua con más presencia en Common Voice. Es el caso de Plataforma per la Llengua, con su campaña 'Pel futur de la llengua, la teva veu gravada a foc', pero también lo ha hecho la Generalitat. El exvicepresidente Jordi Puigneró pidió la colaboración ciudadana a través del proyecto AINA, que buscaba recoger más voces para Common Voice.

El repositorio de voces Mozilla Common Voice: ¿para qué sirve?

Common Voice es un conjunto de datos de voz disponible públicamente con el objetivo de ayudar a conseguir que las máquinas conozcan como hablan las personas en su día a día, teniendo en cuenta aspectos como las variantes dialectales. Para hacerlo, la base de datos ha sido impulsada por voces de colaboradores voluntarios de todo el mundo, que han grabado y facilitado pequeños fragmentos.

Desde el repositorio aseguran que actualmente la mayoría de bases de datos de esta tipología "son propiedad de empresas, lo que frena la innovación". Es por eso que han decidido poner en marcha "de forma colaborativa un conjunto de datos de voz en abierto". "Dad vuestra voz, validad la precisión de los cortes de otras personas y haced que el conjunto de datos sea mejor para todo el mundo", piden. Si quieres participar en este proyecto, puedes aportar tu voz a través de este portal de Common Voice. El proceso para hacerlo es muy simple, solo hace falta seguir paso a paso las indicaciones y dar consentimiento para poder utilizar la voz.