Skip to main content

Investigadores de atlanTTic advirten que o galego é a lingua cooficial con menor desenvolvemento de tecnoloxía lingüística

A catedrática Carmen García Mateo e o investigador José Manuel Ramínez Sánchez, do Grupo de Tecnoloxías Multimedia (GTM) do Centro de Investigación en Tecnoloxías de Telecomunicación (atlanTTic) da Universidade de Vigo foron os encargados de analizar a situación en canto a recursos, servizos e comunidades de falantes do galego e as súas conclusións amosan que este idioma está á cola en canto a recursos e aplicacións respecto ao resto de linguas oficiais do estado.

Segundo recollen no seu informe, “hai poucas aplicacións de síntese de voz, recoñecemento de voz, corrección ortográfica e gramatical e tradución automática; polo tanto, un baleiro importante en canto a recursos multimedia adecuados para desenvolver aplicacións tan importantes no mundo actual como os axentes conversacionais por voz de última xeración”. Pola contra, destacan, o galego “si ten boa presenza en bases de datos de texto de gran dimensión e as tecnoloxías e os servizos baseados en texto están nunha fase máis madura”.

Diferenza crítica respecto a outras linguas cooficiais

Os datos amosan unha fenda considerable en comparación con outras linguas con maior número de falantes, pero tamén coas outras linguas cooficiais do Estado español, como o catalán e o éuscaro. “Esta diferenza é crítica en canto a recursos e servizos relacionados con datos de tipo multimedia ou do ámbito da saúde, pois os existentes son pobres en diversidade e pequenos en tamaño”, sinala o estudo. O maior perigo a curto prazo é que, de non reverterse esta situación, o galego quede fóra da revolución que o Big Data e a intelixencia artificial están a provocar en moitos sectores estratéxicos pola falta de recursos para aplicar estas tecnoloxías.

Como exemplo positivo, o informe apunta o sitio web da Radio Televisión de Galicia pola produción de contidos multimedia e tamén destaca a existencia dun número crecente de diarios locais dixitais escritos en galego. Por outra banda, os investigadores apuntan que, aínda que algunhas plataformas como Facebook ou Youtube, ou grandes empresas de software como Microsoft ou Apple ofrecen unha versión con soporte para o galego nas súas interfaces, moitas outras como TikTok, Twitch ou Adobe, utilízano en beta ou con menor apoio, como é o caso de Twitter. Os investigadores tamén sinalan que se produce unha falta extrema de apoio ao galego nos asistentes virtuais como Alexa, Siri, Google Assistant ou Cortana. No sentido contrario, destacan que nos últimos anos se desenvolveron unha serie de produtos e servizos destinados á incorporación do galego nas TIC, poñendo como exemplo o portal da Real Academia Galega, o tradutor Gaio ou o sitio web do Goberno galego.

O punto forte: unha experimentada comunidade investigadora en Galicia

Segundo a catedrática da Escola de Enxeñaría de Telecomunicación, Carmen García Mateo, o galego está nunha “situación con moita marxe de mellora, non só en termos de presenza en internet, senón tamén no relativo a recursos e soporte dixital”. Nesa marxe para mudar esta realidade, recalca, “en termos obxectivos, favorécenos a existencia dunha experimentada comunidade investigadora en Galicia en áreas como o recoñecemento automático da fala, a síntese de voz ou o procesamento de linguaxe natural e, por suposto, en áreas humanísticas como a filoloxía ou a lingüística”. De feito, na actualidade existe unha liña de colaboración interdisciplinar do persoal investigador de atlanTTic xunto cos docentes da Facultade de Filoloxía e Tradución da Universidade de Vigo que xa permitiu “desenvolver ferramentas e recursos lingüísticos”. Esta alianza é, en gran medida, destaca García Mateo, “a responsable nos últimos catro anos dun aumento considerable da produción de recursos e servizos de calidade para a lingua galega”.

No sentido contrario, os investigadores observan “unha tendencia nas grandes empresas do sector consistente en reducir os seus esforzos en desenvolver tecnoloxías específicas para linguas minoritarias como o galego” e advirten da falta de interese polas linguas cooficiais en xeral nalgunhas estratexias nacionais relacionadas coas tecnoloxías do fala como na Estratexia do Procesamento da Linguaxe Natural 2020 ou a Estratexia Nacional de Intelixencia Artificial 2020.

Propostas de mellora

Como propostas de mellora, os investigadores de atlanTTic recomendan, en primeiro lugar, “a creación dunha oficina pública que custodie de maneira centralizada e estandarizada todos os recursos desenvolvidos para a lingua galega xa que, na actualidade, atópanse diseminados en páxinas web ou en servidores internos dos desenvolvedores facendo complexa a súa procura”. En segundo lugar, segundo os investigadores “é necesario investir na creación de bases de datos de recursos lingüísticos de calidade e gran tamaño con contido multimedia, dígase gravacións de audio ou vídeo, que cubran as distintas variantes e estilos da lingua falada no territorio galego”. En terceiro lugar, “apoiar a produción científica e a transferencia tecnolóxica baseada en tecnoloxías da fala e a linguaxe para que o galego gañe presenza en solucións comerciais e sexa considerado como un nicho de mercado de interese”.

En canto ás comunidades de falantes “cremos indispensable que consuman e produzan contidos en galego; pero tamén que esixan soporte para o galego naqueles servizos e produtos que consomen regularmente (plataformas de contidos, medios dixitais, aplicacións móbiles ou de escritorio, sistemas operativos, etc.)”.
Universidade de Vigo