29 de abril 2025
Dólar
Compra 40,85 Venta 43,25
29 de abril 2025 - 5:00hs

Al pedirle a Sora de OpenAI o Veo2 de Google que generen imágenes sobre Uruguay, los resultados muestran errores evidentes. La Plaza Independencia parece europea y el Estadio Centenario se transforma en tribunas inventadas.

Cuando se trata de íconos como la Torre Eiffel o el Big Ben, las IA responden de forma precisa. La diferencia revela un problema de base: la falta de entrenamiento adecuado con datos uruguayos.

20250427_1146_Selfie at The Fingers_simple_compose_01jsvve5yeejnv5ywzya67fh5n.gif

Falta de datos locales en los entrenamientos

Estas fallas ocurren porque, según el estudio de The Data Provenance Initiative, liderado por investigadores del MIT, Harvard y Cohere for AI en 2023, los modelos fueron entrenados con "datos provenientes mayoritariamente de Europa, Australia y Estados Unidos".

Más noticias

Agustina Pérez Comenale, abogada especializada en nuevas tecnologías, explicó que "la info de Uruguay muchas veces se iba para Argentina", debido a la escasa presencia de contenidos uruguayos en los datasets globales.

Aunque reconoce que "los nuevos modelos empiezan a corregir algunos errores", advierte que la mejora es gradual y "todavía falta integrar más datos locales de manera sistemática" para lograr representaciones precisas.

Errores como la mala representación de la bandera uruguaya en versiones anteriores ya habían anticipado esta falta de entrenamiento específico.

El sesgo global en los conjuntos de datos

El informe de The Data Provenance Initiative muestra que la representación cultural en las IA "está fuertemente sesgada hacia países angloparlantes y Europa occidental".

Esta problemática no es exclusiva de Uruguay. Según un reporte de la Harvard Business School, "sólo el 8% de los profesionales que trabajan en IA en EE.UU. son hispanos", lo que reduce aún más la posibilidad de que los sistemas sean diseñados considerando las realidades latinoamericanas.

La baja representación en el desarrollo tecnológico refuerza sesgos culturales invisibles en los productos finales, afectando también las posibilidades de participación económica y social.

El Uruguay Innovation Hub y las soluciones propuestas

En Uruguay, esta necesidad fue discutida en encuentros del Uruguay Innovation Hub, espacio de articulación entre empresas privadas y organismos públicos para fomentar la innovación tecnológica.

Allí se propuso la creación de datasets de habla hispana que incorporaran contenidos locales, para mejorar la presencia latinoamericana en los sistemas de IA.

Una iniciativa regional en ese sentido es el Índice Latinoamericano de Inteligencia Artificial (ILIA) 2024, publicado a comienzos de este año. El informe señala la urgencia de desarrollar modelos propios y anuncia la creación del primer Gran Modelo de Lenguaje Latino.

Este proyecto, impulsado por varios centros de investigación de América Latina, busca construir una IA entrenada con datos locales, capaz de reflejar las particularidades culturales, lingüísticas y sociales de la región.

Según el ILIA, el modelo debería estar operativo en el primer semestre de 2025 y representa un paso importante hacia una "soberanía digital" para América Latina.

"Si no alimentamos nuestros propios sistemas con datos que reflejen nuestras realidades, quedaremos condenados a utilizar herramientas hechas para otros mundos", alerta el documento.

Los riesgos de un ecosistema de datos cerrado

El informe de The Data Provenance Initiative advierte que "los conjuntos de datos más ricos y creativos tienden a estar monopolizados en colecciones de acceso cerrado".

Este fenómeno genera un riesgo mayor: los modelos de IA que dominarán el futuro estarán entrenados sobre representaciones culturales homogéneas, reforzando la exclusión de regiones como América Latina.

La falta de datasets abiertos limita las oportunidades de investigación en países en desarrollo, reduce la capacidad de personalizar tecnologías para contextos locales y profundiza la dependencia tecnológica.

Según la Harvard Business School, "la falta de diversidad en quienes diseñan sistemas de IA puede aumentar las brechas económicas y sociales ya existentes".

Además, el ILIA 2024 advierte que los sistemas actuales "tienden a replicar sesgos que desconocen los matices culturales de nuestra región", afectando tanto la calidad de las respuestas como la capacidad de los países latinoamericanos para integrarse en igualdad de condiciones a la economía digital.

Temas:

Inteligencia Artificial Sora Google OpenAI

Seguí leyendo

Te Puede Interesar

Más noticias de Argentina

Más noticias de España

Más noticias de Estados Unidos