Foxconn lanza un modelo extenso de lenguaje en chino tradicional con tecnología de Nvidia

Por Canal26

Lunes 10 de Marzo de 2025 - 00:43

Taipéi, 10 mar (EFE).- La taiwanesa Hon Hai, conocida internacionalmente como Foxconn, anunció este lunes el lanzamiento de su primer modelo extenso de lenguaje (LLM) en chino tradicional, desarrollado en tan solo cuatro semanas gracias a los chips de la estadounidense Nvidia.

Este modelo, con nombre en clave FoxBrain y diseñado originalmente para aplicaciones internas del grupo Hon Hai, será de código abierto y "se compartirá públicamente en el futuro", explicó la compañía en un comunicado.

Según la tecnológica, FoxBrain no solo cuenta con "potentes capacidades de comprensión y razonamiento", sino que también "está optimizado para el estilo de lenguaje de los usuarios taiwaneses, mostrando un rendimiento sobresaliente en pruebas de razonamiento matemático y lógico".

"Nuestro modelo FoxBrain adoptó una estrategia de entrenamiento muy eficiente, enfocándose en optimizar el proceso de entrenamiento en lugar de acumular poder computacional a ciegas", aseguró Li Yung-hui, director del Centro de Investigación en Inteligencia Artificial (IA) del Instituto Hon Hai, entidad encargada de este desarrollo.

"A través de métodos de entrenamiento cuidadosamente diseñados y la optimización de recursos, hemos construido exitosamente un modelo de IA local con potentes capacidades de razonamiento", apuntó.

Durante el entrenamiento de este modelo, basado en la arquitectura Meta Llama 3.1, que cuenta con 70.000 millones de parámetros, Hon Hai empleó 120 unidades de procesamiento gráfico (GPUs) Nvidia H100 emplazadas en una red Nvidia Quantum-2 InfiniBand.

Respecto al rendimiento de la aplicación, Hon Hai señaló que FoxBrain mostró "mejoras generales en matemáticas" en comparación con el modelo base de Meta Llama 3.1 y "avances significativos" frente a Taiwan Llama, otro modelo extenso de lenguaje en chino tradicional.

"Aunque aún existe una ligera diferencia con el modelo de destilación de DeepSeek, el rendimiento (de FoxBrain) ya se acerca a los estándares líderes a nivel mundial (...). En comparación con modelos de inferencia lanzados recientemente en el mercado, este método más eficiente y económico marca un nuevo hito para el desarrollo de la IA en Taiwán", apuntó la tecnológica.

El desarrollo de este modelo extenso de lenguaje es el último ejemplo de colaboración entre Nvidia y Foxconn: la firma asiática es el principal fabricante de los servidores GB200 de la compañía estadounidense, que resultan fundamentales para el desarrollo de las aplicaciones más punteras de inteligencia artificial.

Fundado en 1974, Foxconn es el fabricante de productos electrónicos por contrato más grande del mundo, con fábricas y centros de investigación en China, India, Japón, Vietnam y Estados Unidos, entre otros países. EFE

jacb/vec/rrt