La startup de computación AI Cerebras lanza modelos de código abierto similares a ChatGPT
La startup de chips de inteligencia artificial Cerebras Systems dijo el martes que lanzó modelos de código abierto similares a ChatGPT para que la comunidad investigadora y empresarial los use de forma gratuita en un esfuerzo por fomentar una mayor colaboración.
Cerebras, con sede en Silicon Valley, lanzó siete modelos, todos entrenados en su supercomputadora de inteligencia artificial llamada Andromeda , incluidos modelos de lenguaje más pequeños de 111 millones de parámetros a un modelo más grande de 13 mil millones de parámetros.
«Hay un gran movimiento para cerrar lo que ha sido código abierto en IA… no es sorprendente, ya que ahora hay mucho dinero en ello», dijo Andrew Feldman, fundador y director ejecutivo de Cerebras. «La emoción en la comunidad, el progreso que hemos logrado, se debe en gran parte a que ha sido muy abierta».
Los modelos con más parámetros pueden realizar funciones generativas más complejas.
El chatbot ChatGPT de OpenAI, lanzado a fines del año pasado, por ejemplo, tiene 175,000 millones de parámetros y puede producir poesía e investigación, lo que ha ayudado a generar un gran interés y financiamiento para la Inteligencia Artificial en general.
Cerebras dijo que los modelos más pequeños se pueden implementar en teléfonos o parlantes inteligentes, mientras que los más grandes se ejecutan en PC o servidores, aunque las tareas complejas como el resumen de pasajes grandes requieren modelos más grandes.
Sin embargo, Karl Freund, consultor de chips en Cambrian AI, dijo que más grande no siempre es mejor.
«Se han publicado algunos artículos interesantes que muestran que (un modelo más pequeño) puede ser preciso si lo entrenas más», dijo Freund. «Así que hay una compensación entre más grande y mejor entrenado».
Feldman dijo que su modelo más grande tardó un poco más de una semana en entrenarse, un trabajo que normalmente puede llevar varios meses, gracias a la arquitectura del sistema Cerebras, que incluye un chip del tamaño de un plato construido para el entrenamiento de Inteligencia Artificial.
La mayoría de los modelos de IA actuales están entrenados en los chips de Nvidia, pero cada vez más empresas emergentes como Cerebras están tratando de tomar parte en ese mercado.
Los modelos entrenados en las máquinas Cerebras también se pueden usar en los sistemas Nvidia para una mayor capacitación o personalización, dijo Feldman. Ver las imágenes en nuestro Portal TV.
Fuente: reuters