Modelo DeepSeek-V3: un desafío rentable y abierto para los gigantes de la Inteligencia Artificial

100%

4 Likes

30/12/2024

By Prensa

Una empresa china de inteligencia artificial presentó el jueves DeepSeek-V3, un nuevo y potente modelo de lenguaje que está causando sensación por su supuesta rentabilidad y disponibilidad abierta. Este lanzamiento desafía directamente el predominio de los modelos cerrados como la serie GPT de OpenAI y plantea importantes preguntas sobre el futuro de la accesibilidad y la asequibilidad de la inteligencia artificial.

Las pruebas internas de la empresa muestran que el modelo se destaca en inglés, chino, codificación y matemáticas, y rivaliza incluso con modelos comerciales líderes como el GPT-4o de OpenAI. El tamaño del modelo, que cuenta con 671 mil millones de parámetros, eclipsa al Llama 2 de Meta e incluso supera al Llama 3.1 , lo que posiblemente contribuya a su rendimiento declarado.

Si bien ofrece un rendimiento similar a lo que la comunidad llama «modelos de frontera», DeepSeek-V3 también se destaca por sus menores costos operativos y de desarrollo. DeepSeek afirma que gastó apenas $5,5 millones en entrenar el modelo, una fracción de los aproximadamente $100 millones invertidos por OpenAI en GPT-4.

DeepSeek-V3 asegura además precios significativamente más bajos para sus servicios en línea, con 1 millón de tokens a un precio de solo $1,1, actualmente ofrecidos a una tarifa promocional de $0,28, un contraste dramático con el precio de $10 de GPT-4o.

Además de su potencial disruptivo, DeepSeek-V3 está disponible para descarga gratuita y ejecución local, lo que ofrece importantes ventajas para los usuarios que priorizan la privacidad de los datos, trabajan en áreas con acceso limitado a Internet o buscan un mayor control sobre sus herramientas de IA.

Sin embargo, el gran tamaño de DeepSeek-V3 presenta un obstáculo importante para los usuarios domésticos: ejecutar DeepSeek-V3 requiere un hardware considerable, que supera con creces las capacidades de las PC y los teléfonos inteligentes. Los usuarios individuales probablemente preferirán su chatbot gratuito.

Hasta el momento, los ejemplos reales verificables de ejecución local exitosa siguen siendo limitados, y aún se necesita una verificación independiente de las afirmaciones de rendimiento de la empresa. Un bloguero afirmó que el modelo puede ejecutarse en un clúster de ocho Apple Mac Mini Pros, cada uno con un potente chip M4 y 64 gigabytes de memoria.

El equipo completo cuesta más de 10.000 dólares. DeepSeek reconoce el gran tamaño del modelo y su velocidad imperfecta, y atribuye estas limitaciones a las limitaciones actuales del hardware. Expresan optimismo respecto de que los avances en el hardware resolverán naturalmente estos problemas.

Fuente: CGTN

DeepSeek-V3