La irrupción de DeepSeek en el mercado de la inteligencia artificial generativa ha provocado un impacto significativo tanto en los usuarios como en el sector tecnológico. Lanzado el 20 de enero, su modelo DeepSeek-R1 promete competir con gigantes como ChatGPT (OpenAI) y Gemini (Google), gracias a sus características únicas: bajo costo, eficiencia y código abierto.
El modelo R1 fue entrenado en solo 55 días con un presupuesto de 5.57 millones de dólares, empleando procesadores gráficos H800 de Nvidia, diseñados específicamente para el mercado chino. Esta cifra representa menos de una décima parte del costo de entrenamiento de GPT-4 de OpenAI y menos de una vigésima parte de su modelo o1, lo que redefine las expectativas sobre los recursos necesarios para avances en IA.
- Código abierto: Publicado bajo licencia MIT, permite que los desarrolladores puedan examinar, modificar y adaptar el modelo a sus necesidades, incluyendo ajustes para evitar censura fuera de China.
- Bajo costo y accesibilidad: Disponible para descarga gratuita y con precios competitivos en la nube de DeepSeek, ofreciendo un acceso más asequible que sus principales competidores.
- Eficiencia técnica: Usa el enfoque “cadena de pensamiento” (chain of thought), que desglosa tareas complejas en pasos más simples, optimizando la resolución de problemas matemáticos, programación e inferencia del lenguaje natural.
DeepSeek-R1 ofrece un rendimiento comparable al de o1 de OpenAI y Claude de Anthropic en tareas clave como resolución de problemas y generación de lenguaje. La diferencia principal radica en sus costos significativamente más bajos y su filosofía de código abierto, que facilita la innovación y adaptación por parte de terceros.
El lanzamiento ha generado una avalancha de descargas, aunque también enfrenta desafíos como ciberataques que han restringido el registro de nuevos usuarios. Además, su publicación como código abierto puede contribuir a una mayor democratización de la IA, permitiendo que desarrolladores de todo el mundo exploren su potencial sin las barreras de altos costos.
DeepSeek-R1 representa un cambio de paradigma en el desarrollo de inteligencia artificial, demostrando que grandes avances no necesariamente requieren enormes recursos. Con su accesibilidad y eficiencia, esta herramienta se posiciona como un competidor clave en la evolución del sector tecnológico.