Volver al Hub
Herramientas

DeepSeek: La IA China que Hizo Temblar a Silicon Valley

Publicado el 27 de enero de 2026Lectura de 5 min
DeepSeek: La IA China que Hizo Temblar a Silicon Valley

El 27 de enero de 2025, Nvidia perdió 600.000 millones de dólares en un solo día. La mayor caída en la historia de Wall Street para una sola empresa. El Nasdaq se desplomó un 4%. ASML cayó un 7%. Los inversores entraron en pánico.

¿El culpable? Una startup china de la que casi nadie había oído hablar: DeepSeek.

Lo que pasó ese día cambió para siempre la narrativa de que Estados Unidos dominaba la carrera de la IA. Una empresa fundada hace apenas dos años, con recursos limitados y chips de segunda mano (los que EE.UU. permite exportar a China), había creado un modelo que igualaba o superaba a los de OpenAI. Y lo había hecho gastando menos de 6 millones de dólares, cuando los americanos invierten cientos de millones.

Si todavía no conoces DeepSeek, es hora de que lo hagas. Porque esto no es una anécdota. Es el comienzo de una guerra tecnológica que va a definir la próxima década.

Qué es DeepSeek (y por qué importa)

DeepSeek es una empresa china de inteligencia artificial fundada en 2023 por Liang Wenfeng, quien también dirige High-Flyer, uno de los fondos de inversión cuantitativa más grandes de China. La empresa nació del departamento de investigación de IA del fondo.

Pero DeepSeek no es una empresa de IA más. Lo que la hace especial son tres cosas:

1. Código abierto total. Todos sus modelos están disponibles bajo licencia MIT. Puedes descargarlos, modificarlos, usarlos comercialmente, lo que quieras. Esto es radicalmente diferente a OpenAI (cerrado) o incluso a Meta con Llama (abierto pero con restricciones).

2. Rendimiento de primera línea. Sus modelos compiten directamente con GPT-4o, Claude y Gemini. En algunos benchmarks, los superan. Y estamos hablando de una startup, no de una empresa con miles de millones de dólares.

3. Coste ridículamente bajo. DeepSeek afirma haber entrenado su modelo V3 con menos de 6 millones de dólares. Para ponerlo en contexto: se estima que entrenar GPT-4 costó más de 100 millones. Es una diferencia de más del 90%.

Esto es lo que asustó a Wall Street. Si puedes conseguir resultados similares con una fracción del coste, ¿para qué necesitas los chips más caros de Nvidia? ¿Para qué necesitas invertir miles de millones?

Imagen insertada

El contexto: la guerra tecnológica EEUU-China

Para entender por qué DeepSeek es tan importante, hay que entender el contexto geopolítico.

Desde 2022, Estados Unidos ha impuesto restricciones cada vez más duras a la exportación de chips avanzados a China. La lógica era simple: si China no puede acceder a los chips más potentes (los de Nvidia, AMD, etc.), no podrá competir en la carrera de la IA.

Los chips que Nvidia puede vender a China son versiones "recortadas", menos potentes. Los H800 en lugar de los H100. La idea era que esto frenaría el desarrollo chino de IA durante años.

DeepSeek demostró que esa estrategia tiene un fallo fundamental: asume que la única forma de avanzar en IA es con fuerza bruta (más chips, más potencia, más dinero). Pero resulta que la innovación en arquitectura de modelos y métodos de entrenamiento puede compensar las limitaciones de hardware.

Es como si le prohibieras a alguien comprar un Ferrari y esa persona construyera un coche igual de rápido con piezas de desguace. No solo es impresionante técnicamente, es un mensaje geopolítico brutal.

Las implicaciones:

  • Para EEUU: Las sanciones no están funcionando como esperaban. China está encontrando formas de hacer más con menos.
  • Para los inversores: El modelo de "quien tenga más GPUs gana" se ha cuestionado. Por eso Nvidia se desplomó.
  • Para la industria: El código abierto puede competir con modelos cerrados de miles de millones de dólares.
  • Para el resto del mundo: La IA no será un monopolio americano. Habrá competencia real.

Un año después, Nvidia ha recuperado su valor (y más), pero la conversación ha cambiado para siempre. Ya nadie asume que Silicon Valley tiene la IA ganada.

Los modelos de DeepSeek: V3 y R1

DeepSeek tiene dos modelos principales que necesitas conocer:

DeepSeek-V3: El modelo generalista

Es el modelo base, similar a GPT-4o o Claude Sonnet. Funciona como un LLM (Large Language Model) tradicional: le preguntas algo y te responde. Es rápido, versátil y competente en prácticamente cualquier tarea: escritura, análisis, código, conversación general.

Características técnicas: 671.000 millones de parámetros, arquitectura MoE (Mixture of Experts) que solo activa los parámetros necesarios para cada tarea, y soporte nativo para chino e inglés (también funciona bien en español).

DeepSeek-R1: El modelo de razonamiento

Este es el que reventó el mercado. R1 está diseñado específicamente para tareas que requieren razonamiento complejo: matemáticas avanzadas, programación, problemas lógicos, análisis científico.

La diferencia clave con V3 es que R1 "piensa" antes de responder. Literalmente. Cuando le haces una pregunta compleja, primero genera una "cadena de pensamiento" donde desglosa el problema paso a paso, evalúa diferentes aproximaciones, detecta posibles errores en su propio razonamiento, y solo entonces da la respuesta final.

Este proceso puede tardar varios minutos en tareas complejas, pero el resultado es significativamente más preciso.

Resultados en benchmarks: En MATH-500 (matemáticas) consigue un 97,3% de aciertos frente al 96,4% de GPT-4o. En codificación es competitivo con los mejores modelos del mercado. En razonamiento lógico está a la par con o1 de OpenAI.

R1 es el competidor directo de o1 de OpenAI, el modelo de razonamiento que OpenAI lanzó a finales de 2024. La diferencia es que o1 es cerrado y caro. R1 es abierto y barato.

¿Cuándo usar V3 y cuándo usar R1?

Usa V3 cuando: necesitas respuestas rápidas, la tarea es sencilla o rutinaria, estás teniendo una conversación general, quieres generar contenido creativo, o el tiempo es importante.

Usa R1 cuando: tienes un problema matemático o lógico complejo, necesitas código que resuelva un problema no trivial, quieres que la IA "muestre su trabajo" y puedas verificar el razonamiento, la precisión es más importante que la velocidad, o estás dispuesto a esperar varios minutos por una respuesta mejor.

Comparativa completa: DeepSeek vs la competencia

Esta es la comparativa que me hubiera gustado encontrar cuando empecé a probar DeepSeek:

DeepSeek V3: Precio API de unos 0,14$ por millón de tokens de entrada. Velocidad rápida. Bueno en matemáticas, muy bueno en programación, correcto en escritura creativa, bueno en razonamiento complejo. Conocimiento hasta octubre 2023. Código abierto. Censura de temas sensibles para China. Se puede ejecutar en local.

DeepSeek R1: Precio API de unos 0,55$ por millón de tokens de entrada. Velocidad lenta (piensa antes de responder). Excelente en matemáticas, excelente en programación, correcto en escritura creativa, excelente en razonamiento complejo. Conocimiento hasta octubre 2023. Código abierto. Censura de temas sensibles para China. Se puede ejecutar en local.

ChatGPT (GPT-4o): Precio API de unos 5$ por millón de tokens de entrada. Velocidad rápida. Muy bueno en matemáticas, excelente en programación, muy bueno en escritura creativa, muy bueno en razonamiento complejo. Información actualizada con búsqueda. Código cerrado. Censura occidental. No se puede ejecutar en local.

Claude Sonnet: Precio API de unos 3$ por millón de tokens de entrada. Velocidad rápida. Bueno en matemáticas, muy bueno en programación, excelente en escritura creativa, muy bueno en razonamiento complejo. Información actualizada con búsqueda. Código cerrado. Censura occidental. No se puede ejecutar en local.

Gemini Pro: Precio API de unos 1,25$ por millón de tokens de entrada. Velocidad rápida. Muy bueno en matemáticas, muy bueno en programación, bueno en escritura creativa, muy bueno en razonamiento complejo. Excelente en información actualizada. Código cerrado. Censura occidental. No se puede ejecutar en local.

Mi resumen rápido: El más barato es DeepSeek (con diferencia brutal). El mejor para razonamiento es DeepSeek R1. El mejor para escritura es Claude. El más actualizado es Gemini. El más versátil es ChatGPT. El más transparente es DeepSeek (código abierto).

Tutorial: Cómo usar DeepSeek paso a paso

Opción 1: Web oficial (la más fácil)

Paso 1: Ve a chat.deepseek.com

Paso 2: Haz clic en "Log in" y crea una cuenta. Puedes usar Google, email o número de teléfono.

Paso 3: Una vez dentro, verás una interfaz similar a ChatGPT. El campo de texto está abajo, el historial de conversaciones a la izquierda.

Paso 4: Antes de escribir, fíjate en los botones junto al campo de texto. El clip es para adjuntar archivos (PDFs, imágenes, documentos). El botón "DeepThink" activa el modelo R1 para razonamiento profundo, y cuando está activado verás cómo "piensa" antes de responder. El botón "Search" permite a DeepSeek buscar en internet, útil para información actualizada.

Paso 5: Escribe tu pregunta y pulsa Enter. Si activaste DeepThink, primero verás el proceso de razonamiento (en un bloque desplegable) y luego la respuesta final.

Consejos de la interfaz: Puedes hacer clic en el razonamiento de R1 para expandirlo y ver exactamente cómo llegó a la conclusión. El botón de "regenerar" te da una respuesta alternativa. Puedes calificar las respuestas con los iconos de pulgar para ayudar a mejorar el modelo. El historial se guarda automáticamente.

Opción 2: App móvil

La app está disponible en iOS (App Store) y Android (Google Play). Busca "DeepSeek" y descarga la oficial.

La interfaz es prácticamente idéntica a la web, adaptada a móvil. Tiene las mismas opciones: DeepThink, Search, adjuntar archivos.

Un dato curioso: en enero de 2025, la app de DeepSeek superó a ChatGPT como la más descargada en la App Store de Estados Unidos. Fue un momento simbólico importante.

Opción 3: API para desarrolladores

Si quieres integrar DeepSeek en tus aplicaciones, ve a platform.deepseek.com y crea una cuenta. Genera una API key en el dashboard. La API es compatible con el formato de OpenAI, así que si ya usas la API de OpenAI, migrar es trivial: solo cambias el endpoint y la key.

Precios actuales de la API: DeepSeek-V3 cuesta 0,14$ por millón de tokens de entrada y 0,28$ por millón de tokens de salida. DeepSeek-R1 cuesta 0,55$ por millón de tokens de entrada y 2,19$ por millón de tokens de salida. El caché de entrada tiene descuento adicional.

Cómo ejecutar DeepSeek en local

Esta opción es para los más técnicos, pero merece la pena si tienes el hardware.

¿Por qué ejecutarlo en local? Privacidad total (tus datos no salen de tu máquina), sin límites de uso, sin costes recurrentes (solo electricidad), y puedes modificar el modelo.

Requisitos mínimos para las versiones destiladas:

  • Modelo de 1.5B parámetros: Necesitas 4GB de VRAM y 8GB de RAM del sistema. Es el más ligero.
  • Modelo de 7B parámetros: Necesitas 8GB de VRAM y 16GB de RAM del sistema. Buen equilibrio.
  • Modelo de 14B parámetros: Necesitas 16GB de VRAM y 32GB de RAM del sistema. Mejor rendimiento.
  • Modelo de 32B parámetros: Necesitas 24GB o más de VRAM y 64GB de RAM del sistema. Ya es exigente.
  • Modelo R1 completo (671B parámetros): Necesitas múltiples GPUs A100/H100 y más de 256GB de RAM. Solo para empresas o investigadores.

Para la mayoría de usuarios, los modelos destilados de 7B o 14B son el sweet spot entre rendimiento y requisitos.

Instalación rápida con Ollama: Ollama es la forma más fácil. Instalas Ollama desde su web oficial, y luego ejecutas "ollama run deepseek-r1:7b" para el modelo de 7B, o "ollama run deepseek-r1:14b" para el de 14B si tienes más VRAM. Una vez ejecutado, puedes chatear directamente en la terminal o conectar aplicaciones como Open WebUI para tener una interfaz gráfica.

Ejemplos prácticos: qué pedirle a DeepSeek

Vamos a ver casos reales de uso con prompts concretos.

Ejemplo 1: Problema matemático complejo (R1)

Prompt: "Un tren sale de Madrid a las 8:00 hacia Barcelona a 120 km/h. Otro tren sale de Barcelona a las 8:30 hacia Madrid a 150 km/h. La distancia entre ambas ciudades es 620 km. ¿A qué hora y a qué distancia de Madrid se cruzarán?"

Lo que hace R1: Primero verás un bloque de "pensamiento" donde desglosa el problema, plantea ecuaciones, considera las diferentes velocidades y el desfase de 30 minutos, calcula paso a paso, y verifica su respuesta. Luego te da el resultado final. Este tipo de problema es donde R1 brilla. V3 o ChatGPT pueden fallar en los cálculos intermedios.

Ejemplo 2: Debugging de código (R1)

Prompt: "Este código Python debería ordenar una lista de diccionarios por múltiples campos, pero no funciona correctamente. Encuentra el error y explícame por qué falla:" y pegas tu código.

Lo que hace R1: Analiza el código línea por línea, identifica el error, explica por qué ocurre, y te da la versión corregida con explicación.

Ejemplo 3: Análisis de documento (V3)

Prompt: Adjuntas un PDF y escribes "Resume este documento en 5 puntos clave. Luego dame 3 preguntas que debería hacerme después de leerlo."

Lo que hace V3: Procesa el documento rápidamente y te da un resumen estructurado. Para esto no necesitas R1, V3 es suficiente y más rápido.

Ejemplo 4: Aprender un concepto técnico (R1)

Prompt: "Explícame qué es una red neuronal convolucional como si fuera un estudiante de primero de informática. Usa analogías simples y luego ve aumentando la complejidad."

Lo que hace R1: Construye una explicación progresiva, verificando internamente que cada paso es correcto antes de avanzar al siguiente.

Ejemplo 5: Generación de código desde cero (R1)

Prompt: "Necesito un script en Python que lea un CSV con columnas fecha, producto y ventas, agrupe las ventas por mes, genere un gráfico de barras con la evolución mensual, y guarde el gráfico como PNG. Usa pandas y matplotlib. Incluye manejo de errores."

Lo que hace R1: Planifica la estructura del código, considera casos edge, implementa el manejo de errores, y te da código funcional y bien comentado.

Casos de uso por perfil profesional

Para programadores y desarrolladores

Dónde brilla DeepSeek: Debugging de código complejo, diseño de arquitecturas de software, optimización de algoritmos, explicación de código legacy, generación de tests.

Mi recomendación: Usa R1 para problemas que requieren "pensar" (arquitectura, algoritmos complejos, bugs difíciles). Usa V3 para tareas rutinarias (generar boilerplate, formatear código, documentación simple).

Tip: La API de DeepSeek es tan barata que puedes integrarla en tu IDE sin preocuparte por el coste. Hay extensiones para VS Code y otros editores.

Para estudiantes e investigadores

Dónde brilla DeepSeek: Resolver problemas matemáticos paso a paso, explicar conceptos complejos, ayudar con demostraciones y pruebas, análisis de papers científicos, preparar exámenes.

Mi recomendación: R1 es tu mejor amigo para matemáticas y física. El hecho de que muestre el razonamiento te ayuda a aprender, no solo a obtener la respuesta.

Tip: Pídele que te explique su razonamiento como si fuera un tutor. "Explícame paso a paso cómo llegaste a eso y por qué cada paso es correcto."

Para marketers y creadores de contenido

Dónde DeepSeek es correcto pero no excelente: Generación de copy, ideas para contenido, análisis de datos de campañas.

Mi recomendación honesta: Para escritura creativa y marketing, sigo prefiriendo Claude. DeepSeek tiende a ser más "seco" y menos creativo. Pero si tu presupuesto es limitado, DeepSeek V3 es una alternativa decente para tareas básicas.

Donde sí uso DeepSeek para marketing: Análisis de datos de campañas (R1 es muy bueno con números), estructurar estrategias complejas, automatizaciones vía API (por el precio).

Para empresas y equipos

Ventajas de DeepSeek para empresas: Código abierto (puedes auditar qué hace con tus datos), ejecución local (tus datos nunca salen de tu infraestructura), coste (puedes escalar sin arruinarte), sin lock-in (no dependes de un proveedor).

Consideraciones: La censura china puede ser un problema dependiendo de tu industria. El soporte es limitado comparado con OpenAI o Anthropic. Para producción crítica, querrás tener fallbacks a otros modelos.

El elefante en la habitación: la censura china

No puedo escribir sobre DeepSeek sin hablar de esto en profundidad.

DeepSeek está sujeto a las regulaciones del gobierno chino. Esto significa que hay temas que no toca o donde da respuestas claramente sesgadas. Tiananmen lo evade o niega. Taiwán lo trata como parte de China. Tíbet y Xinjiang tienen respuestas alineadas con la narrativa oficial china. Las figuras políticas chinas no las critica. Las comparaciones China-Occidente tienen sesgo pro-China.

¿Es esto un problema? Depende completamente de para qué lo uses.

No te afecta si: Lo usas para programación, para matemáticas y ciencia, para análisis de datos, para tareas técnicas en general, o tu contenido no tiene nada que ver con política china.

Te afecta si: Escribes sobre geopolítica, investigas temas de derechos humanos, necesitas información objetiva sobre China, o tu audiencia es sensible a estos temas.

Mi postura: Todas las IAs tienen sesgos. ChatGPT tiene sesgos occidentales/americanos. Claude tiene sus propias restricciones. Ningún modelo es completamente neutral. La diferencia es que el sesgo de DeepSeek es más obvio y está impuesto por un gobierno, no por una empresa. Esto lo hace más problemático para algunos usos, pero no invalida la herramienta para tareas técnicas. Lo importante es conocer las limitaciones y usar la herramienta donde tiene sentido.

Actualizaciones recientes: DeepSeek R1-0528

En mayo de 2025, DeepSeek lanzó una actualización importante de R1 llamada R1-0528. Las mejoras principales:

Mejor rendimiento en benchmarks: Ahora está en el top 4 de LiveCodeBench para codificación, superando a modelos como o4 Mini y Grok-3-mini.

Menos alucinaciones: Han trabajado en reducir las respuestas incorrectas con datos factuales.

Soporte para JSON y llamadas a funciones: Importante para desarrolladores que integran la API.

Razonamiento más profundo: Puede "pensar" hasta 30-60 minutos en tareas muy complejas.

Mejor rendimiento en tareas front-end: Interacciones más fluidas en el chat.

La API sigue siendo compatible con versiones anteriores, así que si ya usabas R1, la actualización es automática.

Imagen insertada

Preguntas frecuentes (FAQ)

¿DeepSeek es realmente gratis?

Sí, el chat web y la app móvil son completamente gratuitos sin límites aparentes. La API tiene costes, pero son muy bajos comparados con la competencia.

¿Es seguro usar DeepSeek? ¿Qué pasa con mis datos?

Esta es la pregunta del millón. DeepSeek es una empresa china, lo que significa que está sujeta a las leyes chinas sobre datos. Si la privacidad es crítica para ti, tienes dos opciones: ejecutar el modelo en local (tus datos nunca salen de tu máquina) o usar otro proveedor para datos sensibles. Para tareas no sensibles (aprender, programar proyectos personales, etc.), el riesgo es bajo.

¿DeepSeek habla español?

Sí, funciona bien en español aunque fue entrenado principalmente en chino e inglés. No es perfecto, pero es más que suficiente para la mayoría de usos.

¿Puedo usar DeepSeek para mi empresa?

Sí, la licencia MIT permite uso comercial sin restricciones. Puedes usar la API, ejecutarlo en local, o incluso modificar el modelo.

¿Cuál es mejor, V3 o R1?

Depende de la tarea. V3 es más rápido y suficiente para tareas generales. R1 es mejor para problemas que requieren razonamiento profundo (matemáticas, código complejo, análisis lógico), pero es más lento.

¿DeepSeek reemplaza a ChatGPT?

No lo veo como un reemplazo, sino como una alternativa que es mejor en algunos casos. Para razonamiento complejo y presupuestos ajustados, DeepSeek gana. Para escritura creativa y versatilidad general, ChatGPT o Claude siguen siendo mejores opciones.

¿Por qué DeepSeek es tan barato?

Varias razones: arquitectura MoE más eficiente, métodos de entrenamiento innovadores (RL), costes laborales más bajos en China, estrategia de mercado agresiva para ganar usuarios, y chips más baratos (los que EEUU permite exportar).

¿Puedo fiarme de las respuestas de DeepSeek?

Como con cualquier IA, debes verificar la información importante. DeepSeek R1-0528 ha mejorado en reducir alucinaciones, pero no es infalible. Para tareas críticas, siempre verifica.

Mi opinión personal

DeepSeek me parece fascinante por lo que representa: que la innovación puede venir de donde menos te lo esperas, que el dinero no lo es todo, y que el código abierto sigue siendo una fuerza poderosa en tecnología.

¿Es perfecto? No. La censura es un problema real para ciertos usos, la velocidad de R1 puede ser frustrante, y para muchas tareas del día a día sigo prefiriendo Claude o ChatGPT.

Pero para programación compleja, problemas matemáticos, o cualquier tarea que requiera razonamiento profundo, DeepSeek R1 se ha ganado un lugar en mi flujo de trabajo. Y el hecho de que sea gratuito y de código abierto lo hace aún más atractivo.

Si trabajas con IA de forma seria, no puedes ignorar DeepSeek. Aunque solo sea para entender hacia dónde va la industria.

La guerra de la IA entre EEUU y China acaba de empezar. Y DeepSeek ha demostrado que va a ser mucho más reñida de lo que Silicon Valley esperaba.


¿Quieres ver más herramientas de IA analizadas? Tengo una guía completa de las mejores IAs gratis en español donde comparo todas las opciones disponibles.

Y si te interesa aprender a sacar el máximo partido a cualquier IA, empieza por entender qué es un prompt y cómo escribir buenos prompts.


Newsletter Semanal

Inteligencia Artificial aplicada a negocio

Sin humo. Solo experimentos reales, prompts que funcionan y estrategias de escalabilidad.