Migración de la API de DeepSeek a deepseek-v4-flash / deepseek-v4-pro: cómo elegir entre los formatos compatibles con OpenAI y Anthropic
14 de junio de 2026 · 12 min de lectura · Claude / GPT / Gemini / DeepSeek

2026-06-14 Al mirar la API de DeepSeek, lo primero que conviene cambiar no es el prompt, sino el nombre del modelo. La página de precios en chino de DeepSeek lo dice de forma muy directa: deepseek-chat y deepseek-reasoner se retirarán el 2026/07/24 a las 23:59, hora de Pekín; durante el periodo de compatibilidad, el primero corresponde al modo sin razonamiento de deepseek-v4-flash, y el segundo al modo con razonamiento de deepseek-v4-flash (página de precios de DeepSeek). Si tu código de producción aún usa los nombres antiguos, no esperes hasta la última semana.

Primero elige el formato de la interfaz: mira tu ecosistema, no tus creencias
DeepSeek ofrece ahora dos entradas compatibles: formato OpenAI https://api.deepseek.com y formato Anthropic https://api.deepseek.com/anthropic (primera llamada a la API de DeepSeek).
Mi recomendación es sencilla:
| Tu situación actual | Cuál elegir | Motivo |
|---|---|---|
| Ya usas OpenAI SDK, LangChain, LlamaIndex o Chat Completions de Vercel AI SDK | Formato OpenAI | Solo cambias base_url y model |
| Ya usas Anthropic SDK, Claude Code o la estructura de Messages API | Formato Anthropic | Se mantienen los hábitos de system, messages.create y max_tokens |
| Tienes tu propio wrapper HTTP | Prioriza el formato OpenAI | Hay más material de depuración y los campos son más generales |
| Quieres reutilizar la cadena de herramientas de Claude | Formato Anthropic | DeepSeek indica explícitamente que es compatible con el ecosistema de la API de Anthropic (API Anthropic de DeepSeek) |
Una trampa: en el formato Anthropic, DeepSeek realiza mapeo de nombres de modelos. La documentación oficial indica que los nombres que empiezan por claude-opus se mapearán a deepseek-v4-pro, y los que empiezan por claude-haiku o claude-sonnet se mapearán a deepseek-v4-flash. Aun así, recomiendo escribir explícitamente deepseek-v4-pro o deepseek-v4-flash; no dejes el comportamiento de producción en manos de un mapeo implícito.
Sustitución de nombres de modelo: deja de depender de alias de compatibilidad
La tabla de migración tiene solo dos filas:
| Nombre de modelo antiguo | Ahora compatible con | Forma recomendada |
|---|---|---|
deepseek-chat |
Modo sin razonamiento de deepseek-v4-flash |
deepseek-v4-flash + desactivar thinking |
deepseek-reasoner |
Modo con razonamiento de deepseek-v4-flash |
deepseek-v4-flash o deepseek-v4-pro + activar thinking |
Si antes usabas deepseek-reasoner para revisión de código, SQL complejo o razonamiento sobre textos largos, puedes aprovechar para evaluar deepseek-v4-pro. Si solo es atención al cliente, resúmenes o clasificación, deepseek-v4-flash se parece más a la opción por defecto.

Formato OpenAI: versión con cambios mínimos
El formato OpenAI de DeepSeek sigue usando Chat Completions. La interfaz oficial de OpenAI también tiene el estilo de lista de mensajes de POST /v1/chat/completions (referencia de la API de OpenAI), así que en la mayoría de los SDK solo hay que cambiar dos cosas.
# pip install openai
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ["DEEPSEEK_API_KEY"],
base_url="https://api.deepseek.com",
)
resp = client.chat.completions.create(
model="deepseek-v4-flash",
messages=[
{"role": "system", "content": "你是一个严谨的代码审查助手。"},
{"role": "user", "content": "检查这段 Python 代码的潜在 bug。"},
],
extra_body={"thinking": {"type": "disabled"}},
stream=False,
)
print(resp.choices[0].message.content)
Para activar el modo de razonamiento, cambia el último fragmento por:
reasoning_effort="high",
extra_body={"thinking": {"type": "enabled"}}
El modo de razonamiento de DeepSeek viene activado por defecto; en el SDK de OpenAI, thinking debe colocarse dentro de extra_body; la intensidad de razonamiento admite high y max (modo de razonamiento de DeepSeek). Si tu cadena de llamadas a herramientas reenvía mensajes del assistant, recuerda una regla estricta: en las rondas de modo de razonamiento que involucren tool calls, las solicitudes posteriores deben reenviar completo reasoning_content; de lo contrario, recibirás un 400.
Formato Anthropic: deja una puerta trasera para la cadena de herramientas de Claude
Si ya has escrito prompts de sistema, max_tokens y client.messages.create() alrededor de Anthropic Messages API, basta con cambiar la Base URL:
# pip install anthropic
import os
import anthropic
client = anthropic.Anthropic(
api_key=os.environ["DEEPSEEK_API_KEY"],
base_url="https://api.deepseek.com/anthropic",
)
msg = client.messages.create(
model="deepseek-v4-pro",
max_tokens=1000,
system="你是一个资深后端工程师。",
messages=[{"role": "user", "content": "给我一个 Redis 缓存穿透的修复方案。"}],
thinking={"type": "enabled"},
output_config={"effort": "high"},
)
print(msg.content)
La Messages API oficial de Anthropic también usa esta estructura de messages.create, y sus campos principales incluyen model, max_tokens, system y messages (Anthropic Messages API). Por tanto, la verdadera razón para elegir el formato Anthropic no es que sea “más avanzado”, sino que reduce los cambios en el código del ecosistema Claude.
Estimación de costes: calcula primero como si no hubiera aciertos de caché
La página de precios en chino de DeepSeek cobra por millón de tokens: para deepseek-v4-flash, entrada con acierto de caché 0,02 yuanes, entrada sin acierto 1 yuan y salida 2 yuanes; para deepseek-v4-pro, entrada con acierto de caché 0,025 yuanes, entrada sin acierto 3 yuanes y salida 6 yuanes (página de precios de DeepSeek).
Un cálculo aproximado: 200M de entrada y 50M de salida al mes, suponiendo primero que todo es caché no acertada.
| Modelo | Coste de entrada | Coste de salida | Total |
|---|---|---|---|
deepseek-v4-flash |
200 yuanes | 100 yuanes | 300 yuanes |
deepseek-v4-pro |
600 yuanes | 300 yuanes | 900 yuanes |
La factura real se verá afectada por la tasa de acierto de caché. Al hacer RAG, agentes o prompts de sistema largos, coloca los prefijos estables al principio; cuando suba la tasa de acierto, el coste de entrada bajará de forma notable. No hagas el presupuesto del primer día de migración con las cifras de caché más optimistas.
Usuarios de interfaces intermediarias: si quieres simplificar, puedes usar onehop
Si tu objetivo no es conectarte solo a DeepSeek, sino cambiar entre Claude, GPT y Gemini con el mismo código, onehop es una ruta que ahorra tiempo: compatible con OpenAI/Anthropic, Base URL cambiada a https://api.onehop.ai/v1, las cuentas nuevas reciben $10, precio inferior al oficial y sin necesidad de vincular tarjeta.
Ejemplo con OpenAI SDK:
from openai import OpenAI
import os
client = OpenAI(
api_key=os.environ["ONEHOP_API_KEY"],
base_url="https://api.onehop.ai/v1",
)
resp = client.chat.completions.create(
model="claude-sonnet-4-5",
messages=[{"role": "user", "content": "用三点解释这个 API 迁移计划。"}],
)
print(resp.choices[0].message.content)
El SDK de Anthropic también puede apuntar a la misma Base URL:
import anthropic, os
client = anthropic.Anthropic(
api_key=os.environ["ONEHOP_API_KEY"],
base_url="https://api.onehop.ai/v1",
)
Yo planificaría la migración de producción así: hoy sustituir los nombres de modelos antiguos; esta semana ejecutar los smoke tests de las rutas OpenAI y Anthropic; antes de fin de mes completar la lógica de reenvío del modo de razonamiento y tool calls; antes de mediados de julio eliminar todos los deepseek-chat y deepseek-reasoner. Si quieres mantener menos configuraciones de proveedores, puedes probar directamente: llamar a Claude y otros modelos en onehop, o primero reclamar crédito para validar la cadena: regístrate y recibe $10 de crédito de prueba.
Lecturas relacionadas

Usa Groq GPT-OSS 120B con el SDK de OpenAI: URL base, precios y caché
Cambia una URL base del SDK de OpenAI para ejecutar GPT-OSS 120B en Groq, estimar costes con caché y evitar sorpresas.
17 de junio de 2026 · 27 min de lectura

Usar el SDK de OpenAI para llamar a la API de Gemini: tutorial de migración cambiando solo base_url, API Key y el nombre del modelo
Checklist para migrar proyectos con OpenAI SDK a la interfaz compatible de Gemini, con código, mapeo de parámetros y precios.
14 de junio de 2026 · 9 min de lectura

Usar el SDK de OpenAI para llamar a la API de Gemini: tutorial de integración cambiando solo base_url, la clave y el nombre del modelo
Integra Gemini en tu código existente con el SDK de OpenAI cambiando solo tres configuraciones.
14 de junio de 2026 · 9 min de lectura