Migración de la API de DeepSeek a deepseek-v4-flash / deepseek-v4-pro: cómo elegir entre los formatos compatibles con OpenAI y Anthropic

2026-06-14 Al mirar la API de DeepSeek, lo primero que conviene cambiar no es el prompt, sino el nombre del modelo. La página de precios en chino de DeepSeek lo dice de forma muy directa: deepseek-chat y deepseek-reasoner se retirarán el 2026/07/24 a las 23:59, hora de Pekín; durante el periodo de compatibilidad, el primero corresponde al modo sin razonamiento de deepseek-v4-flash, y el segundo al modo con razonamiento de deepseek-v4-flash (página de precios de DeepSeek). Si tu código de producción aún usa los nombres antiguos, no esperes hasta la última semana.

Gráfico de línea temporal sobre fondo beige claro: a la izquierda se marca el punto de revisión actual 2026-06-14, a la derecha el punto de retirada 2026-07-24 23:59 hora de Pekín, unidos por una flecha color terracota; los nombres de modelos antiguos se desvanecen en gris y los nuevos aparecen resaltados en gris carbón

Primero elige el formato de la interfaz: mira tu ecosistema, no tus creencias

DeepSeek ofrece ahora dos entradas compatibles: formato OpenAI https://api.deepseek.com y formato Anthropic https://api.deepseek.com/anthropic (primera llamada a la API de DeepSeek).

Mi recomendación es sencilla:

Tu situación actual	Cuál elegir	Motivo
Ya usas OpenAI SDK, LangChain, LlamaIndex o Chat Completions de Vercel AI SDK	Formato OpenAI	Solo cambias `base_url` y `model`
Ya usas Anthropic SDK, Claude Code o la estructura de Messages API	Formato Anthropic	Se mantienen los hábitos de `system`, `messages.create` y `max_tokens`
Tienes tu propio wrapper HTTP	Prioriza el formato OpenAI	Hay más material de depuración y los campos son más generales
Quieres reutilizar la cadena de herramientas de Claude	Formato Anthropic	DeepSeek indica explícitamente que es compatible con el ecosistema de la API de Anthropic (API Anthropic de DeepSeek)

Una trampa: en el formato Anthropic, DeepSeek realiza mapeo de nombres de modelos. La documentación oficial indica que los nombres que empiezan por claude-opus se mapearán a deepseek-v4-pro, y los que empiezan por claude-haiku o claude-sonnet se mapearán a deepseek-v4-flash. Aun así, recomiendo escribir explícitamente deepseek-v4-pro o deepseek-v4-flash; no dejes el comportamiento de producción en manos de un mapeo implícito.

Sustitución de nombres de modelo: deja de depender de alias de compatibilidad

La tabla de migración tiene solo dos filas:

Nombre de modelo antiguo	Ahora compatible con	Forma recomendada
`deepseek-chat`	Modo sin razonamiento de `deepseek-v4-flash`	`deepseek-v4-flash` + desactivar thinking
`deepseek-reasoner`	Modo con razonamiento de `deepseek-v4-flash`	`deepseek-v4-flash` o `deepseek-v4-pro` + activar thinking

Si antes usabas deepseek-reasoner para revisión de código, SQL complejo o razonamiento sobre textos largos, puedes aprovechar para evaluar deepseek-v4-pro. Si solo es atención al cliente, resúmenes o clasificación, deepseek-v4-flash se parece más a la opción por defecto.

Diagrama de migración de la familia de modelos: a la izquierda dos tarjetas de modelos antiguos, deepseek-chat y deepseek-reasoner; a la derecha dos tarjetas de modelos nuevos, deepseek-v4-flash y deepseek-v4-pro; distintos tipos de línea indican modo sin razonamiento y con razonamiento, con terracota destacando la recomendación

Formato OpenAI: versión con cambios mínimos

El formato OpenAI de DeepSeek sigue usando Chat Completions. La interfaz oficial de OpenAI también tiene el estilo de lista de mensajes de POST /v1/chat/completions (referencia de la API de OpenAI), así que en la mayoría de los SDK solo hay que cambiar dos cosas.

# pip install openai
import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com",
)

resp = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=[
        {"role": "system", "content": "你是一个严谨的代码审查助手。"},
        {"role": "user", "content": "检查这段 Python 代码的潜在 bug。"},
    ],
    extra_body={"thinking": {"type": "disabled"}},
    stream=False,
)

print(resp.choices[0].message.content)

Para activar el modo de razonamiento, cambia el último fragmento por:

reasoning_effort="high",
extra_body={"thinking": {"type": "enabled"}}

El modo de razonamiento de DeepSeek viene activado por defecto; en el SDK de OpenAI, thinking debe colocarse dentro de extra_body; la intensidad de razonamiento admite high y max (modo de razonamiento de DeepSeek). Si tu cadena de llamadas a herramientas reenvía mensajes del assistant, recuerda una regla estricta: en las rondas de modo de razonamiento que involucren tool calls, las solicitudes posteriores deben reenviar completo reasoning_content; de lo contrario, recibirás un 400.

Formato Anthropic: deja una puerta trasera para la cadena de herramientas de Claude

Si ya has escrito prompts de sistema, max_tokens y client.messages.create() alrededor de Anthropic Messages API, basta con cambiar la Base URL:

# pip install anthropic
import os
import anthropic

client = anthropic.Anthropic(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com/anthropic",
)

msg = client.messages.create(
    model="deepseek-v4-pro",
    max_tokens=1000,
    system="你是一个资深后端工程师。",
    messages=[{"role": "user", "content": "给我一个 Redis 缓存穿透的修复方案。"}],
    thinking={"type": "enabled"},
    output_config={"effort": "high"},
)

print(msg.content)

La Messages API oficial de Anthropic también usa esta estructura de messages.create, y sus campos principales incluyen model, max_tokens, system y messages (Anthropic Messages API). Por tanto, la verdadera razón para elegir el formato Anthropic no es que sea “más avanzado”, sino que reduce los cambios en el código del ecosistema Claude.

Estimación de costes: calcula primero como si no hubiera aciertos de caché

La página de precios en chino de DeepSeek cobra por millón de tokens: para deepseek-v4-flash, entrada con acierto de caché 0,02 yuanes, entrada sin acierto 1 yuan y salida 2 yuanes; para deepseek-v4-pro, entrada con acierto de caché 0,025 yuanes, entrada sin acierto 3 yuanes y salida 6 yuanes (página de precios de DeepSeek).

Un cálculo aproximado: 200M de entrada y 50M de salida al mes, suponiendo primero que todo es caché no acertada.

Modelo	Coste de entrada	Coste de salida	Total
`deepseek-v4-flash`	200 yuanes	100 yuanes	300 yuanes
`deepseek-v4-pro`	600 yuanes	300 yuanes	900 yuanes

La factura real se verá afectada por la tasa de acierto de caché. Al hacer RAG, agentes o prompts de sistema largos, coloca los prefijos estables al principio; cuando suba la tasa de acierto, el coste de entrada bajará de forma notable. No hagas el presupuesto del primer día de migración con las cifras de caché más optimistas.

Usuarios de interfaces intermediarias: si quieres simplificar, puedes usar onehop

Si tu objetivo no es conectarte solo a DeepSeek, sino cambiar entre Claude, GPT y Gemini con el mismo código, onehop es una ruta que ahorra tiempo: compatible con OpenAI/Anthropic, Base URL cambiada a https://api.onehop.ai/v1, las cuentas nuevas reciben $10, precio inferior al oficial y sin necesidad de vincular tarjeta.

Ejemplo con OpenAI SDK:

from openai import OpenAI
import os

client = OpenAI(
    api_key=os.environ["ONEHOP_API_KEY"],
    base_url="https://api.onehop.ai/v1",
)

resp = client.chat.completions.create(
    model="claude-sonnet-4-5",
    messages=[{"role": "user", "content": "用三点解释这个 API 迁移计划。"}],
)
print(resp.choices[0].message.content)

El SDK de Anthropic también puede apuntar a la misma Base URL:

import anthropic, os

client = anthropic.Anthropic(
    api_key=os.environ["ONEHOP_API_KEY"],
    base_url="https://api.onehop.ai/v1",
)

Yo planificaría la migración de producción así: hoy sustituir los nombres de modelos antiguos; esta semana ejecutar los smoke tests de las rutas OpenAI y Anthropic; antes de fin de mes completar la lógica de reenvío del modo de razonamiento y tool calls; antes de mediados de julio eliminar todos los deepseek-chat y deepseek-reasoner. Si quieres mantener menos configuraciones de proveedores, puedes probar directamente: llamar a Claude y otros modelos en onehop, o primero reclamar crédito para validar la cadena: regístrate y recibe $10 de crédito de prueba.

Migración de la API de DeepSeek a deepseek-v4-flash / deepseek-v4-pro: cómo elegir entre los formatos compatibles con OpenAI y Anthropic

Primero elige el formato de la interfaz: mira tu ecosistema, no tus creencias

Sustitución de nombres de modelo: deja de depender de alias de compatibilidad

Formato OpenAI: versión con cambios mínimos

Formato Anthropic: deja una puerta trasera para la cadena de herramientas de Claude

Estimación de costes: calcula primero como si no hubiera aciertos de caché

Usuarios de interfaces intermediarias: si quieres simplificar, puedes usar onehop

Lecturas relacionadas

Llama a Qwen3.7 Plus con el SDK de OpenAI mediante el modo compatible de DashScope

Usa Groq GPT-OSS 120B con el SDK de OpenAI: URL base, precios y caché

Usar el SDK de OpenAI para llamar a la API de Gemini: tutorial de migración cambiando solo base_url, API Key y el nombre del modelo