DeepSeek API 迁移到 deepseek-v4-flash / deepseek-v4-pro：OpenAI 与 Anthropic 两种兼容格式怎么选

2026-06-14 看 DeepSeek API，最该先改的不是 prompt，而是模型名。DeepSeek 中文价格页写得很直：deepseek-chat 和 deepseek-reasoner 将于北京时间 2026/07/24 23:59 弃用；兼容期内，前者对应 deepseek-v4-flash 的非思考模式，后者对应 deepseek-v4-flash 的思考模式（DeepSeek 价格页）。如果你的生产代码还在写旧名字，别等到最后一周。

米白背景的时间轴图，左侧标注 2026-06-14 当前检查点，右侧标注 2026-07-24 23:59 北京时间弃用点，中间用赤陶色箭头连接，旧模型名灰色淡出，新模型名炭灰高亮

先选接口格式：看你的生态，不看信仰

DeepSeek 现在同时给两套兼容入口：OpenAI 格式 https://api.deepseek.com，Anthropic 格式 https://api.deepseek.com/anthropic（DeepSeek 首次调用 API）。

我的建议很简单：

你的现状	选哪个	原因
已用 OpenAI SDK、LangChain、LlamaIndex、Vercel AI SDK 的 Chat Completions	OpenAI 格式	改 `base_url` 和 `model` 最少
已用 Anthropic SDK、Claude Code、Messages API 结构	Anthropic 格式	`system`、`messages.create`、`max_tokens` 习惯不变
自己写 HTTP wrapper	OpenAI 格式优先	调试资料更多，字段更通用
要复用 Claude 工具链	Anthropic 格式	DeepSeek 明确支持 Anthropic API 生态（DeepSeek Anthropic API）

一个坑：Anthropic 格式下，DeepSeek 会做模型名映射。官方文档写明，claude-opus 开头会映射到 deepseek-v4-pro，claude-haiku 或 claude-sonnet 开头会映射到 deepseek-v4-flash。我仍建议显式写 deepseek-v4-pro 或 deepseek-v4-flash，别把生产行为交给隐式映射。

模型名替换：别再依赖兼容别名

迁移表只有两行：

旧模型名	现在兼容到	建议写法
`deepseek-chat`	`deepseek-v4-flash` 非思考模式	`deepseek-v4-flash` + 关闭 thinking
`deepseek-reasoner`	`deepseek-v4-flash` 思考模式	`deepseek-v4-flash` 或 `deepseek-v4-pro` + 开启 thinking

如果你原来把 deepseek-reasoner 用在代码审查、复杂 SQL、长文推理，可以顺手评估 deepseek-v4-pro。如果只是客服、摘要、分类，deepseek-v4-flash 更像默认选择。

模型家族迁移图，左侧两张旧模型卡片 deepseek-chat 与 deepseek-reasoner，右侧两张新模型卡片 deepseek-v4-flash 与 deepseek-v4-pro，用不同线型表示非思考和思考模式，赤陶色突出推

OpenAI 格式：最小改动版本

DeepSeek 的 OpenAI 格式仍走 Chat Completions。OpenAI 官方接口本身也是 POST /v1/chat/completions 的消息列表风格（OpenAI API Reference），所以大部分 SDK 只改两处。

# pip install openai
import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com",
)

resp = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=[
        {"role": "system", "content": "你是一个严谨的代码审查助手。"},
        {"role": "user", "content": "检查这段 Python 代码的潜在 bug。"},
    ],
    extra_body={"thinking": {"type": "disabled"}},
    stream=False,
)

print(resp.choices[0].message.content)

要打开思考模式，把最后一段改成：

reasoning_effort="high",
extra_body={"thinking": {"type": "enabled"}}

DeepSeek 的思考模式默认开启，OpenAI SDK 里 thinking 要放进 extra_body；思考强度支持 high 和 max（DeepSeek 思考模式）。如果你的工具调用链会把 assistant 消息回传，记住一条硬规则：涉及 tool call 的思考模式轮次，后续请求必须完整回传 reasoning_content，否则会 400。

Anthropic 格式：给 Claude 工具链留后门

如果你已经围绕 Anthropic Messages API 写了系统提示、max_tokens、client.messages.create()，直接换 Base URL：

# pip install anthropic
import os
import anthropic

client = anthropic.Anthropic(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com/anthropic",
)

msg = client.messages.create(
    model="deepseek-v4-pro",
    max_tokens=1000,
    system="你是一个资深后端工程师。",
    messages=[{"role": "user", "content": "给我一个 Redis 缓存穿透的修复方案。"}],
    thinking={"type": "enabled"},
    output_config={"effort": "high"},
)

print(msg.content)

Anthropic 官方 Messages API 也是 messages.create 这一套结构，核心字段包括 model、max_tokens、system、messages（Anthropic Messages API）。所以选择 Anthropic 格式的真正理由不是“更高级”，而是少改 Claude 生态代码。

成本估算：先按缓存未命中算

DeepSeek 中文价格页按百万 tokens 计费：deepseek-v4-flash 输入缓存命中 0.02 元、输入未命中 1 元、输出 2 元；deepseek-v4-pro 输入缓存命中 0.025 元、输入未命中 3 元、输出 6 元（DeepSeek 价格页）。

一个粗算：每月 200M 输入、50M 输出，先按全量未命中算。

模型	输入成本	输出成本	合计
`deepseek-v4-flash`	200 元	100 元	300 元
`deepseek-v4-pro`	600 元	300 元	900 元

真实账单会受缓存命中影响。做 RAG、Agent、长系统提示时，把稳定前缀放前面，命中率上来后，输入成本会明显下降。别在迁移第一天就用最乐观缓存数字做预算。

中转接口用户：省事可以走 onehop

如果你的目标不是只接 DeepSeek，而是同一套代码里切 Claude、GPT、Gemini，onehop 是省时间的路径：OpenAI/Anthropic 兼容，Base URL 改成 https://api.onehop.ai/v1，新账号送 $10，价格低于官方，无需绑卡。

OpenAI SDK 示例：

from openai import OpenAI
import os

client = OpenAI(
    api_key=os.environ["ONEHOP_API_KEY"],
    base_url="https://api.onehop.ai/v1",
)

resp = client.chat.completions.create(
    model="claude-sonnet-4-5",
    messages=[{"role": "user", "content": "用三点解释这个 API 迁移计划。"}],
)
print(resp.choices[0].message.content)

Anthropic SDK 也可以指向同一个 Base URL：

import anthropic, os

client = anthropic.Anthropic(
    api_key=os.environ["ONEHOP_API_KEY"],
    base_url="https://api.onehop.ai/v1",
)

生产迁移我会这样排期：今天把旧模型名替换掉；本周把 OpenAI/Anthropic 两种路径的 smoke test 跑通；月底前把思考模式和 tool call 的回传逻辑补齐；7 月中旬前删掉所有 deepseek-chat、deepseek-reasoner。如果你想少维护几套供应商配置，可以直接试：在 onehop 上调用 Claude 等模型，或先领额度跑通链路：注册即送 $10 体验额度。

DeepSeek API 迁移到 deepseek-v4-flash / deepseek-v4-pro：OpenAI 与 Anthropic 两种兼容格式怎么选

先选接口格式：看你的生态，不看信仰

模型名替换：别再依赖兼容别名

OpenAI 格式：最小改动版本

Anthropic 格式：给 Claude 工具链留后门

成本估算：先按缓存未命中算

中转接口用户：省事可以走 onehop

相关阅读

通过 DashScope 兼容模式用 OpenAI SDK 调用 Qwen3.7 Plus

使用 OpenAI SDK 调用 Groq GPT-OSS 120B：Base URL、定价与缓存

用 OpenAI SDK 调 Gemini API：只改 base_url、API Key 和模型名的迁移教程