DeepSeek API 迁移到 deepseek-v4-flash / deepseek-v4-pro:OpenAI 与 Anthropic 两种兼容格式怎么选
2026年6月14日 · 12 分钟阅读 · Claude / GPT / Gemini / DeepSeek

2026-06-14 看 DeepSeek API,最该先改的不是 prompt,而是模型名。DeepSeek 中文价格页写得很直:deepseek-chat 和 deepseek-reasoner 将于北京时间 2026/07/24 23:59 弃用;兼容期内,前者对应 deepseek-v4-flash 的非思考模式,后者对应 deepseek-v4-flash 的思考模式(DeepSeek 价格页)。如果你的生产代码还在写旧名字,别等到最后一周。

先选接口格式:看你的生态,不看信仰
DeepSeek 现在同时给两套兼容入口:OpenAI 格式 https://api.deepseek.com,Anthropic 格式 https://api.deepseek.com/anthropic(DeepSeek 首次调用 API)。
我的建议很简单:
| 你的现状 | 选哪个 | 原因 |
|---|---|---|
| 已用 OpenAI SDK、LangChain、LlamaIndex、Vercel AI SDK 的 Chat Completions | OpenAI 格式 | 改 base_url 和 model 最少 |
| 已用 Anthropic SDK、Claude Code、Messages API 结构 | Anthropic 格式 | system、messages.create、max_tokens 习惯不变 |
| 自己写 HTTP wrapper | OpenAI 格式优先 | 调试资料更多,字段更通用 |
| 要复用 Claude 工具链 | Anthropic 格式 | DeepSeek 明确支持 Anthropic API 生态(DeepSeek Anthropic API) |
一个坑:Anthropic 格式下,DeepSeek 会做模型名映射。官方文档写明,claude-opus 开头会映射到 deepseek-v4-pro,claude-haiku 或 claude-sonnet 开头会映射到 deepseek-v4-flash。我仍建议显式写 deepseek-v4-pro 或 deepseek-v4-flash,别把生产行为交给隐式映射。
模型名替换:别再依赖兼容别名
迁移表只有两行:
| 旧模型名 | 现在兼容到 | 建议写法 |
|---|---|---|
deepseek-chat |
deepseek-v4-flash 非思考模式 |
deepseek-v4-flash + 关闭 thinking |
deepseek-reasoner |
deepseek-v4-flash 思考模式 |
deepseek-v4-flash 或 deepseek-v4-pro + 开启 thinking |
如果你原来把 deepseek-reasoner 用在代码审查、复杂 SQL、长文推理,可以顺手评估 deepseek-v4-pro。如果只是客服、摘要、分类,deepseek-v4-flash 更像默认选择。

OpenAI 格式:最小改动版本
DeepSeek 的 OpenAI 格式仍走 Chat Completions。OpenAI 官方接口本身也是 POST /v1/chat/completions 的消息列表风格(OpenAI API Reference),所以大部分 SDK 只改两处。
# pip install openai
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ["DEEPSEEK_API_KEY"],
base_url="https://api.deepseek.com",
)
resp = client.chat.completions.create(
model="deepseek-v4-flash",
messages=[
{"role": "system", "content": "你是一个严谨的代码审查助手。"},
{"role": "user", "content": "检查这段 Python 代码的潜在 bug。"},
],
extra_body={"thinking": {"type": "disabled"}},
stream=False,
)
print(resp.choices[0].message.content)
要打开思考模式,把最后一段改成:
reasoning_effort="high",
extra_body={"thinking": {"type": "enabled"}}
DeepSeek 的思考模式默认开启,OpenAI SDK 里 thinking 要放进 extra_body;思考强度支持 high 和 max(DeepSeek 思考模式)。如果你的工具调用链会把 assistant 消息回传,记住一条硬规则:涉及 tool call 的思考模式轮次,后续请求必须完整回传 reasoning_content,否则会 400。
Anthropic 格式:给 Claude 工具链留后门
如果你已经围绕 Anthropic Messages API 写了系统提示、max_tokens、client.messages.create(),直接换 Base URL:
# pip install anthropic
import os
import anthropic
client = anthropic.Anthropic(
api_key=os.environ["DEEPSEEK_API_KEY"],
base_url="https://api.deepseek.com/anthropic",
)
msg = client.messages.create(
model="deepseek-v4-pro",
max_tokens=1000,
system="你是一个资深后端工程师。",
messages=[{"role": "user", "content": "给我一个 Redis 缓存穿透的修复方案。"}],
thinking={"type": "enabled"},
output_config={"effort": "high"},
)
print(msg.content)
Anthropic 官方 Messages API 也是 messages.create 这一套结构,核心字段包括 model、max_tokens、system、messages(Anthropic Messages API)。所以选择 Anthropic 格式的真正理由不是“更高级”,而是少改 Claude 生态代码。
成本估算:先按缓存未命中算
DeepSeek 中文价格页按百万 tokens 计费:deepseek-v4-flash 输入缓存命中 0.02 元、输入未命中 1 元、输出 2 元;deepseek-v4-pro 输入缓存命中 0.025 元、输入未命中 3 元、输出 6 元(DeepSeek 价格页)。
一个粗算:每月 200M 输入、50M 输出,先按全量未命中算。
| 模型 | 输入成本 | 输出成本 | 合计 |
|---|---|---|---|
deepseek-v4-flash |
200 元 | 100 元 | 300 元 |
deepseek-v4-pro |
600 元 | 300 元 | 900 元 |
真实账单会受缓存命中影响。做 RAG、Agent、长系统提示时,把稳定前缀放前面,命中率上来后,输入成本会明显下降。别在迁移第一天就用最乐观缓存数字做预算。
中转接口用户:省事可以走 onehop
如果你的目标不是只接 DeepSeek,而是同一套代码里切 Claude、GPT、Gemini,onehop 是省时间的路径:OpenAI/Anthropic 兼容,Base URL 改成 https://api.onehop.ai/v1,新账号送 $10,价格低于官方,无需绑卡。
OpenAI SDK 示例:
from openai import OpenAI
import os
client = OpenAI(
api_key=os.environ["ONEHOP_API_KEY"],
base_url="https://api.onehop.ai/v1",
)
resp = client.chat.completions.create(
model="claude-sonnet-4-5",
messages=[{"role": "user", "content": "用三点解释这个 API 迁移计划。"}],
)
print(resp.choices[0].message.content)
Anthropic SDK 也可以指向同一个 Base URL:
import anthropic, os
client = anthropic.Anthropic(
api_key=os.environ["ONEHOP_API_KEY"],
base_url="https://api.onehop.ai/v1",
)
生产迁移我会这样排期:今天把旧模型名替换掉;本周把 OpenAI/Anthropic 两种路径的 smoke test 跑通;月底前把思考模式和 tool call 的回传逻辑补齐;7 月中旬前删掉所有 deepseek-chat、deepseek-reasoner。如果你想少维护几套供应商配置,可以直接试:在 onehop 上调用 Claude 等模型,或先领额度跑通链路:注册即送 $10 体验额度。
相关阅读

使用 OpenAI SDK 调用 Groq GPT-OSS 120B:Base URL、定价与缓存
只需替换 OpenAI SDK 的 base URL,即可在 Groq 上运行 GPT-OSS 120B,估算缓存 token 成本,并避免工具计费意外。
2026年6月17日 · 18 分钟阅读

用 OpenAI SDK 调 Gemini API:只改 base_url、API Key 和模型名的迁移教程
面向已有 OpenAI SDK 项目的 Gemini 兼容接口迁移清单,含代码、参数映射和价格。
2026年6月14日 · 9 分钟阅读

用 OpenAI SDK 调 Gemini API:只改 base_url、key 和模型名的接入教程
已有 OpenAI SDK 代码接入 Gemini,最小改动只需三处配置。
2026年6月14日 · 9 分钟阅读