返回全部文章
指南

DeepSeek API 迁移到 deepseek-v4-flash / deepseek-v4-pro:OpenAI 与 Anthropic 两种兼容格式怎么选

2026年6月14日 · 12 分钟阅读 · Claude / GPT / Gemini / DeepSeek

米白背景上的开发者迁移路线图,左侧是旧模型 deepseek-chat/deepseek-reasoner 的灰色卡片,箭头指向右侧 deepseek-v4-flash 与 deepseek-v4-pro 两张赤陶色卡片,下方分叉为 Ope

2026-06-14 看 DeepSeek API,最该先改的不是 prompt,而是模型名。DeepSeek 中文价格页写得很直:deepseek-chatdeepseek-reasoner 将于北京时间 2026/07/24 23:59 弃用;兼容期内,前者对应 deepseek-v4-flash 的非思考模式,后者对应 deepseek-v4-flash 的思考模式(DeepSeek 价格页)。如果你的生产代码还在写旧名字,别等到最后一周。

米白背景的时间轴图,左侧标注 2026-06-14 当前检查点,右侧标注 2026-07-24 23:59 北京时间弃用点,中间用赤陶色箭头连接,旧模型名灰色淡出,新模型名炭灰高亮

先选接口格式:看你的生态,不看信仰

DeepSeek 现在同时给两套兼容入口:OpenAI 格式 https://api.deepseek.com,Anthropic 格式 https://api.deepseek.com/anthropicDeepSeek 首次调用 API)。

我的建议很简单:

你的现状 选哪个 原因
已用 OpenAI SDK、LangChain、LlamaIndex、Vercel AI SDK 的 Chat Completions OpenAI 格式 base_urlmodel 最少
已用 Anthropic SDK、Claude Code、Messages API 结构 Anthropic 格式 systemmessages.createmax_tokens 习惯不变
自己写 HTTP wrapper OpenAI 格式优先 调试资料更多,字段更通用
要复用 Claude 工具链 Anthropic 格式 DeepSeek 明确支持 Anthropic API 生态(DeepSeek Anthropic API

一个坑:Anthropic 格式下,DeepSeek 会做模型名映射。官方文档写明,claude-opus 开头会映射到 deepseek-v4-proclaude-haikuclaude-sonnet 开头会映射到 deepseek-v4-flash。我仍建议显式写 deepseek-v4-prodeepseek-v4-flash,别把生产行为交给隐式映射。

模型名替换:别再依赖兼容别名

迁移表只有两行:

旧模型名 现在兼容到 建议写法
deepseek-chat deepseek-v4-flash 非思考模式 deepseek-v4-flash + 关闭 thinking
deepseek-reasoner deepseek-v4-flash 思考模式 deepseek-v4-flashdeepseek-v4-pro + 开启 thinking

如果你原来把 deepseek-reasoner 用在代码审查、复杂 SQL、长文推理,可以顺手评估 deepseek-v4-pro。如果只是客服、摘要、分类,deepseek-v4-flash 更像默认选择。

模型家族迁移图,左侧两张旧模型卡片 deepseek-chat 与 deepseek-reasoner,右侧两张新模型卡片 deepseek-v4-flash 与 deepseek-v4-pro,用不同线型表示非思考和思考模式,赤陶色突出推

OpenAI 格式:最小改动版本

DeepSeek 的 OpenAI 格式仍走 Chat Completions。OpenAI 官方接口本身也是 POST /v1/chat/completions 的消息列表风格(OpenAI API Reference),所以大部分 SDK 只改两处。

# pip install openai
import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com",
)

resp = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=[
        {"role": "system", "content": "你是一个严谨的代码审查助手。"},
        {"role": "user", "content": "检查这段 Python 代码的潜在 bug。"},
    ],
    extra_body={"thinking": {"type": "disabled"}},
    stream=False,
)

print(resp.choices[0].message.content)

要打开思考模式,把最后一段改成:

reasoning_effort="high",
extra_body={"thinking": {"type": "enabled"}}

DeepSeek 的思考模式默认开启,OpenAI SDK 里 thinking 要放进 extra_body;思考强度支持 highmaxDeepSeek 思考模式)。如果你的工具调用链会把 assistant 消息回传,记住一条硬规则:涉及 tool call 的思考模式轮次,后续请求必须完整回传 reasoning_content,否则会 400。

Anthropic 格式:给 Claude 工具链留后门

如果你已经围绕 Anthropic Messages API 写了系统提示、max_tokensclient.messages.create(),直接换 Base URL:

# pip install anthropic
import os
import anthropic

client = anthropic.Anthropic(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com/anthropic",
)

msg = client.messages.create(
    model="deepseek-v4-pro",
    max_tokens=1000,
    system="你是一个资深后端工程师。",
    messages=[{"role": "user", "content": "给我一个 Redis 缓存穿透的修复方案。"}],
    thinking={"type": "enabled"},
    output_config={"effort": "high"},
)

print(msg.content)

Anthropic 官方 Messages API 也是 messages.create 这一套结构,核心字段包括 modelmax_tokenssystemmessagesAnthropic Messages API)。所以选择 Anthropic 格式的真正理由不是“更高级”,而是少改 Claude 生态代码。

成本估算:先按缓存未命中算

DeepSeek 中文价格页按百万 tokens 计费:deepseek-v4-flash 输入缓存命中 0.02 元、输入未命中 1 元、输出 2 元;deepseek-v4-pro 输入缓存命中 0.025 元、输入未命中 3 元、输出 6 元(DeepSeek 价格页)。

一个粗算:每月 200M 输入、50M 输出,先按全量未命中算。

模型 输入成本 输出成本 合计
deepseek-v4-flash 200 元 100 元 300 元
deepseek-v4-pro 600 元 300 元 900 元

真实账单会受缓存命中影响。做 RAG、Agent、长系统提示时,把稳定前缀放前面,命中率上来后,输入成本会明显下降。别在迁移第一天就用最乐观缓存数字做预算。

中转接口用户:省事可以走 onehop

如果你的目标不是只接 DeepSeek,而是同一套代码里切 Claude、GPT、Gemini,onehop 是省时间的路径:OpenAI/Anthropic 兼容,Base URL 改成 https://api.onehop.ai/v1,新账号送 $10,价格低于官方,无需绑卡。

OpenAI SDK 示例:

from openai import OpenAI
import os

client = OpenAI(
    api_key=os.environ["ONEHOP_API_KEY"],
    base_url="https://api.onehop.ai/v1",
)

resp = client.chat.completions.create(
    model="claude-sonnet-4-5",
    messages=[{"role": "user", "content": "用三点解释这个 API 迁移计划。"}],
)
print(resp.choices[0].message.content)

Anthropic SDK 也可以指向同一个 Base URL:

import anthropic, os

client = anthropic.Anthropic(
    api_key=os.environ["ONEHOP_API_KEY"],
    base_url="https://api.onehop.ai/v1",
)

生产迁移我会这样排期:今天把旧模型名替换掉;本周把 OpenAI/Anthropic 两种路径的 smoke test 跑通;月底前把思考模式和 tool call 的回传逻辑补齐;7 月中旬前删掉所有 deepseek-chatdeepseek-reasoner。如果你想少维护几套供应商配置,可以直接试:在 onehop 上调用 Claude 等模型,或先领额度跑通链路:注册即送 $10 体验额度