DeepSeek APIをdeepseek-v4-flash / deepseek-v4-proへ移行:OpenAI互換形式とAnthropic互換形式の選び方
2026年6月14日 · 12分で読めます · Claude / GPT / Gemini / DeepSeek

2026-06-14 DeepSeek APIを見るなら、最初に直すべきなのは prompt ではなくモデル名です。DeepSeek の中国語価格ページにはかなり率直に書かれています:deepseek-chat と deepseek-reasoner は、北京時間 2026/07/24 23:59 に非推奨になります。互換期間中、前者は deepseek-v4-flash の非思考モードに、後者は deepseek-v4-flash の思考モードに対応します(DeepSeek 価格ページ)。本番コードでまだ古い名前を書いているなら、最後の1週間まで待たないでください。

まずインターフェース形式を選ぶ:信念ではなく、あなたのエコシステムで見る
DeepSeek は現在、2つの互換エンドポイントを提供しています:OpenAI 形式の https://api.deepseek.com、Anthropic 形式の https://api.deepseek.com/anthropic(DeepSeek API の初回呼び出し)。
私のおすすめはシンプルです:
| 現在の状況 | どちらを選ぶか | 理由 |
|---|---|---|
| OpenAI SDK、LangChain、LlamaIndex、Vercel AI SDK の Chat Completions をすでに使っている | OpenAI 形式 | base_url と model の変更が最小 |
| Anthropic SDK、Claude Code、Messages API 構造をすでに使っている | Anthropic 形式 | system、messages.create、max_tokens の使い方を変えなくてよい |
| 自前で HTTP wrapper を書いている | OpenAI 形式を優先 | デバッグ資料が多く、フィールドもより汎用的 |
| Claude ツールチェーンを再利用したい | Anthropic 形式 | DeepSeek は Anthropic API エコシステムのサポートを明示している(DeepSeek Anthropic API) |
注意点が1つあります:Anthropic 形式では、DeepSeek がモデル名のマッピングを行います。公式ドキュメントでは、claude-opus で始まるものは deepseek-v4-pro に、claude-haiku または claude-sonnet で始まるものは deepseek-v4-flash にマッピングされると書かれています。それでも私は、deepseek-v4-pro または deepseek-v4-flash を明示的に書くことをおすすめします。本番の挙動を暗黙のマッピングに委ねないでください。
モデル名の置き換え:互換エイリアスに依存し続けない
移行表は2行だけです:
| 旧モデル名 | 現在の互換先 | 推奨する書き方 |
|---|---|---|
deepseek-chat |
deepseek-v4-flash 非思考モード |
deepseek-v4-flash + thinking を無効化 |
deepseek-reasoner |
deepseek-v4-flash 思考モード |
deepseek-v4-flash または deepseek-v4-pro + thinking を有効化 |
これまで deepseek-reasoner をコードレビュー、複雑な SQL、長文推論に使っていたなら、ついでに deepseek-v4-pro も評価するとよいでしょう。カスタマーサポート、要約、分類だけなら、deepseek-v4-flash のほうがデフォルト選択に近いです。

OpenAI 形式:最小変更版
DeepSeek の OpenAI 形式は引き続き Chat Completions を使います。OpenAI 公式インターフェース自体も POST /v1/chat/completions のメッセージリスト形式です(OpenAI API Reference)。そのため、多くの SDK では2か所を変えるだけで済みます。
# pip install openai
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ["DEEPSEEK_API_KEY"],
base_url="https://api.deepseek.com",
)
resp = client.chat.completions.create(
model="deepseek-v4-flash",
messages=[
{"role": "system", "content": "你是一个严谨的代码审查助手。"},
{"role": "user", "content": "检查这段 Python 代码的潜在 bug。"},
],
extra_body={"thinking": {"type": "disabled"}},
stream=False,
)
print(resp.choices[0].message.content)
思考モードを有効にするには、最後の部分を次のように変更します:
reasoning_effort="high",
extra_body={"thinking": {"type": "enabled"}}
DeepSeek の思考モードはデフォルトで有効です。OpenAI SDK では thinking を extra_body に入れる必要があります。思考強度は high と max をサポートしています(DeepSeek 思考モード)。ツール呼び出しチェーンが assistant メッセージを返送する場合、厳格なルールを1つ覚えておいてください:tool call を含む思考モードのターンでは、後続リクエストで reasoning_content を完全に返送しなければなりません。そうしないと 400 になります。
Anthropic 形式:Claude ツールチェーンに抜け道を残す
すでに Anthropic Messages API を中心にシステムプロンプト、max_tokens、client.messages.create() を書いているなら、Base URL を直接差し替えます:
# pip install anthropic
import os
import anthropic
client = anthropic.Anthropic(
api_key=os.environ["DEEPSEEK_API_KEY"],
base_url="https://api.deepseek.com/anthropic",
)
msg = client.messages.create(
model="deepseek-v4-pro",
max_tokens=1000,
system="你是一个资深后端工程师。",
messages=[{"role": "user", "content": "给我一个 Redis 缓存穿透的修复方案。"}],
thinking={"type": "enabled"},
output_config={"effort": "high"},
)
print(msg.content)
Anthropic 公式の Messages API も messages.create という構造で、主要フィールドには model、max_tokens、system、messages が含まれます(Anthropic Messages API)。したがって Anthropic 形式を選ぶ本当の理由は「より高度だから」ではなく、Claude エコシステムのコード変更を減らせるからです。
コスト見積もり:まずはキャッシュ未ヒットで計算する
DeepSeek の中国語価格ページでは、100万 tokens 単位で課金されます:deepseek-v4-flash は入力キャッシュヒット 0.02 元、入力未ヒット 1 元、出力 2 元;deepseek-v4-pro は入力キャッシュヒット 0.025 元、入力未ヒット 3 元、出力 6 元です(DeepSeek 価格ページ)。
ざっくり計算してみます:毎月 200M 入力、50M 出力として、まずは全量未ヒットで計算します。
| モデル | 入力コスト | 出力コスト | 合計 |
|---|---|---|---|
deepseek-v4-flash |
200 元 | 100 元 | 300 元 |
deepseek-v4-pro |
600 元 | 300 元 | 900 元 |
実際の請求額はキャッシュヒット率の影響を受けます。RAG、Agent、長いシステムプロンプトを扱う場合は、安定したプレフィックスを前に置きます。ヒット率が上がると、入力コストは明確に下がります。移行初日に、最も楽観的なキャッシュ数値で予算を組まないでください。
中継インターフェース利用者:手間を省くなら onehop を使える
目標が DeepSeek だけに接続することではなく、同じコードで Claude、GPT、Gemini を切り替えることなら、onehop は時間を節約できるルートです:OpenAI/Anthropic 互換で、Base URL を https://api.onehop.ai/v1 に変更します。新規アカウントには $10 が付与され、価格は公式より低く、カード登録も不要です。
OpenAI SDK の例:
from openai import OpenAI
import os
client = OpenAI(
api_key=os.environ["ONEHOP_API_KEY"],
base_url="https://api.onehop.ai/v1",
)
resp = client.chat.completions.create(
model="claude-sonnet-4-5",
messages=[{"role": "user", "content": "用三点解释这个 API 迁移计划。"}],
)
print(resp.choices[0].message.content)
Anthropic SDK も同じ Base URL を指せます:
import anthropic, os
client = anthropic.Anthropic(
api_key=os.environ["ONEHOP_API_KEY"],
base_url="https://api.onehop.ai/v1",
)
本番移行なら、私は次のようにスケジュールします:今日、旧モデル名を置き換える;今週中に OpenAI/Anthropic の2つの経路の smoke test を通す;月末までに思考モードと tool call の返送ロジックを補う;7月中旬までにすべての deepseek-chat、deepseek-reasoner を削除する。複数ベンダー設定の保守を減らしたいなら、直接試せます:onehop で Claude などのモデルを呼び出す、またはまずクレジットを受け取って経路を通してみる:登録すると $10 の体験クレジットをプレゼント。
関連記事

OpenAI SDKでGroq GPT-OSS 120Bを使う:Base URL、料金、キャッシュ
OpenAI SDKのbase URLを1つ差し替えてGroq上でGPT-OSS 120Bを動かし、キャッシュ済みトークンのコストを見積もり、ツール課金の想定外を避ける。
2026年6月17日 · 21分で読めます

OpenAI SDKでGemini APIを呼び出す:base_url、API Key、モデル名だけを変更する移行チュートリアル
既存のOpenAI SDKプロジェクト向けGemini互換インターフェース移行チェックリスト。コード、パラメータ対応、料金を含む。
2026年6月14日 · 9分で読めます

OpenAI SDKでGemini APIを呼び出す:base_url・key・モデル名だけを変更する接続チュートリアル
既存のOpenAI SDKコードでGeminiに接続するには、最小限の変更として3つの設定を変えるだけで済みます。
2026年6月14日 · 9分で読めます