DeepSeek APIをdeepseek-v4-flash / deepseek-v4-proへ移行：OpenAI互換形式とAnthropic互換形式の選び方

2026-06-14 DeepSeek APIを見るなら、最初に直すべきなのは prompt ではなくモデル名です。DeepSeek の中国語価格ページにはかなり率直に書かれています：deepseek-chat と deepseek-reasoner は、北京時間 2026/07/24 23:59 に非推奨になります。互換期間中、前者は deepseek-v4-flash の非思考モードに、後者は deepseek-v4-flash の思考モードに対応します（DeepSeek 価格ページ）。本番コードでまだ古い名前を書いているなら、最後の1週間まで待たないでください。

米白色の背景のタイムライン図。左側に 2026-06-14 現在のチェックポイント、右側に 2026-07-24 23:59 北京時間の非推奨ポイントが示され、中央はテラコッタ色の矢印で接続。旧モデル名はグレーでフェードアウトし、新モデル名はチャコールグレーで強調

まずインターフェース形式を選ぶ：信念ではなく、あなたのエコシステムで見る

DeepSeek は現在、2つの互換エンドポイントを提供しています：OpenAI 形式の https://api.deepseek.com、Anthropic 形式の https://api.deepseek.com/anthropic（DeepSeek API の初回呼び出し）。

私のおすすめはシンプルです：

現在の状況	どちらを選ぶか	理由
OpenAI SDK、LangChain、LlamaIndex、Vercel AI SDK の Chat Completions をすでに使っている	OpenAI 形式	`base_url` と `model` の変更が最小
Anthropic SDK、Claude Code、Messages API 構造をすでに使っている	Anthropic 形式	`system`、`messages.create`、`max_tokens` の使い方を変えなくてよい
自前で HTTP wrapper を書いている	OpenAI 形式を優先	デバッグ資料が多く、フィールドもより汎用的
Claude ツールチェーンを再利用したい	Anthropic 形式	DeepSeek は Anthropic API エコシステムのサポートを明示している（DeepSeek Anthropic API）

注意点が1つあります：Anthropic 形式では、DeepSeek がモデル名のマッピングを行います。公式ドキュメントでは、claude-opus で始まるものは deepseek-v4-pro に、claude-haiku または claude-sonnet で始まるものは deepseek-v4-flash にマッピングされると書かれています。それでも私は、deepseek-v4-pro または deepseek-v4-flash を明示的に書くことをおすすめします。本番の挙動を暗黙のマッピングに委ねないでください。

モデル名の置き換え：互換エイリアスに依存し続けない

移行表は2行だけです：

旧モデル名	現在の互換先	推奨する書き方
`deepseek-chat`	`deepseek-v4-flash` 非思考モード	`deepseek-v4-flash` + thinking を無効化
`deepseek-reasoner`	`deepseek-v4-flash` 思考モード	`deepseek-v4-flash` または `deepseek-v4-pro` + thinking を有効化

これまで deepseek-reasoner をコードレビュー、複雑な SQL、長文推論に使っていたなら、ついでに deepseek-v4-pro も評価するとよいでしょう。カスタマーサポート、要約、分類だけなら、deepseek-v4-flash のほうがデフォルト選択に近いです。

モデルファミリー移行図。左側に旧モデルカード deepseek-chat と deepseek-reasoner、右側に新モデルカード deepseek-v4-flash と deepseek-v4-pro。線種の違いで非思考モードと思考モードを示し、テラコッタ色で推奨を強調

OpenAI 形式：最小変更版

DeepSeek の OpenAI 形式は引き続き Chat Completions を使います。OpenAI 公式インターフェース自体も POST /v1/chat/completions のメッセージリスト形式です（OpenAI API Reference）。そのため、多くの SDK では2か所を変えるだけで済みます。

# pip install openai
import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com",
)

resp = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=[
        {"role": "system", "content": "你是一个严谨的代码审查助手。"},
        {"role": "user", "content": "检查这段 Python 代码的潜在 bug。"},
    ],
    extra_body={"thinking": {"type": "disabled"}},
    stream=False,
)

print(resp.choices[0].message.content)

思考モードを有効にするには、最後の部分を次のように変更します：

reasoning_effort="high",
extra_body={"thinking": {"type": "enabled"}}

DeepSeek の思考モードはデフォルトで有効です。OpenAI SDK では thinking を extra_body に入れる必要があります。思考強度は high と max をサポートしています（DeepSeek 思考モード）。ツール呼び出しチェーンが assistant メッセージを返送する場合、厳格なルールを1つ覚えておいてください：tool call を含む思考モードのターンでは、後続リクエストで reasoning_content を完全に返送しなければなりません。そうしないと 400 になります。

Anthropic 形式：Claude ツールチェーンに抜け道を残す

すでに Anthropic Messages API を中心にシステムプロンプト、max_tokens、client.messages.create() を書いているなら、Base URL を直接差し替えます：

# pip install anthropic
import os
import anthropic

client = anthropic.Anthropic(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com/anthropic",
)

msg = client.messages.create(
    model="deepseek-v4-pro",
    max_tokens=1000,
    system="你是一个资深后端工程师。",
    messages=[{"role": "user", "content": "给我一个 Redis 缓存穿透的修复方案。"}],
    thinking={"type": "enabled"},
    output_config={"effort": "high"},
)

print(msg.content)

Anthropic 公式の Messages API も messages.create という構造で、主要フィールドには model、max_tokens、system、messages が含まれます（Anthropic Messages API）。したがって Anthropic 形式を選ぶ本当の理由は「より高度だから」ではなく、Claude エコシステムのコード変更を減らせるからです。

コスト見積もり：まずはキャッシュ未ヒットで計算する

DeepSeek の中国語価格ページでは、100万 tokens 単位で課金されます：deepseek-v4-flash は入力キャッシュヒット 0.02 元、入力未ヒット 1 元、出力 2 元；deepseek-v4-pro は入力キャッシュヒット 0.025 元、入力未ヒット 3 元、出力 6 元です（DeepSeek 価格ページ）。

ざっくり計算してみます：毎月 200M 入力、50M 出力として、まずは全量未ヒットで計算します。

モデル	入力コスト	出力コスト	合計
`deepseek-v4-flash`	200 元	100 元	300 元
`deepseek-v4-pro`	600 元	300 元	900 元

実際の請求額はキャッシュヒット率の影響を受けます。RAG、Agent、長いシステムプロンプトを扱う場合は、安定したプレフィックスを前に置きます。ヒット率が上がると、入力コストは明確に下がります。移行初日に、最も楽観的なキャッシュ数値で予算を組まないでください。

中継インターフェース利用者：手間を省くなら onehop を使える

目標が DeepSeek だけに接続することではなく、同じコードで Claude、GPT、Gemini を切り替えることなら、onehop は時間を節約できるルートです：OpenAI/Anthropic 互換で、Base URL を https://api.onehop.ai/v1 に変更します。新規アカウントには $10 が付与され、価格は公式より低く、カード登録も不要です。

OpenAI SDK の例：

from openai import OpenAI
import os

client = OpenAI(
    api_key=os.environ["ONEHOP_API_KEY"],
    base_url="https://api.onehop.ai/v1",
)

resp = client.chat.completions.create(
    model="claude-sonnet-4-5",
    messages=[{"role": "user", "content": "用三点解释这个 API 迁移计划。"}],
)
print(resp.choices[0].message.content)

Anthropic SDK も同じ Base URL を指せます：

import anthropic, os

client = anthropic.Anthropic(
    api_key=os.environ["ONEHOP_API_KEY"],
    base_url="https://api.onehop.ai/v1",
)

本番移行なら、私は次のようにスケジュールします：今日、旧モデル名を置き換える；今週中に OpenAI/Anthropic の2つの経路の smoke test を通す；月末までに思考モードと tool call の返送ロジックを補う；7月中旬までにすべての deepseek-chat、deepseek-reasoner を削除する。複数ベンダー設定の保守を減らしたいなら、直接試せます：onehop で Claude などのモデルを呼び出す、またはまずクレジットを受け取って経路を通してみる：登録すると $10 の体験クレジットをプレゼント。

DeepSeek APIをdeepseek-v4-flash / deepseek-v4-proへ移行：OpenAI互換形式とAnthropic互換形式の選び方

まずインターフェース形式を選ぶ：信念ではなく、あなたのエコシステムで見る

モデル名の置き換え：互換エイリアスに依存し続けない

OpenAI 形式：最小変更版

Anthropic 形式：Claude ツールチェーンに抜け道を残す

コスト見積もり：まずはキャッシュ未ヒットで計算する

中継インターフェース利用者：手間を省くなら onehop を使える

関連記事

DashScope 互換モード経由で OpenAI SDK から Qwen3.7 Plus を呼び出す

OpenAI SDKでGroq GPT-OSS 120Bを使う：Base URL、料金、キャッシュ

OpenAI SDKでGemini APIを呼び出す：base_url、API Key、モデル名だけを変更する移行チュートリアル