すべての記事へ戻る
ガイド

DeepSeek APIをdeepseek-v4-flash / deepseek-v4-proへ移行:OpenAI互換形式とAnthropic互換形式の選び方

2026年6月14日 · 12分で読めます · Claude / GPT / Gemini / DeepSeek

生成りの背景に描かれた開発者向け移行ロードマップ。左側に旧モデルdeepseek-chat/deepseek-reasonerのグレーのカード、矢印の先に右側のdeepseek-v4-flashとdeepseek-v4-proのテラコッタ色カード2枚、下部でOpeへ分岐

2026-06-14 DeepSeek APIを見るなら、最初に直すべきなのは prompt ではなくモデル名です。DeepSeek の中国語価格ページにはかなり率直に書かれています:deepseek-chatdeepseek-reasoner は、北京時間 2026/07/24 23:59 に非推奨になります。互換期間中、前者は deepseek-v4-flash の非思考モードに、後者は deepseek-v4-flash の思考モードに対応します(DeepSeek 価格ページ)。本番コードでまだ古い名前を書いているなら、最後の1週間まで待たないでください。

米白色の背景のタイムライン図。左側に 2026-06-14 現在のチェックポイント、右側に 2026-07-24 23:59 北京時間の非推奨ポイントが示され、中央はテラコッタ色の矢印で接続。旧モデル名はグレーでフェードアウトし、新モデル名はチャコールグレーで強調

まずインターフェース形式を選ぶ:信念ではなく、あなたのエコシステムで見る

DeepSeek は現在、2つの互換エンドポイントを提供しています:OpenAI 形式の https://api.deepseek.com、Anthropic 形式の https://api.deepseek.com/anthropicDeepSeek API の初回呼び出し)。

私のおすすめはシンプルです:

現在の状況 どちらを選ぶか 理由
OpenAI SDK、LangChain、LlamaIndex、Vercel AI SDK の Chat Completions をすでに使っている OpenAI 形式 base_urlmodel の変更が最小
Anthropic SDK、Claude Code、Messages API 構造をすでに使っている Anthropic 形式 systemmessages.createmax_tokens の使い方を変えなくてよい
自前で HTTP wrapper を書いている OpenAI 形式を優先 デバッグ資料が多く、フィールドもより汎用的
Claude ツールチェーンを再利用したい Anthropic 形式 DeepSeek は Anthropic API エコシステムのサポートを明示している(DeepSeek Anthropic API

注意点が1つあります:Anthropic 形式では、DeepSeek がモデル名のマッピングを行います。公式ドキュメントでは、claude-opus で始まるものは deepseek-v4-pro に、claude-haiku または claude-sonnet で始まるものは deepseek-v4-flash にマッピングされると書かれています。それでも私は、deepseek-v4-pro または deepseek-v4-flash を明示的に書くことをおすすめします。本番の挙動を暗黙のマッピングに委ねないでください。

モデル名の置き換え:互換エイリアスに依存し続けない

移行表は2行だけです:

旧モデル名 現在の互換先 推奨する書き方
deepseek-chat deepseek-v4-flash 非思考モード deepseek-v4-flash + thinking を無効化
deepseek-reasoner deepseek-v4-flash 思考モード deepseek-v4-flash または deepseek-v4-pro + thinking を有効化

これまで deepseek-reasoner をコードレビュー、複雑な SQL、長文推論に使っていたなら、ついでに deepseek-v4-pro も評価するとよいでしょう。カスタマーサポート、要約、分類だけなら、deepseek-v4-flash のほうがデフォルト選択に近いです。

モデルファミリー移行図。左側に旧モデルカード deepseek-chat と deepseek-reasoner、右側に新モデルカード deepseek-v4-flash と deepseek-v4-pro。線種の違いで非思考モードと思考モードを示し、テラコッタ色で推奨を強調

OpenAI 形式:最小変更版

DeepSeek の OpenAI 形式は引き続き Chat Completions を使います。OpenAI 公式インターフェース自体も POST /v1/chat/completions のメッセージリスト形式です(OpenAI API Reference)。そのため、多くの SDK では2か所を変えるだけで済みます。

# pip install openai
import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com",
)

resp = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=[
        {"role": "system", "content": "你是一个严谨的代码审查助手。"},
        {"role": "user", "content": "检查这段 Python 代码的潜在 bug。"},
    ],
    extra_body={"thinking": {"type": "disabled"}},
    stream=False,
)

print(resp.choices[0].message.content)

思考モードを有効にするには、最後の部分を次のように変更します:

reasoning_effort="high",
extra_body={"thinking": {"type": "enabled"}}

DeepSeek の思考モードはデフォルトで有効です。OpenAI SDK では thinkingextra_body に入れる必要があります。思考強度は highmax をサポートしています(DeepSeek 思考モード)。ツール呼び出しチェーンが assistant メッセージを返送する場合、厳格なルールを1つ覚えておいてください:tool call を含む思考モードのターンでは、後続リクエストで reasoning_content を完全に返送しなければなりません。そうしないと 400 になります。

Anthropic 形式:Claude ツールチェーンに抜け道を残す

すでに Anthropic Messages API を中心にシステムプロンプト、max_tokensclient.messages.create() を書いているなら、Base URL を直接差し替えます:

# pip install anthropic
import os
import anthropic

client = anthropic.Anthropic(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com/anthropic",
)

msg = client.messages.create(
    model="deepseek-v4-pro",
    max_tokens=1000,
    system="你是一个资深后端工程师。",
    messages=[{"role": "user", "content": "给我一个 Redis 缓存穿透的修复方案。"}],
    thinking={"type": "enabled"},
    output_config={"effort": "high"},
)

print(msg.content)

Anthropic 公式の Messages API も messages.create という構造で、主要フィールドには modelmax_tokenssystemmessages が含まれます(Anthropic Messages API)。したがって Anthropic 形式を選ぶ本当の理由は「より高度だから」ではなく、Claude エコシステムのコード変更を減らせるからです。

コスト見積もり:まずはキャッシュ未ヒットで計算する

DeepSeek の中国語価格ページでは、100万 tokens 単位で課金されます:deepseek-v4-flash は入力キャッシュヒット 0.02 元、入力未ヒット 1 元、出力 2 元;deepseek-v4-pro は入力キャッシュヒット 0.025 元、入力未ヒット 3 元、出力 6 元です(DeepSeek 価格ページ)。

ざっくり計算してみます:毎月 200M 入力、50M 出力として、まずは全量未ヒットで計算します。

モデル 入力コスト 出力コスト 合計
deepseek-v4-flash 200 元 100 元 300 元
deepseek-v4-pro 600 元 300 元 900 元

実際の請求額はキャッシュヒット率の影響を受けます。RAG、Agent、長いシステムプロンプトを扱う場合は、安定したプレフィックスを前に置きます。ヒット率が上がると、入力コストは明確に下がります。移行初日に、最も楽観的なキャッシュ数値で予算を組まないでください。

中継インターフェース利用者:手間を省くなら onehop を使える

目標が DeepSeek だけに接続することではなく、同じコードで Claude、GPT、Gemini を切り替えることなら、onehop は時間を節約できるルートです:OpenAI/Anthropic 互換で、Base URL を https://api.onehop.ai/v1 に変更します。新規アカウントには $10 が付与され、価格は公式より低く、カード登録も不要です。

OpenAI SDK の例:

from openai import OpenAI
import os

client = OpenAI(
    api_key=os.environ["ONEHOP_API_KEY"],
    base_url="https://api.onehop.ai/v1",
)

resp = client.chat.completions.create(
    model="claude-sonnet-4-5",
    messages=[{"role": "user", "content": "用三点解释这个 API 迁移计划。"}],
)
print(resp.choices[0].message.content)

Anthropic SDK も同じ Base URL を指せます:

import anthropic, os

client = anthropic.Anthropic(
    api_key=os.environ["ONEHOP_API_KEY"],
    base_url="https://api.onehop.ai/v1",
)

本番移行なら、私は次のようにスケジュールします:今日、旧モデル名を置き換える;今週中に OpenAI/Anthropic の2つの経路の smoke test を通す;月末までに思考モードと tool call の返送ロジックを補う;7月中旬までにすべての deepseek-chatdeepseek-reasoner を削除する。複数ベンダー設定の保守を減らしたいなら、直接試せます:onehop で Claude などのモデルを呼び出す、またはまずクレジットを受け取って経路を通してみる:登録すると $10 の体験クレジットをプレゼント