DeepSeek-API-Migration zu deepseek-v4-flash / deepseek-v4-pro: Welche der beiden kompatiblen Formate, OpenAI oder Anthropic, sollte man wählen?

2026-06-14: Beim Blick auf die DeepSeek API sollte man nicht zuerst den Prompt ändern, sondern den Modellnamen. Die chinesische Preisseite von DeepSeek ist sehr direkt: deepseek-chat und deepseek-reasoner werden am 2026/07/24 um 23:59 Uhr Pekinger Zeit eingestellt; während der Kompatibilitätsphase entspricht Ersteres dem Nicht-Denkmodus von deepseek-v4-flash, Letzteres dem Denkmodus von deepseek-v4-flash (DeepSeek-Preisseite). Wenn dein Produktionscode noch die alten Namen verwendet, warte nicht bis zur letzten Woche.

Zeitachsen-Grafik auf cremefarbenem Hintergrund, links markiert mit 2026-06-14 aktueller Prüfpunkt, rechts markiert mit 2026-07-24 23:59 Pekinger Zeit als Abschaltungspunkt, verbunden durch einen terrakottafarbenen Pfeil, alte Modellnamen grau ausgeblendet, neue Modellnamen anthrazit hervorgehoben

Zuerst das Schnittstellenformat wählen: nach deinem Ökosystem, nicht nach Glauben

DeepSeek bietet derzeit zwei kompatible Einstiegspunkte an: OpenAI-Format https://api.deepseek.com, Anthropic-Format https://api.deepseek.com/anthropic (DeepSeek: erster API-Aufruf).

Meine Empfehlung ist sehr einfach:

Deine aktuelle Situation	Was wählen?	Grund
Du nutzt bereits OpenAI SDK, LangChain, LlamaIndex oder Chat Completions des Vercel AI SDK	OpenAI-Format	Am wenigsten Änderungen an `base_url` und `model`
Du nutzt bereits Anthropic SDK, Claude Code oder die Messages-API-Struktur	Anthropic-Format	`system`, `messages.create` und `max_tokens` bleiben wie gewohnt
Du hast deinen eigenen HTTP-Wrapper geschrieben	OpenAI-Format zuerst	Mehr Debugging-Material, allgemeinere Felder
Du willst die Claude-Toolchain wiederverwenden	Anthropic-Format	DeepSeek unterstützt das Anthropic-API-Ökosystem ausdrücklich (DeepSeek Anthropic API)

Eine Falle: Im Anthropic-Format führt DeepSeek ein Mapping von Modellnamen durch. Die offizielle Dokumentation schreibt, dass Namen mit claude-opus auf deepseek-v4-pro gemappt werden, während Namen mit claude-haiku oder claude-sonnet auf deepseek-v4-flash gemappt werden. Ich empfehle trotzdem, explizit deepseek-v4-pro oder deepseek-v4-flash zu schreiben und Produktionsverhalten nicht implizitem Mapping zu überlassen.

Modellnamen ersetzen: Verlass dich nicht mehr auf Kompatibilitäts-Aliase

Die Migrationstabelle hat nur zwei Zeilen:

Alter Modellname	Derzeit kompatibel mit	Empfohlene Schreibweise
`deepseek-chat`	Nicht-Denkmodus von `deepseek-v4-flash`	`deepseek-v4-flash` + thinking deaktivieren
`deepseek-reasoner`	Denkmodus von `deepseek-v4-flash`	`deepseek-v4-flash` oder `deepseek-v4-pro` + thinking aktivieren

Wenn du deepseek-reasoner bisher für Code-Reviews, komplexes SQL oder Langtext-Reasoning eingesetzt hast, kannst du gleich deepseek-v4-pro evaluieren. Wenn es nur um Kundenservice, Zusammenfassungen oder Klassifikation geht, ist deepseek-v4-flash eher die Standardwahl.

Migrationsdiagramm der Modellfamilie, links zwei alte Modellkarten deepseek-chat und deepseek-reasoner, rechts zwei neue Modellkarten deepseek-v4-flash und deepseek-v4-pro, unterschiedliche Linientypen zeigen Nicht-Denk- und Denkmodus, Terrakotta hebt die Empfehlung hervor

OpenAI-Format: Version mit minimalen Änderungen

Das OpenAI-Format von DeepSeek läuft weiterhin über Chat Completions. Die offizielle OpenAI-Schnittstelle selbst ist ebenfalls im Nachrichtenlistenstil von POST /v1/chat/completions aufgebaut (OpenAI API Reference), daher müssen bei den meisten SDKs nur zwei Stellen geändert werden.

# pip install openai
import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com",
)

resp = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=[
        {"role": "system", "content": "你是一个严谨的代码审查助手。"},
        {"role": "user", "content": "检查这段 Python 代码的潜在 bug。"},
    ],
    extra_body={"thinking": {"type": "disabled"}},
    stream=False,
)

print(resp.choices[0].message.content)

Um den Denkmodus zu aktivieren, ändere den letzten Abschnitt in:

reasoning_effort="high",
extra_body={"thinking": {"type": "enabled"}}

Der Denkmodus von DeepSeek ist standardmäßig aktiviert; im OpenAI SDK muss thinking in extra_body abgelegt werden. Die Denkintensität unterstützt high und max (DeepSeek-Denkmodus). Wenn deine Tool-Call-Kette Assistant-Nachrichten zurücksendet, merke dir eine harte Regel: Bei Denkmodus-Runden mit Tool Calls muss in nachfolgenden Requests reasoning_content vollständig zurückgesendet werden, sonst gibt es 400.

Anthropic-Format: Eine Hintertür für die Claude-Toolchain lassen

Wenn du bereits System-Prompts, max_tokens und client.messages.create() rund um die Anthropic Messages API geschrieben hast, ersetze einfach die Base URL:

# pip install anthropic
import os
import anthropic

client = anthropic.Anthropic(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com/anthropic",
)

msg = client.messages.create(
    model="deepseek-v4-pro",
    max_tokens=1000,
    system="你是一个资深后端工程师。",
    messages=[{"role": "user", "content": "给我一个 Redis 缓存穿透的修复方案。"}],
    thinking={"type": "enabled"},
    output_config={"effort": "high"},
)

print(msg.content)

Die offizielle Anthropic Messages API verwendet ebenfalls diese Struktur mit messages.create; zu den Kernfeldern gehören model, max_tokens, system und messages (Anthropic Messages API). Der eigentliche Grund für die Wahl des Anthropic-Formats ist also nicht „höherwertig“, sondern weniger Änderungen am Claude-Ökosystem-Code.

Kostenschätzung: zunächst mit Cache-Miss rechnen

Die chinesische Preisseite von DeepSeek rechnet pro Million Tokens ab: Bei deepseek-v4-flash kostet ein Eingabe-Cache-Hit 0,02 Yuan, ein Eingabe-Miss 1 Yuan und Ausgabe 2 Yuan; bei deepseek-v4-pro kostet ein Eingabe-Cache-Hit 0,025 Yuan, ein Eingabe-Miss 3 Yuan und Ausgabe 6 Yuan (DeepSeek-Preisseite).

Eine grobe Rechnung: 200 Mio. Eingabe-Tokens und 50 Mio. Ausgabe-Tokens pro Monat, zunächst vollständig als Cache-Miss gerechnet.

Modell	Eingabekosten	Ausgabekosten	Summe
`deepseek-v4-flash`	200 Yuan	100 Yuan	300 Yuan
`deepseek-v4-pro`	600 Yuan	300 Yuan	900 Yuan

Die tatsächliche Rechnung wird durch Cache-Hits beeinflusst. Bei RAG, Agenten und langen System-Prompts solltest du stabile Präfixe nach vorne setzen; wenn die Trefferquote steigt, sinken die Eingabekosten deutlich. Nutze am ersten Migrationstag nicht gleich die optimistischsten Cache-Zahlen für dein Budget.

Nutzer von Relay-Schnittstellen: Bequem geht es über onehop

Wenn dein Ziel nicht nur darin besteht, DeepSeek anzubinden, sondern mit derselben Codebasis zwischen Claude, GPT und Gemini zu wechseln, ist onehop der zeitsparende Weg: OpenAI/Anthropic-kompatibel, Base URL auf https://api.onehop.ai/v1 ändern, neue Konten erhalten $10, Preise unterhalb der offiziellen Tarife, keine Kartenbindung erforderlich.

OpenAI-SDK-Beispiel:

from openai import OpenAI
import os

client = OpenAI(
    api_key=os.environ["ONEHOP_API_KEY"],
    base_url="https://api.onehop.ai/v1",
)

resp = client.chat.completions.create(
    model="claude-sonnet-4-5",
    messages=[{"role": "user", "content": "用三点解释这个 API 迁移计划。"}],
)
print(resp.choices[0].message.content)

Auch das Anthropic SDK kann auf dieselbe Base URL zeigen:

import anthropic, os

client = anthropic.Anthropic(
    api_key=os.environ["ONEHOP_API_KEY"],
    base_url="https://api.onehop.ai/v1",
)

Für eine Produktionsmigration würde ich den Zeitplan so setzen: heute die alten Modellnamen ersetzen; diese Woche die Smoke Tests für die OpenAI- und Anthropic-Pfade zum Laufen bringen; bis Monatsende Denkmodus und Rücksende-Logik für Tool Calls ergänzen; vor Mitte Juli alle Vorkommen von deepseek-chat und deepseek-reasoner löschen. Wenn du weniger Anbieter-Konfigurationen pflegen möchtest, kannst du es direkt ausprobieren: Claude und andere Modelle über onehop aufrufen, oder dir zuerst Guthaben holen und die Kette testen: Registrieren und $10 Testguthaben erhalten.

DeepSeek-API-Migration zu deepseek-v4-flash / deepseek-v4-pro: Welche der beiden kompatiblen Formate, OpenAI oder Anthropic, sollte man wählen?

Zuerst das Schnittstellenformat wählen: nach deinem Ökosystem, nicht nach Glauben

Modellnamen ersetzen: Verlass dich nicht mehr auf Kompatibilitäts-Aliase

OpenAI-Format: Version mit minimalen Änderungen

Anthropic-Format: Eine Hintertür für die Claude-Toolchain lassen

Kostenschätzung: zunächst mit Cache-Miss rechnen

Nutzer von Relay-Schnittstellen: Bequem geht es über onehop

Weitere Lekture

Qwen3.7 Plus mit dem OpenAI SDK über den DashScope-kompatiblen Modus aufrufen

Groq GPT-OSS 120B mit dem OpenAI SDK nutzen: Base-URL, Preise und Caching

Gemini API mit dem OpenAI SDK aufrufen: Migrationsanleitung mit nur base_url, API-Key und Modellname