DeepSeek-API-Migration zu deepseek-v4-flash / deepseek-v4-pro: Welche der beiden kompatiblen Formate, OpenAI oder Anthropic, sollte man wählen?
14. Juni 2026 · 12 Min. Lesezeit · Claude / GPT / Gemini / DeepSeek

2026-06-14: Beim Blick auf die DeepSeek API sollte man nicht zuerst den Prompt ändern, sondern den Modellnamen. Die chinesische Preisseite von DeepSeek ist sehr direkt: deepseek-chat und deepseek-reasoner werden am 2026/07/24 um 23:59 Uhr Pekinger Zeit eingestellt; während der Kompatibilitätsphase entspricht Ersteres dem Nicht-Denkmodus von deepseek-v4-flash, Letzteres dem Denkmodus von deepseek-v4-flash (DeepSeek-Preisseite). Wenn dein Produktionscode noch die alten Namen verwendet, warte nicht bis zur letzten Woche.

Zuerst das Schnittstellenformat wählen: nach deinem Ökosystem, nicht nach Glauben
DeepSeek bietet derzeit zwei kompatible Einstiegspunkte an: OpenAI-Format https://api.deepseek.com, Anthropic-Format https://api.deepseek.com/anthropic (DeepSeek: erster API-Aufruf).
Meine Empfehlung ist sehr einfach:
| Deine aktuelle Situation | Was wählen? | Grund |
|---|---|---|
| Du nutzt bereits OpenAI SDK, LangChain, LlamaIndex oder Chat Completions des Vercel AI SDK | OpenAI-Format | Am wenigsten Änderungen an base_url und model |
| Du nutzt bereits Anthropic SDK, Claude Code oder die Messages-API-Struktur | Anthropic-Format | system, messages.create und max_tokens bleiben wie gewohnt |
| Du hast deinen eigenen HTTP-Wrapper geschrieben | OpenAI-Format zuerst | Mehr Debugging-Material, allgemeinere Felder |
| Du willst die Claude-Toolchain wiederverwenden | Anthropic-Format | DeepSeek unterstützt das Anthropic-API-Ökosystem ausdrücklich (DeepSeek Anthropic API) |
Eine Falle: Im Anthropic-Format führt DeepSeek ein Mapping von Modellnamen durch. Die offizielle Dokumentation schreibt, dass Namen mit claude-opus auf deepseek-v4-pro gemappt werden, während Namen mit claude-haiku oder claude-sonnet auf deepseek-v4-flash gemappt werden. Ich empfehle trotzdem, explizit deepseek-v4-pro oder deepseek-v4-flash zu schreiben und Produktionsverhalten nicht implizitem Mapping zu überlassen.
Modellnamen ersetzen: Verlass dich nicht mehr auf Kompatibilitäts-Aliase
Die Migrationstabelle hat nur zwei Zeilen:
| Alter Modellname | Derzeit kompatibel mit | Empfohlene Schreibweise |
|---|---|---|
deepseek-chat |
Nicht-Denkmodus von deepseek-v4-flash |
deepseek-v4-flash + thinking deaktivieren |
deepseek-reasoner |
Denkmodus von deepseek-v4-flash |
deepseek-v4-flash oder deepseek-v4-pro + thinking aktivieren |
Wenn du deepseek-reasoner bisher für Code-Reviews, komplexes SQL oder Langtext-Reasoning eingesetzt hast, kannst du gleich deepseek-v4-pro evaluieren. Wenn es nur um Kundenservice, Zusammenfassungen oder Klassifikation geht, ist deepseek-v4-flash eher die Standardwahl.

OpenAI-Format: Version mit minimalen Änderungen
Das OpenAI-Format von DeepSeek läuft weiterhin über Chat Completions. Die offizielle OpenAI-Schnittstelle selbst ist ebenfalls im Nachrichtenlistenstil von POST /v1/chat/completions aufgebaut (OpenAI API Reference), daher müssen bei den meisten SDKs nur zwei Stellen geändert werden.
# pip install openai
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ["DEEPSEEK_API_KEY"],
base_url="https://api.deepseek.com",
)
resp = client.chat.completions.create(
model="deepseek-v4-flash",
messages=[
{"role": "system", "content": "你是一个严谨的代码审查助手。"},
{"role": "user", "content": "检查这段 Python 代码的潜在 bug。"},
],
extra_body={"thinking": {"type": "disabled"}},
stream=False,
)
print(resp.choices[0].message.content)
Um den Denkmodus zu aktivieren, ändere den letzten Abschnitt in:
reasoning_effort="high",
extra_body={"thinking": {"type": "enabled"}}
Der Denkmodus von DeepSeek ist standardmäßig aktiviert; im OpenAI SDK muss thinking in extra_body abgelegt werden. Die Denkintensität unterstützt high und max (DeepSeek-Denkmodus). Wenn deine Tool-Call-Kette Assistant-Nachrichten zurücksendet, merke dir eine harte Regel: Bei Denkmodus-Runden mit Tool Calls muss in nachfolgenden Requests reasoning_content vollständig zurückgesendet werden, sonst gibt es 400.
Anthropic-Format: Eine Hintertür für die Claude-Toolchain lassen
Wenn du bereits System-Prompts, max_tokens und client.messages.create() rund um die Anthropic Messages API geschrieben hast, ersetze einfach die Base URL:
# pip install anthropic
import os
import anthropic
client = anthropic.Anthropic(
api_key=os.environ["DEEPSEEK_API_KEY"],
base_url="https://api.deepseek.com/anthropic",
)
msg = client.messages.create(
model="deepseek-v4-pro",
max_tokens=1000,
system="你是一个资深后端工程师。",
messages=[{"role": "user", "content": "给我一个 Redis 缓存穿透的修复方案。"}],
thinking={"type": "enabled"},
output_config={"effort": "high"},
)
print(msg.content)
Die offizielle Anthropic Messages API verwendet ebenfalls diese Struktur mit messages.create; zu den Kernfeldern gehören model, max_tokens, system und messages (Anthropic Messages API). Der eigentliche Grund für die Wahl des Anthropic-Formats ist also nicht „höherwertig“, sondern weniger Änderungen am Claude-Ökosystem-Code.
Kostenschätzung: zunächst mit Cache-Miss rechnen
Die chinesische Preisseite von DeepSeek rechnet pro Million Tokens ab: Bei deepseek-v4-flash kostet ein Eingabe-Cache-Hit 0,02 Yuan, ein Eingabe-Miss 1 Yuan und Ausgabe 2 Yuan; bei deepseek-v4-pro kostet ein Eingabe-Cache-Hit 0,025 Yuan, ein Eingabe-Miss 3 Yuan und Ausgabe 6 Yuan (DeepSeek-Preisseite).
Eine grobe Rechnung: 200 Mio. Eingabe-Tokens und 50 Mio. Ausgabe-Tokens pro Monat, zunächst vollständig als Cache-Miss gerechnet.
| Modell | Eingabekosten | Ausgabekosten | Summe |
|---|---|---|---|
deepseek-v4-flash |
200 Yuan | 100 Yuan | 300 Yuan |
deepseek-v4-pro |
600 Yuan | 300 Yuan | 900 Yuan |
Die tatsächliche Rechnung wird durch Cache-Hits beeinflusst. Bei RAG, Agenten und langen System-Prompts solltest du stabile Präfixe nach vorne setzen; wenn die Trefferquote steigt, sinken die Eingabekosten deutlich. Nutze am ersten Migrationstag nicht gleich die optimistischsten Cache-Zahlen für dein Budget.
Nutzer von Relay-Schnittstellen: Bequem geht es über onehop
Wenn dein Ziel nicht nur darin besteht, DeepSeek anzubinden, sondern mit derselben Codebasis zwischen Claude, GPT und Gemini zu wechseln, ist onehop der zeitsparende Weg: OpenAI/Anthropic-kompatibel, Base URL auf https://api.onehop.ai/v1 ändern, neue Konten erhalten $10, Preise unterhalb der offiziellen Tarife, keine Kartenbindung erforderlich.
OpenAI-SDK-Beispiel:
from openai import OpenAI
import os
client = OpenAI(
api_key=os.environ["ONEHOP_API_KEY"],
base_url="https://api.onehop.ai/v1",
)
resp = client.chat.completions.create(
model="claude-sonnet-4-5",
messages=[{"role": "user", "content": "用三点解释这个 API 迁移计划。"}],
)
print(resp.choices[0].message.content)
Auch das Anthropic SDK kann auf dieselbe Base URL zeigen:
import anthropic, os
client = anthropic.Anthropic(
api_key=os.environ["ONEHOP_API_KEY"],
base_url="https://api.onehop.ai/v1",
)
Für eine Produktionsmigration würde ich den Zeitplan so setzen: heute die alten Modellnamen ersetzen; diese Woche die Smoke Tests für die OpenAI- und Anthropic-Pfade zum Laufen bringen; bis Monatsende Denkmodus und Rücksende-Logik für Tool Calls ergänzen; vor Mitte Juli alle Vorkommen von deepseek-chat und deepseek-reasoner löschen. Wenn du weniger Anbieter-Konfigurationen pflegen möchtest, kannst du es direkt ausprobieren: Claude und andere Modelle über onehop aufrufen, oder dir zuerst Guthaben holen und die Kette testen: Registrieren und $10 Testguthaben erhalten.
Weitere Lekture

Groq GPT-OSS 120B mit dem OpenAI SDK nutzen: Base-URL, Preise und Caching
Tausche eine OpenAI-SDK-Base-URL, nutze GPT-OSS 120B auf Groq, schätze Cache-Token-Kosten und vermeide Tool-Abrechnungsfallen.
17. Juni 2026 · 27 Min. Lesezeit

Gemini API mit dem OpenAI SDK aufrufen: Migrationsanleitung mit nur base_url, API-Key und Modellname
Migrations-Checkliste für bestehende OpenAI-SDK-Projekte zur Gemini-kompatiblen Schnittstelle – mit Code, Parameter-Mapping und Preisen.
14. Juni 2026 · 9 Min. Lesezeit

Gemini API mit dem OpenAI SDK nutzen: Integrationsanleitung mit nur base_url, Key und Modellname ändern
Bestehenden OpenAI-SDK-Code an Gemini anbinden – mit minimalen Änderungen an nur drei Konfigurationen.
14. Juni 2026 · 9 Min. Lesezeit