Migrasi DeepSeek API ke deepseek-v4-flash / deepseek-v4-pro: Memilih Format Kompatibel OpenAI atau Anthropic
14 Juni 2026 · 12 menit baca · Claude / GPT / Gemini / DeepSeek

2026-06-14 Saat melihat DeepSeek API, hal pertama yang paling perlu diubah bukanlah prompt, melainkan nama model. Halaman harga berbahasa Mandarin DeepSeek menuliskannya dengan sangat jelas: deepseek-chat dan deepseek-reasoner akan dihentikan pada 2026/07/24 pukul 23:59 waktu Beijing; selama masa kompatibilitas, yang pertama setara dengan mode non-berpikir dari deepseek-v4-flash, sedangkan yang kedua setara dengan mode berpikir dari deepseek-v4-flash (halaman harga DeepSeek). Jika kode produksi Anda masih memakai nama lama, jangan menunggu sampai minggu terakhir.

Pilih format antarmuka dulu: lihat ekosistem Anda, bukan keyakinan
DeepSeek sekarang menyediakan dua pintu masuk kompatibel sekaligus: format OpenAI https://api.deepseek.com, dan format Anthropic https://api.deepseek.com/anthropic (pemanggilan API pertama DeepSeek).
Saran saya sederhana:
| Kondisi Anda saat ini | Pilih yang mana | Alasan |
|---|---|---|
| Sudah memakai OpenAI SDK, LangChain, LlamaIndex, atau Chat Completions dari Vercel AI SDK | Format OpenAI | Paling sedikit mengubah base_url dan model |
| Sudah memakai Anthropic SDK, Claude Code, atau struktur Messages API | Format Anthropic | Kebiasaan system, messages.create, dan max_tokens tetap sama |
| Menulis HTTP wrapper sendiri | Utamakan format OpenAI | Materi debugging lebih banyak, field lebih umum |
| Ingin memakai ulang toolchain Claude | Format Anthropic | DeepSeek secara eksplisit mendukung ekosistem Anthropic API (DeepSeek Anthropic API) |
Satu jebakan: dalam format Anthropic, DeepSeek akan melakukan pemetaan nama model. Dokumentasi resmi menyebutkan bahwa awalan claude-opus akan dipetakan ke deepseek-v4-pro, sedangkan awalan claude-haiku atau claude-sonnet akan dipetakan ke deepseek-v4-flash. Saya tetap menyarankan untuk menulis deepseek-v4-pro atau deepseek-v4-flash secara eksplisit; jangan menyerahkan perilaku produksi pada pemetaan implisit.
Penggantian nama model: jangan lagi bergantung pada alias kompatibilitas
Tabel migrasinya hanya dua baris:
| Nama model lama | Saat ini kompatibel ke | Penulisan yang disarankan |
|---|---|---|
deepseek-chat |
Mode non-berpikir deepseek-v4-flash |
deepseek-v4-flash + matikan thinking |
deepseek-reasoner |
Mode berpikir deepseek-v4-flash |
deepseek-v4-flash atau deepseek-v4-pro + aktifkan thinking |
Jika sebelumnya Anda memakai deepseek-reasoner untuk code review, SQL kompleks, atau penalaran teks panjang, sekalian evaluasi deepseek-v4-pro. Jika hanya untuk layanan pelanggan, ringkasan, atau klasifikasi, deepseek-v4-flash lebih mirip pilihan default.

Format OpenAI: versi perubahan minimal
Format OpenAI DeepSeek tetap memakai Chat Completions. Antarmuka resmi OpenAI sendiri juga bergaya daftar pesan POST /v1/chat/completions (OpenAI API Reference), jadi sebagian besar SDK hanya perlu mengubah dua tempat.
# pip install openai
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ["DEEPSEEK_API_KEY"],
base_url="https://api.deepseek.com",
)
resp = client.chat.completions.create(
model="deepseek-v4-flash",
messages=[
{"role": "system", "content": "你是一个严谨的代码审查助手。"},
{"role": "user", "content": "检查这段 Python 代码的潜在 bug。"},
],
extra_body={"thinking": {"type": "disabled"}},
stream=False,
)
print(resp.choices[0].message.content)
Untuk mengaktifkan mode berpikir, ubah bagian terakhir menjadi:
reasoning_effort="high",
extra_body={"thinking": {"type": "enabled"}}
Mode berpikir DeepSeek aktif secara default; di OpenAI SDK, thinking harus dimasukkan ke dalam extra_body; intensitas berpikir mendukung high dan max (mode berpikir DeepSeek). Jika rantai pemanggilan tool Anda akan mengirim balik pesan assistant, ingat satu aturan keras: untuk putaran mode berpikir yang melibatkan tool call, permintaan berikutnya harus mengirim balik reasoning_content secara lengkap, jika tidak akan mendapat 400.
Format Anthropic: sisakan pintu belakang untuk toolchain Claude
Jika Anda sudah menulis system prompt, max_tokens, dan client.messages.create() di sekitar Anthropic Messages API, cukup ganti Base URL:
# pip install anthropic
import os
import anthropic
client = anthropic.Anthropic(
api_key=os.environ["DEEPSEEK_API_KEY"],
base_url="https://api.deepseek.com/anthropic",
)
msg = client.messages.create(
model="deepseek-v4-pro",
max_tokens=1000,
system="你是一个资深后端工程师。",
messages=[{"role": "user", "content": "给我一个 Redis 缓存穿透的修复方案。"}],
thinking={"type": "enabled"},
output_config={"effort": "high"},
)
print(msg.content)
Anthropic Messages API resmi juga memakai struktur messages.create ini, dengan field inti termasuk model, max_tokens, system, dan messages (Anthropic Messages API). Jadi alasan sebenarnya memilih format Anthropic bukan karena “lebih canggih”, melainkan karena lebih sedikit mengubah kode ekosistem Claude.
Estimasi biaya: hitung dulu sebagai cache miss
Halaman harga berbahasa Mandarin DeepSeek menagih per sejuta token: untuk deepseek-v4-flash, input cache hit 0,02 yuan, input cache miss 1 yuan, output 2 yuan; untuk deepseek-v4-pro, input cache hit 0,025 yuan, input cache miss 3 yuan, output 6 yuan (halaman harga DeepSeek).
Perhitungan kasar: 200M input dan 50M output per bulan, hitung dulu semuanya sebagai miss.
| Model | Biaya input | Biaya output | Total |
|---|---|---|---|
deepseek-v4-flash |
200 yuan | 100 yuan | 300 yuan |
deepseek-v4-pro |
600 yuan | 300 yuan | 900 yuan |
Tagihan nyata akan dipengaruhi oleh cache hit. Saat membuat RAG, Agent, atau system prompt panjang, letakkan prefix yang stabil di depan; setelah hit rate naik, biaya input akan turun secara signifikan. Jangan memakai angka cache paling optimistis untuk membuat anggaran pada hari pertama migrasi.
Pengguna antarmuka perantara: jika ingin praktis, bisa lewat onehop
Jika target Anda bukan hanya menghubungkan DeepSeek, melainkan mengganti Claude, GPT, dan Gemini dalam satu basis kode yang sama, onehop adalah jalur yang menghemat waktu: kompatibel dengan OpenAI/Anthropic, Base URL diganti menjadi https://api.onehop.ai/v1, akun baru mendapat $10, harga lebih rendah dari resmi, dan tidak perlu mengikat kartu.
Contoh OpenAI SDK:
from openai import OpenAI
import os
client = OpenAI(
api_key=os.environ["ONEHOP_API_KEY"],
base_url="https://api.onehop.ai/v1",
)
resp = client.chat.completions.create(
model="claude-sonnet-4-5",
messages=[{"role": "user", "content": "用三点解释这个 API 迁移计划。"}],
)
print(resp.choices[0].message.content)
Anthropic SDK juga dapat diarahkan ke Base URL yang sama:
import anthropic, os
client = anthropic.Anthropic(
api_key=os.environ["ONEHOP_API_KEY"],
base_url="https://api.onehop.ai/v1",
)
Untuk migrasi produksi, saya akan menjadwalkannya seperti ini: hari ini ganti nama model lama; minggu ini jalankan smoke test untuk dua jalur OpenAI/Anthropic; sebelum akhir bulan lengkapi logika pengiriman balik untuk mode berpikir dan tool call; sebelum pertengahan Juli hapus semua deepseek-chat dan deepseek-reasoner. Jika Anda ingin mengurangi pemeliharaan beberapa konfigurasi vendor, Anda bisa langsung mencoba: memanggil Claude dan model lain di onehop, atau ambil kuota dulu untuk menjalankan alur end-to-end: daftar dan langsung dapat kredit pengalaman $10.
Bacaan terkait

Gunakan Groq GPT-OSS 120B dengan OpenAI SDK: Base URL, Harga, dan Caching
Ganti satu base URL OpenAI SDK untuk menjalankan GPT-OSS 120B di Groq, estimasi biaya token cache, dan hindari kejutan biaya tool.
17 Juni 2026 · 26 menit baca

Tutorial Migrasi Memanggil Gemini API dengan OpenAI SDK: Cukup Ubah base_url, API Key, dan Nama Model
Checklist migrasi antarmuka kompatibel Gemini untuk proyek OpenAI SDK, mencakup kode, pemetaan parameter, dan harga.
14 Juni 2026 · 9 menit baca

Menggunakan OpenAI SDK untuk Memanggil Gemini API: Tutorial Integrasi dengan Hanya Mengubah base_url, key, dan Nama Model
Integrasikan kode OpenAI SDK yang sudah ada ke Gemini dengan perubahan minimal pada tiga konfigurasi saja.
14 Juni 2026 · 9 menit baca