Migrasi DeepSeek API ke deepseek-v4-flash / deepseek-v4-pro: Memilih Format Kompatibel OpenAI atau Anthropic

2026-06-14 Saat melihat DeepSeek API, hal pertama yang paling perlu diubah bukanlah prompt, melainkan nama model. Halaman harga berbahasa Mandarin DeepSeek menuliskannya dengan sangat jelas: deepseek-chat dan deepseek-reasoner akan dihentikan pada 2026/07/24 pukul 23:59 waktu Beijing; selama masa kompatibilitas, yang pertama setara dengan mode non-berpikir dari deepseek-v4-flash, sedangkan yang kedua setara dengan mode berpikir dari deepseek-v4-flash (halaman harga DeepSeek). Jika kode produksi Anda masih memakai nama lama, jangan menunggu sampai minggu terakhir.

Diagram lini masa dengan latar krem, sisi kiri menandai titik pemeriksaan saat ini 2026-06-14, sisi kanan menandai titik penghentian 2026-07-24 23:59 waktu Beijing, dihubungkan dengan panah warna terakota; nama model lama memudar abu-abu, nama model baru disorot abu arang

Pilih format antarmuka dulu: lihat ekosistem Anda, bukan keyakinan

DeepSeek sekarang menyediakan dua pintu masuk kompatibel sekaligus: format OpenAI https://api.deepseek.com, dan format Anthropic https://api.deepseek.com/anthropic (pemanggilan API pertama DeepSeek).

Saran saya sederhana:

Kondisi Anda saat ini	Pilih yang mana	Alasan
Sudah memakai OpenAI SDK, LangChain, LlamaIndex, atau Chat Completions dari Vercel AI SDK	Format OpenAI	Paling sedikit mengubah `base_url` dan `model`
Sudah memakai Anthropic SDK, Claude Code, atau struktur Messages API	Format Anthropic	Kebiasaan `system`, `messages.create`, dan `max_tokens` tetap sama
Menulis HTTP wrapper sendiri	Utamakan format OpenAI	Materi debugging lebih banyak, field lebih umum
Ingin memakai ulang toolchain Claude	Format Anthropic	DeepSeek secara eksplisit mendukung ekosistem Anthropic API (DeepSeek Anthropic API)

Satu jebakan: dalam format Anthropic, DeepSeek akan melakukan pemetaan nama model. Dokumentasi resmi menyebutkan bahwa awalan claude-opus akan dipetakan ke deepseek-v4-pro, sedangkan awalan claude-haiku atau claude-sonnet akan dipetakan ke deepseek-v4-flash. Saya tetap menyarankan untuk menulis deepseek-v4-pro atau deepseek-v4-flash secara eksplisit; jangan menyerahkan perilaku produksi pada pemetaan implisit.

Penggantian nama model: jangan lagi bergantung pada alias kompatibilitas

Tabel migrasinya hanya dua baris:

Nama model lama	Saat ini kompatibel ke	Penulisan yang disarankan
`deepseek-chat`	Mode non-berpikir `deepseek-v4-flash`	`deepseek-v4-flash` + matikan thinking
`deepseek-reasoner`	Mode berpikir `deepseek-v4-flash`	`deepseek-v4-flash` atau `deepseek-v4-pro` + aktifkan thinking

Jika sebelumnya Anda memakai deepseek-reasoner untuk code review, SQL kompleks, atau penalaran teks panjang, sekalian evaluasi deepseek-v4-pro. Jika hanya untuk layanan pelanggan, ringkasan, atau klasifikasi, deepseek-v4-flash lebih mirip pilihan default.

Diagram migrasi keluarga model, dua kartu model lama deepseek-chat dan deepseek-reasoner di sisi kiri, dua kartu model baru deepseek-v4-flash dan deepseek-v4-pro di sisi kanan, dengan jenis garis berbeda untuk menunjukkan mode non-berpikir dan mode berpikir, warna terakota menonjolkan rekomendasi

Format OpenAI: versi perubahan minimal

Format OpenAI DeepSeek tetap memakai Chat Completions. Antarmuka resmi OpenAI sendiri juga bergaya daftar pesan POST /v1/chat/completions (OpenAI API Reference), jadi sebagian besar SDK hanya perlu mengubah dua tempat.

# pip install openai
import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com",
)

resp = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=[
        {"role": "system", "content": "你是一个严谨的代码审查助手。"},
        {"role": "user", "content": "检查这段 Python 代码的潜在 bug。"},
    ],
    extra_body={"thinking": {"type": "disabled"}},
    stream=False,
)

print(resp.choices[0].message.content)

Untuk mengaktifkan mode berpikir, ubah bagian terakhir menjadi:

reasoning_effort="high",
extra_body={"thinking": {"type": "enabled"}}

Mode berpikir DeepSeek aktif secara default; di OpenAI SDK, thinking harus dimasukkan ke dalam extra_body; intensitas berpikir mendukung high dan max (mode berpikir DeepSeek). Jika rantai pemanggilan tool Anda akan mengirim balik pesan assistant, ingat satu aturan keras: untuk putaran mode berpikir yang melibatkan tool call, permintaan berikutnya harus mengirim balik reasoning_content secara lengkap, jika tidak akan mendapat 400.

Format Anthropic: sisakan pintu belakang untuk toolchain Claude

Jika Anda sudah menulis system prompt, max_tokens, dan client.messages.create() di sekitar Anthropic Messages API, cukup ganti Base URL:

# pip install anthropic
import os
import anthropic

client = anthropic.Anthropic(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com/anthropic",
)

msg = client.messages.create(
    model="deepseek-v4-pro",
    max_tokens=1000,
    system="你是一个资深后端工程师。",
    messages=[{"role": "user", "content": "给我一个 Redis 缓存穿透的修复方案。"}],
    thinking={"type": "enabled"},
    output_config={"effort": "high"},
)

print(msg.content)

Anthropic Messages API resmi juga memakai struktur messages.create ini, dengan field inti termasuk model, max_tokens, system, dan messages (Anthropic Messages API). Jadi alasan sebenarnya memilih format Anthropic bukan karena “lebih canggih”, melainkan karena lebih sedikit mengubah kode ekosistem Claude.

Estimasi biaya: hitung dulu sebagai cache miss

Halaman harga berbahasa Mandarin DeepSeek menagih per sejuta token: untuk deepseek-v4-flash, input cache hit 0,02 yuan, input cache miss 1 yuan, output 2 yuan; untuk deepseek-v4-pro, input cache hit 0,025 yuan, input cache miss 3 yuan, output 6 yuan (halaman harga DeepSeek).

Perhitungan kasar: 200M input dan 50M output per bulan, hitung dulu semuanya sebagai miss.

Model	Biaya input	Biaya output	Total
`deepseek-v4-flash`	200 yuan	100 yuan	300 yuan
`deepseek-v4-pro`	600 yuan	300 yuan	900 yuan

Tagihan nyata akan dipengaruhi oleh cache hit. Saat membuat RAG, Agent, atau system prompt panjang, letakkan prefix yang stabil di depan; setelah hit rate naik, biaya input akan turun secara signifikan. Jangan memakai angka cache paling optimistis untuk membuat anggaran pada hari pertama migrasi.

Pengguna antarmuka perantara: jika ingin praktis, bisa lewat onehop

Jika target Anda bukan hanya menghubungkan DeepSeek, melainkan mengganti Claude, GPT, dan Gemini dalam satu basis kode yang sama, onehop adalah jalur yang menghemat waktu: kompatibel dengan OpenAI/Anthropic, Base URL diganti menjadi https://api.onehop.ai/v1, akun baru mendapat $10, harga lebih rendah dari resmi, dan tidak perlu mengikat kartu.

Contoh OpenAI SDK:

from openai import OpenAI
import os

client = OpenAI(
    api_key=os.environ["ONEHOP_API_KEY"],
    base_url="https://api.onehop.ai/v1",
)

resp = client.chat.completions.create(
    model="claude-sonnet-4-5",
    messages=[{"role": "user", "content": "用三点解释这个 API 迁移计划。"}],
)
print(resp.choices[0].message.content)

Anthropic SDK juga dapat diarahkan ke Base URL yang sama:

import anthropic, os

client = anthropic.Anthropic(
    api_key=os.environ["ONEHOP_API_KEY"],
    base_url="https://api.onehop.ai/v1",
)

Untuk migrasi produksi, saya akan menjadwalkannya seperti ini: hari ini ganti nama model lama; minggu ini jalankan smoke test untuk dua jalur OpenAI/Anthropic; sebelum akhir bulan lengkapi logika pengiriman balik untuk mode berpikir dan tool call; sebelum pertengahan Juli hapus semua deepseek-chat dan deepseek-reasoner. Jika Anda ingin mengurangi pemeliharaan beberapa konfigurasi vendor, Anda bisa langsung mencoba: memanggil Claude dan model lain di onehop, atau ambil kuota dulu untuk menjalankan alur end-to-end: daftar dan langsung dapat kredit pengalaman $10.

Migrasi DeepSeek API ke deepseek-v4-flash / deepseek-v4-pro: Memilih Format Kompatibel OpenAI atau Anthropic

Pilih format antarmuka dulu: lihat ekosistem Anda, bukan keyakinan

Penggantian nama model: jangan lagi bergantung pada alias kompatibilitas

Format OpenAI: versi perubahan minimal

Format Anthropic: sisakan pintu belakang untuk toolchain Claude

Estimasi biaya: hitung dulu sebagai cache miss

Pengguna antarmuka perantara: jika ingin praktis, bisa lewat onehop

Bacaan terkait

Memanggil Qwen3.7 Plus dengan OpenAI SDK melalui DashScope Compatible Mode

Gunakan Groq GPT-OSS 120B dengan OpenAI SDK: Base URL, Harga, dan Caching

Tutorial Migrasi Memanggil Gemini API dengan OpenAI SDK: Cukup Ubah base_url, API Key, dan Nama Model