OpenAI SDK से Gemini API कॉल करें: केवल base_url, API Key और मॉडल नाम बदलने वाला माइग्रेशन ट्यूटोरियल

2026-06-14 तक, Google के Gemini OpenAI compatibility दस्तावेज़ बहुत सीधे हैं: अगर आपके पास पहले से Python या TypeScript की OpenAI लाइब्रेरी वाला कोड है, तो API Key, base_url और मॉडल नाम बदलकर Gemini से जोड़ा जा सकता है; दस्तावेज़ में उदाहरण मॉडल gemini-3.5-flash है, और compatibility पेज आख़िरी बार 2026-05-18 को अपडेट हुआ था（Google AI for Developers）。यह कोई “adapter layer magic” नहीं है, बस OpenAI SDK की request को Google द्वारा दिए गए compatible endpoint पर भेजना है।

ऑफ-व्हाइट बैकग्राउंड पर तीन-चरणों वाला migration flowchart, बाएँ से दाएँ तीन टेराकोटा रंग के step cards: GEMINI_API_KEY बदलें, base_url बदलें, model बदलें; नीचे charcoal gray पतली रेखा से Python, TypeScript, REST तीन entrances जुड़े हुए

पहले SDK इंस्टॉल करें, calling paradigm न बदलें

अगर आपका प्रोजेक्ट पहले से official OpenAI Python SDK इस्तेमाल कर रहा है, तो chat.completions.create() को वैसे ही रखें। OpenAI का Python SDK repository अभी भी official client source है（openai-python）, और Google compatible interface भी इसी calling shape को स्वीकार करता है।

from openai import OpenAI

client = OpenAI(
    api_key="GEMINI_API_KEY",
    base_url="https://generativelanguage.googleapis.com/v1beta/openai/",
)

resp = client.chat.completions.create(
    model="gemini-3.5-flash",
    messages=[
        {"role": "system", "content": "You are a concise code reviewer."},
        {"role": "user", "content": "Review this Python function for edge cases."},
    ],
)

print(resp.choices[0].message.content)

API Key Google AI Studio से बनाएं（AI Studio API key）。अंत का slash ध्यान दें: /v1beta/openai/, यह सामान्य Gemini native interface वाला /v1beta/models/... नहीं है।

REST को भी OpenAI shape में call किया जा सकता है

Server side, curl debugging, gateway health check—हर जगह SDK ज़रूरी नहीं। Google compatibility docs में दिया गया REST path /openai/chat/completions है:

curl "https://generativelanguage.googleapis.com/v1beta/openai/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $GEMINI_API_KEY" \
  -d '{
    "model": "gemini-3.5-flash",
    "messages": [
      {"role": "user", "content": "Give me a 5-point migration checklist."}
    ]
  }'

Migration के समय पहले यही command चलाएँ। यह Key, model name, network egress और billing permission—इन चार तरह की समस्याओं को अलग-अलग कर देता है, और business service में सीधे debug करने से समय बचाता है।

reasoning_effort कैसे map होता है

Gemini का thinking control और OpenAI का reasoning_effort कुछ हद तक overlap करते हैं। Google ने साफ़ कहा है कि दोनों को एक साथ न भेजें। Compatibility layer OpenAI style parameters को Gemini thinking parameters में map कर देती है（Google OpenAI compatibility）。

OpenAI `reasoning_effort`	Gemini 3 thinking_level	Gemini 2.5 thinking_budget
`minimal`	`minimal` या `low`	`1024`
`low`	`low`	`1024`
`medium`	`medium`	`8192`
`high`	`high`	`24576`

अगर conservative migration चाहिए, तो पहले reasoning_effort न भेजें और model को default value पर चलने दें। अगर cost control करनी है, तो long-context tasks में low जोड़ें, फिर output quality और token bill देखें।

Horizontal parameter mapping table की visual illustration, बाईं charcoal gray column में OpenAI reasoning_effort के चार स्तर, दाईं टेराकोटा column में Gemini thinking_level और thinking_budget, बीच में पतली रेखाओं से one-to-one correspondence

कीमत देखते समय सिर्फ़ model name न देखें

Google के official pricing page पर Gemini 2.5 Pro और Flash की standard pricing साफ़ दी गई है। Unit प्रति 1 million tokens है, और output price में thinking tokens शामिल हैं（Gemini API pricing）。

मॉडल	Input price	Output price
`gemini-2.5-pro`, prompt ≤ 200k	$1.25	$10.00
`gemini-2.5-pro`, prompt > 200k	$2.50	$15.00
`gemini-2.5-flash`, text/image/video input	$0.30	$2.50
`gemini-2.5-flash`, audio input	$1.00	$2.50

मेरी सलाह: chat, classification और lightweight code tasks के लिए पहले Flash लगाएँ; complex reasoning, long-document synthesis और code refactoring के लिए फिर Pro पर switch करें। Pro का 200k prompt threshold input और output unit price को सीधे प्रभावित करेगा, इसलिए logs, retrieval snippets और repeated system prompt को बिना सोचे-समझे सब कुछ एक साथ न भरें।

Migration checklist

OPENAI_API_KEY को GEMINI_API_KEY से बदलें, और इसे AI Studio से generate करें।
base_url को https://generativelanguage.googleapis.com/v1beta/openai/ में बदलें।
Model name को compatible Gemini model में बदलें, जैसे gemini-3.5-flash।
पहले REST curl से connectivity test करें, फिर SDK में वापस जोड़ें।
Custom reasoning_effort को temporarily रोकें, quality confirm होने के बाद फिर जोड़ें।
Input, output और thinking token cost record करें, खासकर Pro का 200k threshold।

अगर आपको Claude/GPT भी जोड़ना है

अगर सिर्फ़ Gemini जोड़ना है, तो Google का official compatibility endpoint सबसे clean है। लेकिन जैसे ही प्रोजेक्ट में Claude, GPT और Gemini सभी चाहिए हों, multiple Keys, multiple bills और multiple SDKs काफ़ी झंझट बन जाते हैं। आसान रास्ता onehop है: OpenAI/Anthropic compatible, base_url को https://api.onehop.ai/v1 में बदलें, और उसी OpenAI SDK से Claude/GPT/Gemini call कर सकते हैं; इसका मुख्य दावा official से कम कीमत, नए account पर $10 bonus, और card binding की ज़रूरत नहीं है।

from openai import OpenAI

client = OpenAI(
    api_key="ONEHOP_API_KEY",
    base_url="https://api.onehop.ai/v1",
)

resp = client.chat.completions.create(
    model="anthropic/claude-sonnet-4.5",
    messages=[{"role": "user", "content": "Refactor this API handler."}],
)
print(resp.choices[0].message.content)

अगर आप अभी सिर्फ़ multi-model access चलाना चाहते हैं, तो सीधे try कर सकते हैं: onehop पर Claude आदि models call करें, या पहले credit लें: signup करते ही $10 trial credit। Migration की कुंजी abstraction layers का ढेर बदलना नहीं है, बल्कि variables को तीन चीज़ों में समेटना है: endpoint, key, model।

OpenAI SDK से Gemini API कॉल करें: केवल base_url, API Key और मॉडल नाम बदलने वाला माइग्रेशन ट्यूटोरियल

पहले SDK इंस्टॉल करें, calling paradigm न बदलें

REST को भी OpenAI shape में call किया जा सकता है

reasoning_effort कैसे map होता है

कीमत देखते समय सिर्फ़ model name न देखें

Migration checklist

अगर आपको Claude/GPT भी जोड़ना है

संबंधित लेख

DashScope Compatible Mode के ज़रिए OpenAI SDK से Qwen3.7 Plus कॉल करें

OpenAI SDK के साथ Groq GPT-OSS 120B इस्तेमाल करें: Base URL, Pricing और Caching

OpenAI SDK से Gemini API कॉल करें: केवल base_url, key और मॉडल नाम बदलकर इंटीग्रेशन ट्यूटोरियल