OpenAI SDK से Gemini API कॉल करें: केवल base_url, API Key और मॉडल नाम बदलने वाला माइग्रेशन ट्यूटोरियल
14 जून 2026 · 9 मिनट पढ़ें · Claude / GPT / Gemini

2026-06-14 तक, Google के Gemini OpenAI compatibility दस्तावेज़ बहुत सीधे हैं: अगर आपके पास पहले से Python या TypeScript की OpenAI लाइब्रेरी वाला कोड है, तो API Key, base_url और मॉडल नाम बदलकर Gemini से जोड़ा जा सकता है; दस्तावेज़ में उदाहरण मॉडल gemini-3.5-flash है, और compatibility पेज आख़िरी बार 2026-05-18 को अपडेट हुआ था(Google AI for Developers)。यह कोई “adapter layer magic” नहीं है, बस OpenAI SDK की request को Google द्वारा दिए गए compatible endpoint पर भेजना है।

पहले SDK इंस्टॉल करें, calling paradigm न बदलें
अगर आपका प्रोजेक्ट पहले से official OpenAI Python SDK इस्तेमाल कर रहा है, तो chat.completions.create() को वैसे ही रखें। OpenAI का Python SDK repository अभी भी official client source है(openai-python), और Google compatible interface भी इसी calling shape को स्वीकार करता है।
from openai import OpenAI
client = OpenAI(
api_key="GEMINI_API_KEY",
base_url="https://generativelanguage.googleapis.com/v1beta/openai/",
)
resp = client.chat.completions.create(
model="gemini-3.5-flash",
messages=[
{"role": "system", "content": "You are a concise code reviewer."},
{"role": "user", "content": "Review this Python function for edge cases."},
],
)
print(resp.choices[0].message.content)
API Key Google AI Studio से बनाएं(AI Studio API key)。अंत का slash ध्यान दें: /v1beta/openai/, यह सामान्य Gemini native interface वाला /v1beta/models/... नहीं है।
REST को भी OpenAI shape में call किया जा सकता है
Server side, curl debugging, gateway health check—हर जगह SDK ज़रूरी नहीं। Google compatibility docs में दिया गया REST path /openai/chat/completions है:
curl "https://generativelanguage.googleapis.com/v1beta/openai/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $GEMINI_API_KEY" \
-d '{
"model": "gemini-3.5-flash",
"messages": [
{"role": "user", "content": "Give me a 5-point migration checklist."}
]
}'
Migration के समय पहले यही command चलाएँ। यह Key, model name, network egress और billing permission—इन चार तरह की समस्याओं को अलग-अलग कर देता है, और business service में सीधे debug करने से समय बचाता है।
reasoning_effort कैसे map होता है
Gemini का thinking control और OpenAI का reasoning_effort कुछ हद तक overlap करते हैं। Google ने साफ़ कहा है कि दोनों को एक साथ न भेजें। Compatibility layer OpenAI style parameters को Gemini thinking parameters में map कर देती है(Google OpenAI compatibility)。
OpenAI reasoning_effort |
Gemini 3 thinking_level | Gemini 2.5 thinking_budget |
|---|---|---|
minimal |
minimal या low |
1024 |
low |
low |
1024 |
medium |
medium |
8192 |
high |
high |
24576 |
अगर conservative migration चाहिए, तो पहले reasoning_effort न भेजें और model को default value पर चलने दें। अगर cost control करनी है, तो long-context tasks में low जोड़ें, फिर output quality और token bill देखें।

कीमत देखते समय सिर्फ़ model name न देखें
Google के official pricing page पर Gemini 2.5 Pro और Flash की standard pricing साफ़ दी गई है। Unit प्रति 1 million tokens है, और output price में thinking tokens शामिल हैं(Gemini API pricing)。
| मॉडल | Input price | Output price |
|---|---|---|
gemini-2.5-pro, prompt ≤ 200k |
$1.25 | $10.00 |
gemini-2.5-pro, prompt > 200k |
$2.50 | $15.00 |
gemini-2.5-flash, text/image/video input |
$0.30 | $2.50 |
gemini-2.5-flash, audio input |
$1.00 | $2.50 |
मेरी सलाह: chat, classification और lightweight code tasks के लिए पहले Flash लगाएँ; complex reasoning, long-document synthesis और code refactoring के लिए फिर Pro पर switch करें। Pro का 200k prompt threshold input और output unit price को सीधे प्रभावित करेगा, इसलिए logs, retrieval snippets और repeated system prompt को बिना सोचे-समझे सब कुछ एक साथ न भरें।
Migration checklist
OPENAI_API_KEYकोGEMINI_API_KEYसे बदलें, और इसे AI Studio से generate करें।base_urlकोhttps://generativelanguage.googleapis.com/v1beta/openai/में बदलें।- Model name को compatible Gemini model में बदलें, जैसे
gemini-3.5-flash। - पहले REST curl से connectivity test करें, फिर SDK में वापस जोड़ें।
- Custom
reasoning_effortको temporarily रोकें, quality confirm होने के बाद फिर जोड़ें। - Input, output और thinking token cost record करें, खासकर Pro का 200k threshold।
अगर आपको Claude/GPT भी जोड़ना है
अगर सिर्फ़ Gemini जोड़ना है, तो Google का official compatibility endpoint सबसे clean है। लेकिन जैसे ही प्रोजेक्ट में Claude, GPT और Gemini सभी चाहिए हों, multiple Keys, multiple bills और multiple SDKs काफ़ी झंझट बन जाते हैं। आसान रास्ता onehop है: OpenAI/Anthropic compatible, base_url को https://api.onehop.ai/v1 में बदलें, और उसी OpenAI SDK से Claude/GPT/Gemini call कर सकते हैं; इसका मुख्य दावा official से कम कीमत, नए account पर $10 bonus, और card binding की ज़रूरत नहीं है।
from openai import OpenAI
client = OpenAI(
api_key="ONEHOP_API_KEY",
base_url="https://api.onehop.ai/v1",
)
resp = client.chat.completions.create(
model="anthropic/claude-sonnet-4.5",
messages=[{"role": "user", "content": "Refactor this API handler."}],
)
print(resp.choices[0].message.content)
अगर आप अभी सिर्फ़ multi-model access चलाना चाहते हैं, तो सीधे try कर सकते हैं: onehop पर Claude आदि models call करें, या पहले credit लें: signup करते ही $10 trial credit। Migration की कुंजी abstraction layers का ढेर बदलना नहीं है, बल्कि variables को तीन चीज़ों में समेटना है: endpoint, key, model।
संबंधित लेख

OpenAI SDK के साथ Groq GPT-OSS 120B इस्तेमाल करें: Base URL, Pricing और Caching
OpenAI SDK का base URL बदलकर Groq पर GPT-OSS 120B चलाएँ, cached token लागत आँकें और tool billing surprises से बचें।
17 जून 2026 · 25 मिनट पढ़ें

OpenAI SDK से Gemini API कॉल करें: केवल base_url, key और मॉडल नाम बदलकर इंटीग्रेशन ट्यूटोरियल
मौजूदा OpenAI SDK कोड को Gemini से जोड़ने के लिए न्यूनतम बदलाव में सिर्फ तीन कॉन्फ़िगरेशन चाहिए।
14 जून 2026 · 9 मिनट पढ़ें

OpenAI SDK से Gemini कॉल करें: सिर्फ base_url, API Key और मॉडल नाम बदलकर इंटीग्रेशन ट्यूटोरियल
Google अब OpenAI-संगत इंटरफ़ेस सपोर्ट करता है; base_url, Key और मॉडल नाम बदलकर Gemini से जुड़ें।
14 जून 2026 · 11 मिनट पढ़ें