해리슨 블로그

जेमिनी 1.5 फ्लैश और GPT-4o तथा अन्य LLM की कीमतें

  • लेखन भाषा: कोरियाई
  • आधार देश: सभी देशcountry-flag
  • आईटी

रचना: 2024-05-18

रचना: 2024-05-18 11:24

इस बार दो दिनों तक लगातार Google और OpenAI ने AI से जुड़ी नई सामग्री की भारी मात्रा में घोषणा की।

सामान्य तौर पर, लोगों के लिए जिन दो चीजों को जानने की उत्सुकता होती है, वे हैं:

प्रदर्शन और कीमत। (बेशक, और भी कई फीचर हैं, लेकिन उनका विवरण तो विशेष ब्लॉगर ही देंगे।)

Open AI - GPT

OpenAI हमेशा की तरह, नए GPT-4o ने मौजूदा GPT-4T की तुलना में कीमत कम कर दी है। प्रदर्शन के बारे में तो बहुत सारे ब्लॉग में ढेरों रिव्यू मिल जाएंगे, इसलिए उसे छोड़कर, यहां हम केवल कीमत पर चर्चा करेंगे।

जेमिनी 1.5 फ्लैश और GPT-4o तथा अन्य LLM की कीमतें

GPT मूल्य सूची


मूल रूप से, Open AI ने GPT 3.5 Turbo के बाद, पहले GPT 4 लॉन्च किया था, और उसके बाद से जब भी नया उत्पाद आया है, तो उसने हमेशा कीमत कम की है। बेशक, इसमें प्रदर्शन में अपग्रेड भी होता है। वर्तमान में, अगर आपको कम कीमत वाला विकल्प चुनना है तो 3.5 Turbo चुनें। बाकी मामलों में, 4o का उपयोग करना बेहतर होगा।


Anthropic - Claude 3

जेमिनी 1.5 फ्लैश और GPT-4o तथा अन्य LLM की कीमतें

क्लॉड 3 मूल्य सूची

हाल ही में Anthropic ने कोई नया उत्पाद नहीं लॉन्च किया है, लेकिन किफायती Haiku और उच्च प्रदर्शन वाले Opus के कारण यह LLM कंपनी को अनदेखा नहीं किया जा सकता।

इनपुट टोकन मूल्य के आधार पर, तीनों में से Haiku सबसे सस्ता है, और जब आपको साधारण टेक्स्ट को संभालना हो, तो यह सबसे किफायती विकल्प है।

यहां तक कि Gemini Flash आने से पहले तक, Haiku का प्रदर्शन Gemini 1.0 Pro से भी बेहतर था, इसलिए यह एक बहुत ही उपयोगी LLM है।


Google - Gemini

जेमिनी 1.5 फ्लैश और GPT-4o तथा अन्य LLM की कीमतें

जेमिनी मूल्य सूची

Google दो मूल्य प्रणालियों का उपयोग कर रहा है।

एक AI Studio है और दूसरा Vertex AI है।

AI Studio अन्य कंपनियों की तरह टोकन-आधारित मूल्य पर काम करता है, जबकि Vertex AI अजीब तरह से वर्ण-आधारित मूल्य पर काम करता है।

ऊपर दी गई तालिका को देखते हुए, अगर 1 टोकन में औसतन 3 वर्ण से कम (1-2 वर्ण) होते हैं, तो Vertex AI का उपयोग करना सस्ता होगा, और अगर 3 वर्ण या उससे ज़्यादा होते हैं, तो AI Studio सस्ता होगा। लेकिन, आमतौर पर अंग्रेज़ी में ज़्यादा वर्ण होते ही हैं, इसलिए AI Studio सस्ता होगा। हिंदी में भी अब टोकन में कई वर्ण आते हैं...

किसी भी तरह, केवल इनपुट टोकन या प्रदर्शन को देखते हुए, Gemini 1.5 Flash, 1.0 Pro से कहीं बेहतर है। अगर आपको उच्च प्रदर्शन वाला काम करने की ज़रूरत है, तो 1.5 Pro बेहतर होगा।


सारांश

जेमिनी 1.5 फ्लैश और GPT-4o तथा अन्य LLM की कीमतें

सामान्य

केवल प्रदर्शन के आधार पर, MMLU के अनुसार, GPT-4o > Opus > 1.5 Pro का क्रम लगता है।

अगर आपको उच्च स्तरीय बौद्धिक कार्य करने की ज़रूरत है, तो GPT-4o का उपयोग करें। अगर आपको थोड़ा सस्ता विकल्प चाहिए, तो Gemini 1.5 Pro का उपयोग भी किया जा सकता है। वास्तव में जब आप इनका इस्तेमाल करते हैं, तो थोड़ा अंतर महसूस होता है, इसलिए हर उपयोगकर्ता के लिए अलग-अलग उपयुक्त विकल्प होगा।

अगर आपको कम कीमत में बड़ी मात्रा में टेक्स्ट पर काम करना है, तो आपके पास दो विकल्प हैं।

इनपुट के मुकाबले आउटपुट काअनुपात कम होने पर(उदाहरण के लिए, अगर आपको बड़ी मात्रा में दस्तावेज़ इनपुट करने हैं और छोटा आउटपुट प्राप्त करना है) Claude 3 Haiku सबसे सस्ता होगा। लेकिन, Haiku में आउटपुट की कीमत ज़्यादा होती है, इसलिए, दूसरी तरफ़, आउटपुट काअनुपात ज़्यादा होने पर(उदाहरण के लिए, अगर आप कोई विशेष टेक्स्ट इनपुट करते हैं और उसे संशोधित या बदलने के निर्देश देते हैं) Gemini 1.5 Flash की सिफ़ारिश की जाती है। ऐसे मामलों में, आउटपुट की कीमत Flash में सबसे कम होती है।


सारांश और निष्कर्ष

"मुझे कीमत की परवाह नहीं है, मुझे सबसे जटिल काम करना है" -> GPT - 4o

"लेकिन, इनपुट टोकन का आकार 128K से ज़्यादा है" (GPT - 4o केवल 128K तक ही संभव है) -> Opus

"मुझे उच्च प्रदर्शन की ज़रूरत है, लेकिन कीमत कम हो या टोकन का आकार 200K से ज़्यादा हो" (Opus केवल 200K तक ही संभव है) -> Gemini 1.5 Pro


मुझे सबसे सस्ता LLM चाहिए। -> Haiku

लेकिन, इनपुट/आउटपुट अनुपात में आउटपुट थोड़ा ज़्यादा है या 200K टोकन से ज़्यादा है। -> Gemini 1.5 Flash


टिप्पणियाँ0

गूगल जेमीनी 1.5 बनाम 1.5 प्रो की तुलना (उदाहरण सहित)गूगल जेमीनी 1.5 और 1.5 प्रो के बीच अंतर और उपयोग के उद्देश्यों की तुलना करके, हम आपके कार्य के पैमाने और बजट के अनुसार उपयुक्त मॉडल चुनने में आपकी सहायता करते हैं।
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

June 28, 2024

ओपन सोर्स से पूर्ण AI फुल स्टैकओपन सोर्स AI फुल स्टैक के निर्माण के लिए विभिन्न LLM, अनुमान और सर्विंग टूल, फ्रेमवर्क और मॉनिटरिंग समाधान पेश किए गए हैं। LangChain, LlamaIndex आदि का उपयोग करके AI एप्लिकेशन विकसित करें।
RevFactory
RevFactory
RevFactory
RevFactory

February 5, 2024

अग्रणी AI मॉडल का विरोधाभास, पारदर्शिताअत्याधुनिक AI मॉडल की पारदर्शिता की कमी चिंता का विषय है, इस बीच, पुनरुत्पादनशीलता सुनिश्चित करने के लिए डेटा तक पहुँच का विस्तार महत्वपूर्ण हो गया है। विशेष रूप से AI उद्योग के एकाधिकार और सामाजिक प्रभाव को देखते हुए, पारदर्शिता अनिवार्य है।
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son

May 14, 2024

최봉혁 पत्रकार का पावर ब्लॉग बनाना - खोज कीवर्ड इनपुट विश्लेषण तेजी से बढ़ना, ऊपरी सीमा, तेजी से बढ़ना, तेजी से गिरना, शीर्ष पर प्रदर्शित होना최봉혁 पत्रकार सितंबर ब्लॉग कीवर्ड इनपुट विश्लेषण परिणाम साझा करते हुए, iPhone 16, AI, नो-कोडिंग टूल जैसे नवीनतम रुझानों को पेश करते हैं।
NEWS FDN (다큐)
NEWS FDN (다큐)
NEWS FDN (다큐)
NEWS FDN (다큐)

September 18, 2024

NVIDIA Jetson Orin Nano सुपर AI विकास - विशिष्ट विवरण गहन विश्लेषण और उपयोग के तरीकेयह लेख NVIDIA Jetson Orin Nano सुपर के गहन विश्लेषण और उपयोग के तरीकों पर प्रकाश डालता है। उत्कृष्ट AI प्रदर्शन और कम कीमत के साथ, यह रोबोटिक्स, स्मार्ट विज़न आदि विभिन्न क्षेत्रों में उपयोग किया जा सकता है।
Curator Danbi - Creator Story
Curator Danbi - Creator Story
Curator Danbi - Creator Story
Curator Danbi - Creator Story

Invalid Date

जेमिनाई 2.0 गूगल TPU AI एजेंट युग की शुरुआत - मल्टीमॉडल, क्या कर सकता है?गूगल का जेमिनाई 2.0 एक मल्टीमॉडल AI एजेंट है, जो टेक्स्ट, इमेज आदि विभिन्न प्रकार के डेटा को संसाधित करता है और उपयोगकर्ता के लक्ष्यों को प्राप्त करने में मदद करता है। इसकी ख़ासियत है TPU का उपयोग करके अद्भुत प्रदर्शन और बेहतर संदर्भ समझ क्षमता।
Curator Danbi - Creator Story
Curator Danbi - Creator Story
Curator Danbi - Creator Story
Curator Danbi - Creator Story

Invalid Date