Try using it in your preferred language.

English

  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar
translation

यह एक AI अनुवादित पोस्ट है।

해리슨 블로그

Apple का OpenELM / MS का Phi-3 / Meta का Llama 3 का खुलासा

  • लेखन भाषा: कोरियाई
  • आधार देश: सभी देश country-flag

भाषा चुनें

  • हिन्दी
  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • Magyar

durumis AI द्वारा संक्षेपित पाठ

  • Apple, Microsoft, Meta जैसी प्रमुख बड़ी तकनीकी कंपनियां हाल ही में AI उद्योग में एक बड़ा बदलाव लाते हुए नए बड़े भाषा मॉडल जारी कर रही हैं।
  • प्रत्येक कंपनी अलग-अलग मॉडल पेश कर रही है जो आकार में छोटे हैं या डेटा/एल्गोरिदम अनुकूलन, संदर्भ समझ में सुधार जैसे विभिन्न तरीकों से बेहतर हैं।
  • विशेष रूप से, Apple का OpenELM छोटे उपकरणों के लिए विकसित किया गया है, जबकि Meta का Llama 3 अपनी कुशल मॉडल संरचना के माध्यम से छोटे आकार के बावजूद उत्कृष्ट प्रदर्शन दिखाता है।

हाल ही में ध्यान देने योग्य बड़े भाषा मॉडल रिलीज़ समाचार

पिछले एक हफ्ते में ऐप्पल, माइक्रोसॉफ्ट, मेटा जैसे प्रमुख बड़े टेक कंपनियों ने लगातार नए बड़े भाषा मॉडल जारी किए हैं, जिससे एआई उद्योग में काफी हलचल मची हुई है। इस बार जारी किए गए मॉडल की प्रमुख विशेषताओं और महत्व को और विस्तार से जानते हैं।

ऐप्पल का OpenELM

25 अप्रैल को, ऐप्पल ने अपना स्वयं विकसित OpenELM भाषा मॉडल उत्पादन लाइन जारी किया। इसमें 0.27B, 0.45B, 1.08B, 3.04B जैसे चार अलग-अलग आकार के मॉडल शामिल हैं, जिनमें सबसे बड़ा मॉडल भी केवल 3 अरब पैरामीटर का है, जो अपेक्षाकृत छोटा है। वर्तमान में अधिकांश बड़े भाषा मॉडल में कम से कम 3B से अधिक पैरामीटर हैं, इसलिए OpenELM को बहुत छोटा आकार माना जा सकता है।
ऐसा इसलिए है क्योंकि ऐप्पल ने OpenELM को मुख्य रूप से छोटे उपकरणों में स्थापित करने और उपयोग करने का लक्ष्य रखकर विकसित किया है। अतीत में, पैरामीटर की संख्या को बढ़ाना उच्च प्रदर्शन प्राप्त करने का मुख्य तरीका था, लेकिन हाल के वर्षों में, छोटा करने और हल्का करने पर ध्यान केंद्रित किया जा रहा है। ऐप्पल ने इस बार मॉडल वज़न और अनुमान कोड के साथ-साथ डेटासेट और ढाँचे को भी पूरी तरह से सार्वजनिक किया है, जिससे इसकी पारदर्शिता में वृद्धि हुई है।

MS का Phi-3 सीरीज़

माइक्रोसॉफ्ट ने भी 23 अप्रैल को Phi-3 मिनी मॉडल (3.8B पैरामीटर) जारी किया और भविष्य में 7B आकार का Phi-3 स्मॉल और 14B आकार का Phi-3 मीडियम भी जारी करने की योजना है। Phi-3 मिनी एक खुला मॉडल है जिसका कोई भी मुफ्त में व्यावसायिक उपयोग कर सकता है। नए Phi-3 सीरीज़ मॉडल सभी MS की क्लाउड सेवा Azure पर उपलब्ध होंगे।

मेटा का Llama 3

मेटा (पूर्व में फेसबुक) ने 18 अप्रैल को Llama 3 मॉडल का 8B और 70B संस्करण जारी किया और बड़े आकार का 400B मॉडल गर्मियों में जारी करने की योजना है। विशेष रूप से, 8B मॉडल ने अपने छोटे आकार के बावजूद बेहतर प्रदर्शन दिखाया है, जिसके लिए डेवलपर समुदाय से सराहना मिल रही है।
यह विश्लेषण किया गया है कि यह मेटा द्वारा बड़ी मात्रा में प्रशिक्षण डेटा के इनपुट के कारण संभव हुआ है, जिससे एक कुशल मॉडल संरचना का निर्माण हुआ है। यह कहा जा सकता है कि यह पैरामीटर की संख्या को बढ़ाने के बजाय डेटा और एल्गोरिथम अनुकूलन पर ध्यान केंद्रित करने का परिणाम है।

xAI का Grok 1.5

38 मार्च को जारी xAI का Grok 1.5 मॉडल 128K तक के लंबे संदर्भ टोकन को संभाल सकता है, जिससे जटिल और लंबे प्रॉम्प्टिंग संभव हो सकते हैं। अब तक के भाषा मॉडल विकास में रुझान केवल पैरामीटर आकार को बढ़ाने पर केंद्रित था, लेकिन Grok 1.5 ने लंबे संदर्भ समझ को बेहतर बनाने के एक नए लक्ष्य को प्रस्तुत किया है।

⁠⁠⁠⁠⁠⁠⁠
इस तरह, पिछले एक हफ्ते में ऐप्पल, MS, मेटा जैसी अग्रणी कंपनियों द्वारा नए बड़े भाषा मॉडल जारी किए जाने से एआई प्रौद्योगिकी के विकास की दिशा और अधिक विविध हो गई है। मॉडल आकार को कम करना और हल्का करना, डेटा/एल्गोरिथम अनुकूलन, संदर्भ समझ को मजबूत करना जैसे कई पहलुओं में नए प्रयास किए जा रहे हैं। भविष्य में एआई पारिस्थितिकी तंत्र कैसे विकसित होगा, यह देखना दिलचस्प होगा।

해리슨
해리슨 블로그
해리슨의 깜짝 블로그
해리슨
Gemini 1.5 Flash और GPT-4o तथा अन्य LLM की कीमतें GPT-4o, Gemini 1.5 Pro, Claude 3 Haiku, Gemini 1.5 Flash जैसे नवीनतम AI मॉडल के प्रदर्शन और कीमत की तुलना करके आपको अपने लिए सही मॉडल चुनने का तरीका बताते हैं। इनपुट टोकन साइज़, आउटपुट अनुपात, कार्य कठिनाई आदि को ध्यान में रखते हुए, सबसे प्रभावी मॉडल खोजें

18 मई 2024

ChatGPT बनाम जेमिनी कीमत तुलना वर्तमान में जारी किए गए दो प्रमुख LLM सेवाओं, ChatGPT और जेमिनी की तुलना इस प्रकार है। टोकन-आधारित ChatGPT का मूल्य $0.125 प्रति मिलियन टोकन है, जबकि वर्ण-आधारित जेमिनी का मूल्य $0.125 प्रति मिलियन वर्ण के लिए इनपुट और $0.375 के लिए आउटपुट है। उदाहरण के ल

7 मार्च 2024

दुरुमिस डेवलपमेंट - भाग 3: जेमिनी प्रो दुरुमिस जेमिनी प्रो का उपयोग करके वेबसाइट URL जेनरेट करने, लेखों को सारांशित करने, विवरण बनाने, विषयों की सिफारिश करने, स्वचालित वर्गीकरण, संबंधित लेखों की सिफारिश करने जैसे विभिन्न कार्यों की पेशकश करता है।

3 फ़रवरी 2024

LLM (बड़ा भाषा मॉडल) क्या है? बड़ा भाषा मॉडल (LLM) कृत्रिम बुद्धिमत्ता की एक प्रमुख तकनीक है, जो विशाल मात्रा में पाठ डेटा को सीखता है और मानव जैसी भाषा प्रसंस्करण क्षमता विकसित करता है। चैटबॉट, अनुवाद, पाठ निर्माण आदि विभिन्न क्षेत्रों में इसका उपयोग किया जा सकता है। LLM टोकेनाइजेशन,
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1 अप्रैल 2024

ओपन सोर्स से पूरा AI फुल स्टैक AI इकोसिस्टम में नए ओपन सोर्स LLM (बड़े भाषा मॉडल) मॉडल तेजी से सामने आ रहे हैं। Mistral, Llama, phi-2 जैसे शक्तिशाली प्रदर्शन और ओपन लाइसेंस वाले मॉडल सार्वजनिक किए गए हैं, और इनका उपयोग करने के लिए विभिन्न उपकरण भी विकसित किए जा रहे हैं। LangChain, Llam
RevFactory
RevFactory
RevFactory
RevFactory

5 फ़रवरी 2024

गूगल जेमीनी अल्ट्रा स्मार्टफोन में लॉन्च गूगल ने अगले साल अपने स्मार्टफोन में क्लाउड-ओनली एआई मॉडल 'जेमीनी अल्ट्रा' को लॉन्च करने का वादा किया है। एलएलएम संपीड़न तकनीक में प्रगति से डिवाइस पर निष्पादन संभव हो गया है, जिससे स्मार्टफोन की कार्यक्षमता में भारी वृद्धि होने की उम्मीद है। मॉर्गन स्टेन
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1 अप्रैल 2024

स्नोफ्लेक ने उद्योग की अग्रणी खुलेपन वाला एंटरप्राइज़-ग्रेड LLM 'आर्कटिक' लॉन्च किया स्नोफ्लेक ने उद्योग की अग्रणी खुलेपन और प्रदर्शन वाला एक बड़ा भाषा मॉडल 'स्नोफ्लेक आर्कटिक' लॉन्च किया है। यह अपाचे 2.0 लाइसेंस के तहत मुफ्त है, वाणिज्यिक उपयोग के लिए भी उपलब्ध है, और कई फ्रेमवर्क का समर्थन करता है, जो इसे अनुकूलन योग्य बनाता है। आर्कटिक
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)

25 अप्रैल 2024

अग्रणी AI मॉडल का विरोधाभास, पारदर्शिता अत्याधुनिक AI सिस्टम की पारदर्शिता की कमी एक गंभीर समस्या के रूप में उभरी है। स्टैनफोर्ड यूनिवर्सिटी के शोधकर्ताओं ने GPT-4 सहित 10 AI सिस्टम का विश्लेषण किया परिणाम, डेटा स्रोत, प्रशिक्षण विधियाँ, ऊर्जा खपत जैसी जानकारी पारदर्शी रूप से प्रकट करने वाला को
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son

14 मई 2024

फ्लीटो, अप्स्टेज के साथ आर्टिफिशियल इंटेलिजेंस लैंग्वेज डेटा के निर्माण के लिए एक समझौता किया फ्लीटो और अप्स्टेज ने एशियाई क्षेत्र में कम संसाधन वाली भाषा डेटा के निर्माण के लिए एक सहयोग समझौते पर हस्ताक्षर किए हैं। इसके माध्यम से, दोनों कंपनियां अत्यधिक बड़े भाषा मॉडल के प्रदर्शन को बेहतर बनाने के लिए सहयोग को मजबूत करेंगी और बहुभाषी समानांतर कॉर
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)

9 मई 2024