Try using it in your preferred language.

English

  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar
translation

Ez egy AI által fordított bejegyzés.

해리슨 블로그

Az Apple OpenELM / MS Phi-3 / Meta Llama 3 nyilvánosságra hozatala

  • Írás nyelve: Koreai
  • Referencia ország: Minden ország country-flag

Válasszon nyelvet

  • Magyar
  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी

A durumis AI által összefoglalt szöveg

  • Az Apple, a Microsoft és a Meta, mint a főbb technológiai óriások, nemrégiben új nagy nyelvi modelleket hoztak nyilvánosságra, ami jelentős változást hozott az AI iparban.
  • A vállalatok a modellek méretének csökkentésével, az adatok/algoritmusok optimalizálásával és a kontextus megértésének javításával különböző módon mutatják be egyedi modelljeiket.
  • Különösen az Apple OpenELM-jét úgy fejlesztették ki, hogy alkalmas legyen a kis eszközökhöz, míg a Meta Llama 3-ja hatékony modellstruktúrája révén kisebb méretben is kiváló teljesítményt nyújt.

A legújabb figyelemre méltó nagy nyelvi modellek megjelenése

Az elmúlt egy hétben az Apple, a Microsoft és a Meta, a legnagyobb technológiai vállalatok egymás után új nagy nyelvi modelleket adtak ki, ami jelentős visszhangot váltott ki a mesterséges intelligencia iparában. Ebben a cikkben közelebbről megvizsgáljuk az újonnan kiadott modellek főbb jellemzőit és jelentőségét.

Az Apple OpenELM-je

Április 25-én az Apple bejelentette a saját fejlesztésű OpenELM nyelvi modellcsaládját. A modellcsalád négy különböző méretű modellből áll: 0,27B, 0,45B, 1,08B és 3,04B. A legnagyobb modell is csak 3 milliárd paramétert tartalmaz, ami viszonylag kicsi a mai nagy nyelvi modellekhez képest. Tekintettel arra, hogy a legtöbb nagy nyelvi modell legalább 3 milliárd paraméterrel rendelkezik, az OpenELM-et rendkívül kis méretűnek lehet nevezni.
Ez annak köszönhető, hogy az Apple főként kis eszközökön történő használatra tervezte az OpenELM-et. Korábban a paraméterek számának növelése volt a nagy teljesítmény elérése fő módja, de a közelmúltban a hangsúly a méretcsökkentésre és a könnyűség megőrzésére helyeződött át. Az Apple ebben a kiadásban a modell súlyait és a következtetési kódot is nyilvánosságra hozta, de nemcsak a modell súlyait és a következtetési kódot, hanem az adatkészletet és a keretrendszert is, ezzel növelve az nyitottságot.

A MS Phi-3 sorozata

A Microsoft is kiadott egy Phi-3 Mini modellt (3,8 milliárd paraméter) április 23-án, és a tervek szerint később megjelenik a 7 milliárd paraméteres Phi-3 Small és a 14 milliárd paraméteres Phi-3 Medium is. A Phi-3 Mini egy nyílt modell, amelyet bárki szabadon felhasználhat kereskedelmi célokra. Az új Phi-3 sorozat modelleit a MS Azure felhőszolgáltatása fogja biztosítani.

A Meta Llama 3-ja

A Meta (korábban Facebook) április 18-án adta ki a Llama 3 modell 8B és 70B verzióját, a 400B modell nyáron fog megjelenni. Különösen az 8B modell kapott elismerést a fejlesztői közösségtől, mivel kis mérete ellenére kiemelkedő teljesítményt nyújt.
Ezt azzal magyarázzák, hogy a Meta hatalmas mennyiségű képzési adatot használt fel egy hatékony modellstruktúra létrehozásához. Ahelyett, hogy növelnék a paraméterek számát, a Meta inkább az adatok és az algoritmusok optimalizálására koncentrált.

Az xAI Grok 1.5-je

Az xAI Grok 1.5 modelljét március 38-án mutatták be, és képes legfeljebb 128K hosszú kontextus token feldolgozására, ami lehetővé teszi a bonyolult és hosszú prompt használatát. Míg a korábbi nyelvi modellek fejlesztése elsősorban a paraméterek számának növelésére összpontosított, a Grok 1.5 új irányt mutat a hosszú kontextus megértésének fejlesztésével.

⁠⁠⁠⁠⁠⁠⁠
Az elmúlt egy hétben az Apple, a MS és a Meta, a vezető vállalatok új nagy nyelvi modelleinek megjelenése a mesterséges intelligencia technológia fejlődésének sokszínűségét mutatja. A modellméret csökkentése és a könnyűség megőrzése, az adatok/algoritmusok optimalizálása, valamint a kontextus megértésének javítása a legújabb fejlesztésekben felbukkanó új trendek. Izgalmas lesz látni, hogyan fog fejlődni a mesterséges intelligencia ökoszisztéma a jövőben.

해리슨
해리슨 블로그
해리슨의 깜짝 블로그
해리슨
A Gemini 1.5 Flash, GPT-4o és más LLM-ek árai A GPT-4o, a Gemini 1.5 Pro, a Claude 3 Haiku, a Gemini 1.5 Flash és más legújabb AI-modellek teljesítményének és árainak összehasonlítása, hogy megtalálja az Önnek megfelelő modellt. Találja meg a leghatékonyabb modellt a bemeneti tokenek számának, a kime

2024. május 18.

Legújabb, ajánlott mesterséges intelligencia szolgáltatások Bemutatjuk a legújabb és legérdekesebb mesterséges intelligencia szolgáltatásokat, amelyeket ajánlunk. A ChatGPT és a Gemini mellett a NotebookLM és a Perplexity AI is szerepel a listán, amelyek növelik a munka hatékonyságát. A NotebookLM a Google által k

2024. június 23.

ChatGPT vs Gemini ár összehasonlítás Jelenleg a két fő nyilvánosan elérhető LLM szolgáltatás, a ChatGPT és a Gemini összehasonlítása. A tokeneken alapuló ChatGPT 0,125 dollár/1 millió token, a karaktereken alapuló Gemini 0,125 dollár/1 millió karakter bevitel esetén, és 0,375 dollár/1 millió

2024. március 7.

A Google Gemini Ultra okostelefonba való beépítése A Google bejelentette, hogy a jövő évi okostelefonjaiba beépíti a „Gemini Ultra” nevű, felhőalapú mesterséges intelligencia modelljét. Az LLM-ek tömörítési technológiájának fejlődésével a modell a készüléken belül is futtatható, így az okostelefonok funkc
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

2024. április 1.

Nyílt forráskódú AI teljes verem Az AI ökoszisztémában egyre több nyílt forráskódú LLM (nagy nyelvi modell) jelenik meg. Megjelentek a Mistral, a Llama és a phi-2, amelyek erőteljes teljesítményt és nyílt licencet kínálnak, és a használatukhoz számos eszköz is fejlesztés alatt áll. A Lan
RevFactory
RevFactory
RevFactory
RevFactory

2024. február 5.

A Snowflake bemutatta az Arctic-ot, az iparág legjobb nyitottságú, vállalati szintű LLM-jét A Snowflake kiadta az Arctic nevű nyílt forráskódú, nagyméretű nyelvi modellt. Az Apache 2.0 licenc alatt ingyenesen kereskedelmi célra is felhasználható, és az iparág legjobb teljesítményével és hatékonyságával büszkélkedhet. Kiemelkedő token-hatékonyság
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)

2024. április 25.

Mi az LLM (Nagy Nyelvi Modell)? A nagy nyelvi modellek (LLM) a mesterséges intelligencia kulcsfontosságú technológiái, amelyek hatalmas mennyiségű szöveges adatot tanulnak meg, hogy emberhez hasonló nyelvi feldolgozási képességeket szerezzenek, és felhasználhatók chatbotként, fordításho
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

2024. április 1.

Google Gemini 1.5 vs 1.5 Pro összehasonlítása (példákkal) A Gemini 1.5 Pro egy erősebb AI modell, mint a Gemini 1.5, amelyet különféle feladatokra lehet használni, például kód elemzésére, automatikus egységteszt-generálásra, kódátalakításra. Különösen nagy adathalmazok feldolgozásához és összetett feladatokhoz a
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

2024. június 28.

A Flitto és az Upstage együttműködési megállapodást kötött a mesterséges intelligencia nyelvi adatok létrehozásáról A Flitto és az Upstage együttműködési megállapodást kötött a kevésbé támogatott ázsiai nyelvek adatainak létrehozására. Ennek révén a két vállalat megerősíti a nagyméretű nyelvi modellek (LLM) teljesítményének javítására irányuló együttműködését, és a töb
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)

2024. május 9.