Apple の OpenELM / MS の Phi-3 / Meta の Llama 3 公開

これはAIが翻訳した投稿です。

해리슨 블로그

Apple の OpenELM / MS の Phi-3 / Meta の Llama 3 公開

作成言語: 韓国語
•
基準国: すべての国
•
IT（情報技術）

해리슨

0000-00-00 00:00:00

言語を選択

日本語
English
汉语
Español
Bahasa Indonesia
Português
Русский
한국어
Deutsch
Français
Italiano
Türkçe
Tiếng Việt
ไทย
Polski
Nederlands
हिन्दी
Magyar

durumis AIが要約した文章

Apple、Microsoft、Meta などの主要なビッグテック企業が最近、新しい大規模言語モデルを公開し、AI業界に大きな変化をもたらしている。
各企業は、モデルのサイズを小さくしたり、データ/アルゴリズムの最適化、文脈理解力の強化など、さまざまな方法で差別化されたモデルを披露している。
特に Apple の OpenELM は、小型デバイスに適するように開発されており、Meta の Llama 3 は効率的なモデル構造により、小さいサイズにもかかわらず優れた性能を発揮している。

注目すべき最近の巨大言語モデルリリースニュース

過去1週間、アップル、マイクロソフト、メタなどの主要なビッグテック企業が続々と新しい巨大言語モデルを公開し、AI業界に大きな反響を呼んでいます。今回は、リリースされたモデルの主な特徴と意義を詳しく見ていきましょう。

アップルのOpenELM

4月25日、アップルは自社開発のOpenELM言語モデル製品群を発表しました。0.27B、0.45B、1.08B、3.04B など4種類の異なるサイズのモデルで構成されていますが、最大のモデルでもわずか30億のパラメータで、比較的規模が小さいです。現在ほとんどの巨大言語モデルは、少なくとも30億以上のパラメータを持っていることを考えると、OpenELMは非常に小さいサイズと言えるでしょう。
これは、アップルがOpenELMを主に小型デバイスに搭載して活用することを念頭に置いて開発したためです。以前は、パラメータ数を増やすことが高性能達成の主要な方法でしたが、近年では小型化と軽量化に重点が置かれる傾向にあります。アップルは今回、モデルの重みと推論コードだけでなく、データセットとフレームワークまで全体を公開することで、オープン性も高めました。

MSのPhi-3シリーズ

マイクロソフトも4月23日にPhi-3 Miniモデル（38億パラメータ）を先行公開し、今後70億サイズのPhi-3 Smallと140億サイズのPhi-3 Mediumもリリースする予定です。Phi-3 Miniはオープンモデルで、誰でも無料で商用利用が可能です。新しいPhi-3シリーズモデルはすべて、MSのクラウドサービスAzureで提供される予定です。

メタのLlama 3

メタ（旧フェイスブック）は、4月18日にLlama 3モデルの80億と700億バージョンを先行公開し、大型サイズの4000億モデルは夏に公開する予定です。特に80億モデルは、小さいサイズながら優れた性能を示しており、開発者コミュニティから好評を得ています。
これは、メタが膨大な量の学習データ投入し、効率的なモデル構造を構築したためと分析されています。パラメータ数を増やす代わりにデータとアルゴリズムの最適化に注力した結果と言えるでしょう。

xAIのGrok 1.5

3月38日に発表されたxAIのGrok 1.5モデルは、最大128Kの長いコンテキストトークンを処理できるため、複雑で長いプロンプティングが可能です。これまでの言語モデル開発のトレンドが、単にパラメータサイズを大きくすることに重点が置かれていたのに対し、Grok 1.5は、長い文脈理解力の向上という新たな方向性を提示しました。

⁠⁠⁠⁠⁠⁠⁠
このように、最近1週間でアップル、MS、メタなどの大手企業による新しい巨大言語モデルのリリースが続いたことで、AI技術の進化方向がさらに多様化しています。モデルサイズの縮小と軽量化、データ/アルゴリズムの最適化、文脈理解力の強化など、さまざまな側面で新しい試みが相次いでいます。今後のAIエコシステムがどのように進化していくのか注目されます。

トピック

#AppleOpenELM
#Grok
#Llama3
#LLM
#Phi-3

durumis AIが要約した文章

Apple、Microsoft、Meta などの主要なビッグテック企業が最近、新しい大規模言語モデルを公開し、AI業界に大きな変化をもたらしている。
各企業は、モデルのサイズを小さくしたり、データ/アルゴリズムの最適化、文脈理解力の強化など、さまざまな方法で差別化されたモデルを披露している。
特に Apple の OpenELM は、小型デバイスに適するように開発されており、Meta の Llama 3 は効率的なモデル構造により、小さいサイズにもかかわらず優れた性能を発揮している。

해리슨: 해리슨 블로그; 해리슨의 깜짝 블로그

この作者の他の記事
全文表示

Gemini 1.5 Flash と GPT-4o、そしてその他のLLMの価格 GPT-4o、Opus、Gemini 1.5 Pro、Haiku、Gemini 1.5 Flashなど、さまざまなAIモデルのパフォーマンスと価格を比較し、各モデルの特徴と適したユースケースを紹介します。特に、入力トークンサイズと出力比率に基づいたモデル選択ガイドを提供します。

2024年5月18日

最近お勧めできるAIサービス最近有名でおすすめできるAIサービスを紹介します。ChatGPTとGeminiを除き、NotebookLMとPerplexity AIをはじめ、業務効率を向上させることができるサービスをまとめました。NotebookLMはGoogleが提供するサービスで、Google Drive、PDF、テキストファイル、ウェブページリンクなどを入力すると情報検索ができます。特に膨大な長さの文書から資料を探す際に役立ち、最大50万語までアップロードできます。Pe

2024年6月23日

ChatGPT 対 Gemini 価格比較現在公開されている ChatGPT と Gemini の 2 つの主要な LLM サービスを比較します。トークンベースの ChatGPT は 100 万トークンあたり $0.125、文字ベースの Gemini は 100 万文字あたり入力 $0.125、出力 $0.375 で課金されます。例）「今日の天気は？」は ChatGPT 25 トークン、Gemini 9 文字（9 トークン）で、"What is the weather like today?" は ChatGPT 7 トークン、 Gemini

2024年3月7日