Try using it in your preferred language.

English

  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar

Выход из системы

translation

Это сообщение переведено AI.

해리슨 블로그

Открытый выпуск OpenELM от Apple / Phi-3 от MS / Llama 3 от Meta

  • Язык написания: Корейский
  • Базовая страна: Все страны country-flag

Выбрать язык

  • Русский
  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar

Текст, резюмированный ИИ durumis

  • Ведущие технологические гиганты, такие как Apple, Microsoft и Meta, недавно представили новые большие языковые модели, что вызвало значительные изменения в индустрии ИИ.
  • Каждая компания демонстрирует дифференцированные модели, используя различные методы, такие как уменьшение размера модели, оптимизация данных/алгоритмов, усиление понимания контекста.
  • В частности, OpenELM от Apple разработан для использования на небольших устройствах, а Llama 3 от Meta обладает эффективной структурой модели, благодаря которой она демонстрирует высокую производительность, несмотря на свой небольшой размер.

Последние новости о выходе крупных языковых моделей

За последнюю неделю ведущие технологические компании, такие как Apple, Microsoft и Meta, последовательно представили новые большие языковые модели, что вызвало значительный резонанс в сфере искусственного интеллекта. Давайте подробнее рассмотрим ключевые особенности и значение выпущенных моделей.

OpenELM от Apple

25 апреля Apple представила линейку языковых моделей OpenELM собственной разработки. Линейка состоит из четырех моделей разного размера: 0,27B, 0,45B, 1,08B и 3,04B. Самая большая модель имеет всего 3 миллиарда параметров, что относительно немного. Учитывая, что большинство современных больших языковых моделей имеют не менее 3 миллиардов параметров, OpenELM можно считать очень маленькой.
Это связано с тем, что Apple разрабатывала OpenELM с учетом ее использования на небольших устройствах. Раньше увеличение количества параметров было основным способом достижения высокой производительности, но в последнее время наблюдается тенденция к миниатюризации и легковесности. Apple также повысила открытость модели, опубликовав не только веса и код вывода, но и набор данных и платформу.

Серия Phi-3 от MS

Microsoft также представила 23 апреля модель Phi-3 Mini (3,8 миллиарда параметров), а в будущем планирует выпустить Phi-3 Small с 7 миллиардами параметров и Phi-3 Medium с 14 миллиардами параметров. Phi-3 Mini является открытой моделью, которую может бесплатно использовать кто угодно в коммерческих целях. Новые модели серии Phi-3 будут доступны в облачном сервисе Azure от Microsoft.

Llama 3 от Meta

Meta (бывший Facebook) 18 апреля представила версии модели Llama 3 размером 8B и 70B, а более крупная модель размером 400B планируется к выходу летом. В частности, 8B-модель демонстрирует отличную производительность для своего небольшого размера, что вызвало положительные отзывы в сообществе разработчиков.
Это объясняется тем, что Meta использовала огромный объем обучающих данных для создания эффективной структуры модели. Можно сказать, что результатом стал акцент на оптимизации данных и алгоритмов вместо увеличения количества параметров.

Grok 1.5 от xAI

Модель Grok 1.5 от xAI, представленная 38 марта, может обрабатывать длинные контекстные токены длиной до 128K, что позволяет использовать сложные и длинные запросы. Если до сих пор тенденция в разработке языковых моделей сводилась к увеличению размера параметров, то Grok 1.5 предложила новое направление - повышение понимания длинного контекста.

⁠⁠⁠⁠⁠⁠⁠
Таким образом, за последнюю неделю последовательный выпуск новых крупных языковых моделей ведущими компаниями, такими как Apple, MS и Meta, свидетельствует о том, что направления эволюции технологий ИИ становятся более разнообразными. Наблюдаются новые попытки в различных аспектах: сокращение размера моделей и их легковесность, оптимизация данных и алгоритмов, повышение понимания контекста. Будет интересно посмотреть, как в будущем будет развиваться экосистема ИИ.

해리슨
해리슨 블로그
해리슨의 깜짝 블로그
해리슨
Цены на Gemini 1.5 Flash, GPT-4o и другие LLM Сравнение производительности и цен на новейшие модели ИИ, такие как GPT-4o, Gemini 1.5 Pro, Claude 3 Haiku, Gemini 1.5 Flash. Мы расскажем, как выбрать подходящую модель. Найдите самую эффективную модель, учитывая размер входных токенов, выходной коэффи

18 мая 2024 г.

Сравнение цен ChatGPT и Gemini Сравниваются два основных сервиса LLM, ChatGPT и Gemini, доступных в настоящее время. ChatGPT, основанный на токенах, стоит $0,125 за миллион токенов, Gemini, основанный на символах, взимает $0,125 за миллион символов ввода и $0,375 за миллион символов вы

7 марта 2024 г.

Последние AI-сервисы, которые стоит попробовать Представляем вам лучшие и рекомендованные AI-сервисы. Помимо ChatGPT и Gemini, мы собрали сервисы, которые помогут вам повысить эффективность работы, такие как NotebookLM и Perplexity AI. NotebookLM - это сервис от Google, который позволяет вам искать инф

23 июня 2024 г.

Полный стек ИИ на основе открытого кода В экосистеме ИИ появляются все новые модели ИИ с открытым исходным кодом (LLM). Mistral, Llama, phi-2 и другие модели с мощными возможностями и открытыми лицензиями были опубликованы, а также разрабатываются различные инструменты для их использования. Lan
RevFactory
RevFactory
RevFactory
RevFactory

5 февраля 2024 г.

Встроенный в смартфон Google Gemini Ultra Google анонсировала, что в следующем году в свои смартфоны будет интегрирована облачная модель ИИ "Gemini Ultra". Развитие технологии сжатия LLM позволяет запускать её на устройствах, что значительно расширяет функциональность смартфонов. Morgan Stanley п
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1 апреля 2024 г.

Что такое LLM (Large Language Model)? Большая языковая модель (LLM) является ключевой технологией искусственного интеллекта, которая обучается на обширных текстовых данных и обладает способностью обработки языка, подобной человеческой. Она может использоваться в различных областях, таких как
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1 апреля 2024 г.

Snowflake выпускает Arctic, корпоративный LLM с лучшей в отрасли открытостью Snowflake выпустила открытую модель языка Arctic. Она доступна для бесплатного коммерческого использования по лицензии Apache 2.0 и отличается лучшей в отрасли производительностью и эффективностью. Arctic обеспечивает высокую эффективность токенов и выс
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)

25 апреля 2024 г.

Парадокс ведущих моделей ИИ: прозрачность Отсутствие прозрачности в передовых системах ИИ стало серьезной проблемой. Группа исследователей из Стэнфордского университета проанализировала 10 систем ИИ, включая GPT-4, и пришла к выводу, что ни одна из них не раскрывает информацию о происхождении дан
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son

14 мая 2024 г.

Сравнение Gemini 1.5 и 1.5 Pro (с примерами) Gemini 1.5 Pro — это более мощная модель искусственного интеллекта, чем Gemini 1.5, ее можно использовать для различных задач, таких как анализ кода, автоматическое создание модульных тестов, преобразование кода и т. д. Она особенно подходит для обработки
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

28 июня 2024 г.