Try using it in your preferred language.

English

  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar

Выход из системы

translation

Это сообщение переведено AI.

해리슨 블로그

Цены на Gemini 1.5 Flash, GPT-4o и другие LLM

  • Язык написания: Корейский
  • Базовая страна: Все страны country-flag

Выбрать язык

  • Русский
  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar

Текст, резюмированный ИИ durumis

  • Сравнительный анализ производительности и цен на различные модели ИИ, такие как GPT-4o, Opus, Gemini 1.5 Pro, Haiku, Gemini 1.5 Flash, с указанием плюсов и минусов каждой модели, а также рекомендациями по выбору модели в зависимости от цели использования.
  • Предоставление пользователям руководства по выбору оптимальной модели ИИ, учитывая размер входных токенов, выходной коэффициент и сложность задач.
  • По состоянию на 30 мая 2024 года, на основе информации о производительности и цене новейших моделей ИИ, мы помогаем пользователям сделать разумный выбор.

В последние два дня Google и OpenAI представили огромное количество новых материалов, связанных с искусственным интеллектом.

Обычно людей интересует два основных момента:

Производительность и цена. (Конечно, есть много других функций, но их уже обозревают профессиональные блогеры...)

Open AI - GPT

Как обычно, OpenAI снизил цену на новый 4o по сравнению с предыдущим GPT-4T. Производительность - это то, что можно найти в большом количестве обзоров, так что мы просто рассмотрим цену.

Прайс-лист GPT


По сути, Open AI снижал цену каждый раз, когда выпускал новую модель после GPT 3.5 Turbo и первого выхода GPT 4. Конечно, производительность была повышена. На данный момент, если вы хотите выбрать наиболее дешевый вариант, то вам следует воспользоваться 3.5 Turbo. В остальных случаях лучше использовать 4o.


Anthopic - Claude 3

Прайс-лист Claude 3

В последнее время Anthropic не выпускал новых продуктов, но их Haiku, который можно использовать с точки зрения цены, и высокопроизводительный Opus - это LLM-компании, которые нельзя игнорировать.

Haiku, самая дешевая из трех по цене за входной токен, идеальна для простой обработки текста.

Более того, до появления Gemini Flash Haiku был даже более производительным, чем Gemini 1.0 Pro, поэтому он очень полезен.


Google - Gemini

Прайс-лист Gemini

Google поддерживает две системы ценообразования.

Одна - AI Studio, а другая - Vertex AI.

AI Studio, как и у других компаний, использует ценообразование на основе токенов, а Vertex AI - уникальную систему, основанную на количестве символов.

Если ориентироваться на таблицу выше, то в случае, когда 1 токен равен менее чем 3 символам (1-2 символа), Vertex AI будет дешевле. В случае более 3 символов AI Studio будет дешевле. Но, как правило, в английском языке количество символов, естественно, больше, поэтому AI Studio дешевле. В корейском языке тоже сейчас часто 1 токен соответствует нескольким символам...

В любом случае, если говорить только о входных токенах или производительности, то Gemini 1.5 Flash значительно лучше 1.0 Pro. Для высокопроизводительных задач лучше использовать 1.5 Pro.


Итоги

Обзор

Если говорить только о производительности, то по MMLU GPT-4o > Opus > 1.5 Pro.

Для сложных интеллектуальных задач используйте GPT-4o. Если вы хотите использовать более дешевую модель или вам нужна модель, которая обрабатывает более 200K токенов (Opus поддерживает только до 200K токенов), то вам подойдет Gemini 1.5 Pro. На практике эти модели могут ощущаться немного по-разному, поэтому используйте ту, которая вам больше подходит.

Если вам нужно выполнить работу с большим количеством текста недорого, у вас есть два варианта:

Если соотношение входных и выходных данных низкое (например, если вам нужно ввести большой объем документов и получить короткий результат), то Claude 3 Haiku является самым дешевым вариантом. С другой стороны, у Haiku высокая стоимость вывода, поэтому в случае, если соотношение входных и выходных данных высокое (например, если вам нужно ввести определенный текст, а затем изменить его), то мы рекомендуем Gemini 1.5 Flash. В этом случае Flash будет самым дешевым вариантом по стоимости вывода.


Резюме и вывод

"Цена не имеет значения, мне нужно выполнить самую сложную работу." -> GPT - 4o

"Но размер входных токенов превышает 128K." (GPT - 4o поддерживает только до 128K) -> Opus

"Мне нужна высокая производительность, но более низкая цена, или размер токена превышает 200K." (Opus поддерживает только до 200K) -> Gemini 1.5 Pro


Мне нужна самая дешевая LLM. -> Haiku

Но в соотношении входных и выходных данных выходные данные немного больше, или размер токена превышает 200K. -> Gemini 1.5 Flash


해리슨
해리슨 블로그
해리슨의 깜짝 블로그
해리슨
Сравнение цен Claude 3 и Gemini Модель Anthropic Claude 3 Haiku теперь доступна в GCP, и по результатам оценки, проведенной H2O.ai с использованием RAG, она демонстрирует лучшие показатели цена/качество по сравнению с Gemini. Claude 3 Haiku является наиболее доступным вариантом, исходя

7 апреля 2024 г.

Сравнение цен ChatGPT и Gemini Сравниваются два основных сервиса LLM, ChatGPT и Gemini, доступных в настоящее время. ChatGPT, основанный на токенах, стоит $0,125 за миллион токенов, Gemini, основанный на символах, взимает $0,125 за миллион символов ввода и $0,375 за миллион символов вы

7 марта 2024 г.

Последние AI-сервисы, которые стоит попробовать Представляем вам лучшие и рекомендованные AI-сервисы. Помимо ChatGPT и Gemini, мы собрали сервисы, которые помогут вам повысить эффективность работы, такие как NotebookLM и Perplexity AI. NotebookLM - это сервис от Google, который позволяет вам искать инф

23 июня 2024 г.

Сравнение Gemini 1.5 и 1.5 Pro (с примерами) Gemini 1.5 Pro — это более мощная модель искусственного интеллекта, чем Gemini 1.5, ее можно использовать для различных задач, таких как анализ кода, автоматическое создание модульных тестов, преобразование кода и т. д. Она особенно подходит для обработки
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

28 июня 2024 г.

Полный стек ИИ на основе открытого кода В экосистеме ИИ появляются все новые модели ИИ с открытым исходным кодом (LLM). Mistral, Llama, phi-2 и другие модели с мощными возможностями и открытыми лицензиями были опубликованы, а также разрабатываются различные инструменты для их использования. Lan
RevFactory
RevFactory
RevFactory
RevFactory

5 февраля 2024 г.

Парадокс ведущих моделей ИИ: прозрачность Отсутствие прозрачности в передовых системах ИИ стало серьезной проблемой. Группа исследователей из Стэнфордского университета проанализировала 10 систем ИИ, включая GPT-4, и пришла к выводу, что ни одна из них не раскрывает информацию о происхождении дан
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son

14 мая 2024 г.

Что лучше: Google Gemini или Microsoft ChatGPT? Google Gemini и ChatGPT написали письма своим возлюбленным, которые они тайно любили в течение 2 лет, в своих собственных стилях. Google Gemini предоставил письмо в виде шаблона с формальным тоном, как бы давая советы, а ChatGPT написал более подробное пи
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

24 июня 2024 г.

Встроенный в смартфон Google Gemini Ultra Google анонсировала, что в следующем году в свои смартфоны будет интегрирована облачная модель ИИ "Gemini Ultra". Развитие технологии сжатия LLM позволяет запускать её на устройствах, что значительно расширяет функциональность смартфонов. Morgan Stanley п
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1 апреля 2024 г.

Mr. Know-All – 2023.7 В июльском номере ежемесячного журнала об ИИ "Mr. Know-All" за 2023 год (№ 1) представлены новейшие технологии и тренды в области ИИ, такие как Claude 2, Azure OpenAI, LangChain, LlamaIndex. В частности, в журнале дается подробное описание LlamaIndex, поз
Pilot AISmrteasy
Pilot AISmrteasy
Pilot AISmrteasy
Pilot AISmrteasy

21 марта 2024 г.