해리슨 블로그

Gemini 1.5 Flash, GPT-4o и другие LLM: сравнение цен

  • Язык написания: Корейский
  • Страна: Все страныcountry-flag
  • ИТ

Создано: 2024-05-18

Создано: 2024-05-18 11:24

За последние два дня Google и OpenAI анонсировали огромное количество новых разработок в области ИИ.

В целом, пользователей интересуют два основных момента.

Производительность и цена. (Конечно, есть и другие функции, но их обзор оставлю профессиональным блогерам...)

Open AI - GPT

Как обычно, OpenAI снизила цену на новую модель GPT-4o по сравнению с предыдущей версией GPT-4T. О производительности можно найти множество обзоров в других блогах, поэтому здесь я остановлюсь только на цене.

Gemini 1.5 Flash, GPT-4o и другие LLM: сравнение цен

Прайс-лист GPT


В целом, Open AI после GPT 3.5 Turbo, выпуска GPT 4 и последующих обновлений, каждый раз снижала цену. При этом, разумеется, улучшая производительность. На данный момент, если вам нужна более бюджетная модель, то лучше выбрать 3.5 Turbo. Во всех остальных случаях, стоит использовать 4o.


Anthropic - Claude 3

Gemini 1.5 Flash, GPT-4o и другие LLM: сравнение цен

Прайс-лист Claude 3

Несмотря на отсутствие новых релизов в последнее время, Anthropic нельзя игнорировать благодаря своим моделям Haiku (для оптимального соотношения цены и качества) и Opus (высокопроизводительной модели).

По цене за входной токен, Haiku является самой дешевой моделью из трех. Она отлично подходит для обработки простых текстов.

Более того, до выхода Gemini Flash, Haiku превосходила по производительности Gemini 1.0 Pro, что делало её очень полезной моделью.


Google - Gemini

Gemini 1.5 Flash, GPT-4o и другие LLM: сравнение цен

Прайс-лист Gemini

Google поддерживает две системы ценообразования.

Одна - AI Studio, другая - Vertex AI.

AI Studio, как и у других компаний, использует ценообразование на основе токенов, а Vertex AI – необычно – на основе количества символов.

Исходя из приведенной выше таблицы, если 1 токен содержит менее 3 символов (1-2 символа), то использование Vertex AI будет дешевле, а если 3 символа и более – то AI Studio. Однако, обычно английский текст содержит большее количество символов, поэтому AI Studio будет дешевле. В корейском языке, в последнее время, 1 токен также часто содержит несколько символов, поэтому...

В любом случае, если рассматривать только входные токены и производительность, Gemini 1.5 Flash значительно превосходит 1.0 Pro. Для ресурсоемких задач 1.5 Pro более предпочтительна.


Итого

Gemini 1.5 Flash, GPT-4o и другие LLM: сравнение цен

Общий обзор

Если рассматривать только производительность (по метрике MMLU), то порядок следующий: GPT-4o > Opus > 1.5 Pro.

Для сложных интеллектуальных задач подойдет GPT-4o. Если вам нужна модель с более низкой ценой, то Gemini 1.5 Pro также хороший вариант. На практике, ощущения от использования могут немного отличаться, поэтому выбирайте ту модель, которая вам больше подходит.

Если вам нужно обработать большой объем текста с минимальными затратами, то у вас есть два варианта:

Если соотношение ввода/вывода низкое (например, нужно ввести большой объем документов и получить короткий результат), то Claude 3 Haiku будет самым дешевым вариантом. Однако, у Haiku высокая стоимость вывода, поэтому, наоборот, если соотношение ввода/вывода высокое (например, нужно ввести определенный текст и дать указания по его редактированию или изменению), то я рекомендую Gemini 1.5 Flash. В этом случае, Flash – самая дешевая модель по стоимости вывода.


Резюме и вывод

"Мне нужна самая мощная модель, цена не имеет значения." -> GPT - 4o

"Но размер входных данных превышает 128K." (GPT - 4o поддерживает только до 128K) -> Opus

"Мне нужна высокопроизводительная модель, но по более низкой цене, или размер входных данных превышает 200K." (Opus поддерживает только до 200K) -> Gemini 1.5 Pro


Мне нужна самая дешевая модель ИИ. -> Haiku

Но соотношение ввода/вывода больше смещено в сторону вывода, или размер данных превышает 200K. -> Gemini 1.5 Flash


Комментарии0

Эра Gemini 2.0: AI-агенты Google на TPU — возможности мультимодальностиGemini 2.0 от Google — это мультимодальный AI-агент, способный обрабатывать текстовые и графические данные, помогая пользователям достигать своих целей. Благодаря мощным TPU он демонстрирует высокую производительность и эффективность.
Curator Danbi - Creator Story
Curator Danbi - Creator Story
Curator Danbi - Creator Story
Curator Danbi - Creator Story

December 17, 2024

Создание AI Full Stack с использованием открытого кодаМы представляем различные инструменты для построения AI Full Stack на основе открытого кода, включая LLM, инструменты вывода и обслуживания, фреймворки и решения для мониторинга. Изучите разработку AI-приложений с использованием LangChain, LlamaIndex и др
RevFactory
RevFactory
RevFactory
RevFactory

February 5, 2024

Создание мощного блога с Choi Bong-hyuk — Анализ ключевых слов поиска: резкий рост, лимиты, скачок, падение, продвижение в топЧхве Бон Хёк делится результатами анализа ключевых слов блога за сентябрь, представляя последние тренды, такие как iPhone 16, ИИ и инструменты без кода.
NEWS FDN (다큐)
NEWS FDN (다큐)
NEWS FDN (다큐)
NEWS FDN (다큐)

September 18, 2024

Google Gemini Ultra будет интегрирован в смартфоныПо сообщениям, Google планирует интегрировать свою большую языковую модель Gemini Ultra в смартфоны, начиная с следующего года. Ожидаются новые функции, такие как AI-агенты, но также остаются технические сложности.
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

April 1, 2024