Try using it in your preferred language.

English

  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar
translation

Esta é uma postagem traduzida por IA.

해리슨 블로그

Gemini 1.5 Flash e GPT-4o e preços de outros LLMs

  • Idioma de escrita: Coreana
  • País de referência: Todos os países country-flag

Selecionar idioma

  • Português
  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar

Texto resumido pela IA durumis

  • Analisa e compara o desempenho e o preço de vários modelos de IA, como GPT-4o, Opus, Gemini 1.5 Pro, Haiku e Gemini 1.5 Flash, apresentando as vantagens e desvantagens de cada modelo e recomendando o modelo certo para fins específicos.
  • Fornece um guia para escolher o modelo de IA ideal para o usuário, considerando o tamanho do token de entrada, a taxa de saída e a complexidade da tarefa.
  • Com base em informações de desempenho e preço dos modelos de IA mais recentes em 30 de maio de 2024, ajuda os usuários a tomar decisões inteligentes.

Neste momento, o Google e o OpenAI lançaram novos conteúdos relacionados à IA em duas sequências.

Em geral, há duas coisas que as pessoas querem saber quando usam.

Desempenho e preço. (Claro, existem muitos recursos extras, mas blogueiros profissionais cuidarão disso...)

Open AI - GPT

Como sempre com o OpenAI, o novo 4o é mais barato que o GPT-4T. O desempenho pode ser encontrado em muitos blogs, por isso, vamos ignorar aqui e focar apenas no preço.

Tabela de preços do GPT


O OpenAI sempre reduziu os preços toda vez que um novo produto era lançado após o lançamento do GPT 4, seguindo o GPT 3.5 Turbo. Claro, o desempenho é atualizado. Por enquanto, o 3.5 Turbo é o melhor para um custo mais baixo, e o 4o é recomendável para o resto.


Anthopic - Claude 3

Tabela de preços do Claude 3

Embora a Anthropic não tenha lançado novos produtos recentemente, não podemos ignorar a empresa LLM devido ao seu Haiku de alto custo-benefício e Opus de alto desempenho.

Haiku é o mais barato dos três em termos de preço de token de entrada, então é o mais barato para processar texto simples.

Até o lançamento do Gemini Flash, o Haiku era até mais poderoso que o Gemini 1.0 Pro, tornando-o um LLM muito útil.


Google - Gemini

Tabela de preços do Gemini

O Google mantém dois sistemas de preços.

Um é o AI Studio, o outro é o Vertex AI.

O AI Studio é baseado em tokens, como outras empresas, enquanto o Vertex AI é único, baseado em caracteres.

De acordo com a tabela acima, se 1 token tiver menos de 3 caracteres (1-2 caracteres) em média, o Vertex AI é mais barato e o AI Studio é mais barato se tiver 3 ou mais caracteres. Mas, o inglês é naturalmente mais longo, então o AI Studio é mais barato. O coreano também tem muitos casos em que 1 token tem vários caracteres...

De qualquer forma, o Gemini 1.5 Flash é muito melhor que o 1.0 Pro em termos de tokens de entrada ou desempenho. O 1.5 Pro é superior se você precisar de alto desempenho.


Resumo

Geral

Em termos de desempenho apenas, baseado no MMLU, GPT-4o > Opus > 1.5 Pro.

Se você precisar de tarefas altamente intelectuais, use o GPT-4o. Se precisar de algo mais barato ou se o tamanho do token for superior a 200K (Opus só suporta até 200K), o Gemini 1.5 Pro também pode ser bom. Na verdade, a sensação é ligeiramente diferente quando você o usa, então use o que melhor se adapta a você.

Se você precisar fazer muito texto a um custo baixo, existem duas opções:

Entrada em relação à saídataxa baixa (por exemplo, inserir muitos documentos e gerar uma saída curta) é o mais barato no Claude 3 Haiku. No entanto, o Haiku tem um custo de saída alto, então, inversamente, a saídataxa alta (por exemplo, inserir um texto específico e solicitar a modificação e alteração) é recomendado o Gemini 1.5 Flash. Neste caso, o Flash é o mais barato para a saída.


Resumo e conclusão

"Não me importo com o preço, só quero o melhor para tarefas complexas." ->GPT - 4o

"Mas o tamanho do meu token de entrada é superior a 128K." (GPT - 4o só suporta até 128K) ->Opus

"Eu preciso de alto desempenho, mas quero algo mais barato ou meu token é superior a 200K." (Opus só suporta até 200K) ->Gemini 1.5 Pro


Eu preciso do LLM mais barato. ->Haiku

Mas a proporção entrada/saída tem uma saída um pouco maior ou mais de 200K tokens. ->Gemini 1.5 Flash


해리슨
해리슨 블로그
해리슨의 깜짝 블로그
해리슨
Comparação de preços do Claude 3 vs Gemini O modelo Anthropic Claude 3 Haiku agora está disponível no GCP e, de acordo com uma avaliação da H2O.ai usando RAG, ele se mostrou superior ao Gemini em termos de desempenho por preço. O Claude 3 Haiku é o mais barato em termos de custos de entrada e saíd

7 de abril de 2024

Comparação de preços do ChatGPT vs Gemini Esta comparação analisa os dois principais serviços LLM atualmente lançados: ChatGPT e Gemini. O ChatGPT, baseado em tokens, é cobrado a $0,125 por 1 milhão de tokens, enquanto o Gemini, baseado em caracteres, é cobrado a $0,125 por 1 milhão de caracteres

7 de março de 2024

Serviços de IA recomendados recentemente Apresentamos os serviços de IA populares e recomendados recentemente. Excluindo o ChatGPT e o Gemini, compilamos serviços que podem aumentar sua eficiência no trabalho, incluindo NotebookLM e Perplexity AI. NotebookLM é um serviço fornecido pelo Google qu

23 de junho de 2024

Comparação do Gemini 1.5 vs 1.5 Pro (com exemplos) O Gemini 1.5 Pro é um modelo de IA mais poderoso que o Gemini 1.5, e pode ser usado para várias tarefas como análise de código, geração automática de testes unitários, conversão de código, etc. É particularmente adequado para o processamento de grandes vo
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

28 de junho de 2024

Google Gemini vs. Microsoft ChatGPT: Qual é o melhor? O Google Gemini e o ChatGPT escreveram cartas para uma pessoa amada por quem nutriam uma paixão há dois anos, cada um no seu estilo. O Google Gemini forneceu uma carta com formato de modelo, usando linguagem formal como se estivesse a dar conselhos, enqua
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

24 de junho de 2024

Integração do Google Gemini Ultra em Smartphones O Google anunciou planos para integrar seu modelo de IA exclusivo para nuvem, "Gemini Ultra", em smartphones no próximo ano. O avanço na tecnologia de compressão de LLM permitirá a execução em dispositivos, expandindo significativamente os recursos do sma
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1 de abril de 2024

Mr. Know-All 6호 - Março de 2024 Apresentamos o LM Studio, uma plataforma que permite executar LLMs de código aberto como LLaMa, Falcon, MPT e StarCoder localmente, bem como Devin, um engenheiro de software de IA, e crewAI, uma plataforma de automação multi-agente, entre outras ferrament
Pilot AISmrteasy
Pilot AISmrteasy
Pilot AISmrteasy
Pilot AISmrteasy

21 de março de 2024

Construindo um AI Full Stack com Open Source Novos modelos de LLM (Large Language Model) de código aberto estão surgindo no ecossistema de IA. Mistral, Llama e phi-2 são alguns exemplos de modelos poderosos com licenças abertas que foram lançados. Ferramentas para utilizá-los também estão sendo dese
RevFactory
RevFactory
RevFactory
RevFactory

5 de fevereiro de 2024

OpenAI lança aplicativo de desktop ChatGPT para macOS para usuários gratuitos Uma versão macOS do ChatGPT, o AI generativo oferecido pela OpenAI, foi lançada gratuitamente. Ele é compatível com macOS 14 ou superior e usa GPT-4o para fornecer uma variedade de recursos, como fazer perguntas sobre o conteúdo de imagens, conversas de v
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan

26 de junho de 2024