![translation](https://cdn.durumis.com/common/trans.png)
Esta é uma postagem traduzida por IA.
Selecionar idioma
Texto resumido pela IA durumis
- Analisa e compara o desempenho e o preço de vários modelos de IA, como GPT-4o, Opus, Gemini 1.5 Pro, Haiku e Gemini 1.5 Flash, apresentando as vantagens e desvantagens de cada modelo e recomendando o modelo certo para fins específicos.
- Fornece um guia para escolher o modelo de IA ideal para o usuário, considerando o tamanho do token de entrada, a taxa de saída e a complexidade da tarefa.
- Com base em informações de desempenho e preço dos modelos de IA mais recentes em 30 de maio de 2024, ajuda os usuários a tomar decisões inteligentes.
Neste momento, o Google e o OpenAI lançaram novos conteúdos relacionados à IA em duas sequências.
Em geral, há duas coisas que as pessoas querem saber quando usam.
Desempenho e preço. (Claro, existem muitos recursos extras, mas blogueiros profissionais cuidarão disso...)
Open AI - GPT
Como sempre com o OpenAI, o novo 4o é mais barato que o GPT-4T. O desempenho pode ser encontrado em muitos blogs, por isso, vamos ignorar aqui e focar apenas no preço.
Tabela de preços do GPT
O OpenAI sempre reduziu os preços toda vez que um novo produto era lançado após o lançamento do GPT 4, seguindo o GPT 3.5 Turbo. Claro, o desempenho é atualizado. Por enquanto, o 3.5 Turbo é o melhor para um custo mais baixo, e o 4o é recomendável para o resto.
Anthopic - Claude 3
Tabela de preços do Claude 3
Embora a Anthropic não tenha lançado novos produtos recentemente, não podemos ignorar a empresa LLM devido ao seu Haiku de alto custo-benefício e Opus de alto desempenho.
Haiku é o mais barato dos três em termos de preço de token de entrada, então é o mais barato para processar texto simples.
Até o lançamento do Gemini Flash, o Haiku era até mais poderoso que o Gemini 1.0 Pro, tornando-o um LLM muito útil.
Google - Gemini
Tabela de preços do Gemini
O Google mantém dois sistemas de preços.
Um é o AI Studio, o outro é o Vertex AI.
O AI Studio é baseado em tokens, como outras empresas, enquanto o Vertex AI é único, baseado em caracteres.
De acordo com a tabela acima, se 1 token tiver menos de 3 caracteres (1-2 caracteres) em média, o Vertex AI é mais barato e o AI Studio é mais barato se tiver 3 ou mais caracteres. Mas, o inglês é naturalmente mais longo, então o AI Studio é mais barato. O coreano também tem muitos casos em que 1 token tem vários caracteres...
De qualquer forma, o Gemini 1.5 Flash é muito melhor que o 1.0 Pro em termos de tokens de entrada ou desempenho. O 1.5 Pro é superior se você precisar de alto desempenho.
Resumo
Geral
Em termos de desempenho apenas, baseado no MMLU, GPT-4o > Opus > 1.5 Pro.
Se você precisar de tarefas altamente intelectuais, use o GPT-4o. Se precisar de algo mais barato ou se o tamanho do token for superior a 200K (Opus só suporta até 200K), o Gemini 1.5 Pro também pode ser bom. Na verdade, a sensação é ligeiramente diferente quando você o usa, então use o que melhor se adapta a você.
Se você precisar fazer muito texto a um custo baixo, existem duas opções:
Entrada em relação à saídataxa baixa (por exemplo, inserir muitos documentos e gerar uma saída curta) é o mais barato no Claude 3 Haiku. No entanto, o Haiku tem um custo de saída alto, então, inversamente, a saídataxa alta (por exemplo, inserir um texto específico e solicitar a modificação e alteração) é recomendado o Gemini 1.5 Flash. Neste caso, o Flash é o mais barato para a saída.
Resumo e conclusão
"Não me importo com o preço, só quero o melhor para tarefas complexas." ->GPT - 4o
"Mas o tamanho do meu token de entrada é superior a 128K." (GPT - 4o só suporta até 128K) ->Opus
"Eu preciso de alto desempenho, mas quero algo mais barato ou meu token é superior a 200K." (Opus só suporta até 200K) ->Gemini 1.5 Pro
Eu preciso do LLM mais barato. ->Haiku
Mas a proporção entrada/saída tem uma saída um pouco maior ou mais de 200K tokens. ->Gemini 1.5 Flash