Ceci est un post traduit par IA.
Prix des LLM Gemini 1.5 Flash, GPT-4o et autres
- Langue de rédaction : Coréen
- •
- Pays de référence : Tous les pays
- •
- Technologies de l'information
Choisir la langue
Texte résumé par l'IA durumis
- Comparaison des performances et des prix de différents modèles d'IA tels que GPT-4o, Opus, Gemini 1.5 Pro, Haiku et Gemini 1.5 Flash, présentant les avantages et les inconvénients de chaque modèle et recommandant le modèle adapté à votre objectif d'utilisation.
- Fournit un guide de sélection des modèles d'IA optimaux pour les utilisateurs, en tenant compte de la taille des jetons d'entrée, du taux de sortie et de la complexité des tâches.
- S'appuyant sur les performances et les informations de prix des modèles d'IA les plus récents au 30 mai 2024, ce document vise à aider les utilisateurs à faire des choix judicieux.
Google et OpenAI ont récemment publié une avalanche de nouvelles informations sur l'IA lors de deux journées consécutives.
Les gens se demandent généralement deux choses principales.
Les performances et le prix. (Bien sûr, il existe de nombreuses autres fonctionnalités, mais ce sont les blogueurs professionnels qui les examinent...)
Open AI - GPT
Comme toujours chez OpenAI, le nouveau 4o est moins cher que le GPT-4T existant. Les performances sont examinées dans de nombreux autres blogs, nous passons donc à autre chose et nous ne parlons ici que du prix.
Tableau des prix GPT
OpenAI a toujours réduit les prix à chaque nouvelle version depuis la sortie de GPT 4, après GPT 3.5 Turbo. Bien sûr, les performances ont été améliorées. Actuellement, si vous devez choisir l'option la moins chère, choisissez 3.5 Turbo. Sinon, 4o devrait faire l'affaire.
Anthropic - Claude 3
Tableau des prix Claude 3
Anthropic n'a pas sorti de nouveaux produits récemment, mais Haiku, qui peut être utilisé pour sa rentabilité, et Opus, qui offre des performances élevées, font de cette société de LLM une exception.
Haiku, le moins cher des trois en termes de prix des jetons d'entrée, est le plus abordable pour le traitement simple de texte.
Même avant la sortie de Gemini Flash, Haiku était plus performant que Gemini 1.0 Pro, ce qui en fait un LLM très utile.
Google - Gemini
Tableau des prix Gemini
Google maintient deux systèmes de prix.
L'un est AI Studio, l'autre est Vertex AI.
AI Studio est basé sur les jetons comme les autres entreprises, tandis que Vertex AI est unique en ce qu'il est basé sur les caractères.
Si l'on considère le tableau ci-dessus, si un jeton équivaut en moyenne à moins de trois caractères (un ou deux caractères), il est moins cher d'utiliser Vertex AI. Si le jeton équivaut à trois caractères ou plus, AI Studio est moins cher. Mais en général, le nombre de caractères en anglais est évidemment plus élevé, donc AI Studio est moins cher. De nos jours, le coréen compte également souvent plusieurs caractères par jeton...
Quoi qu'il en soit, que l'on considère les jetons d'entrée ou les performances, Gemini 1.5 Flash est bien meilleur que 1.0 Pro. 1.5 Pro est plus performant pour les tâches nécessitant des performances élevées.
Globalement
Global
En termes de performances, GPT-4o > Opus > 1.5 Pro selon le critère MMLU.
Si une tâche intellectuellement complexe est nécessaire, GPT-4o. Si vous voulez utiliser quelque chose de légèrement moins cher ou si la taille des jetons dépasse 200K (Opus ne prend en charge que 200K ou moins), Gemini 1.5 Pro fera l'affaire. En réalité, vous ressentez une légère différence lorsque vous les utilisez, vous pouvez donc utiliser celui qui vous convient le mieux.
Si vous devez effectuer un grand nombre de tâches textuelles à faible coût, vous avez deux options :
Le rapport Input/Output est faible (par exemple, si vous devez entrer un grand nombre de documents et obtenir une sortie courte), Claude 3 Haiku est le plus abordable. En revanche, Haiku a des frais de sortie élevés, donc si, à l'inverse, le rapport Input/Output est élevé (par exemple, si vous entrez un texte particulier et lui demandez de le modifier), Gemini 1.5 Flash est recommandé. Dans ce cas, Flash est le moins cher en termes de frais de sortie.
Résumé et conclusion
"Je veux effectuer les tâches les plus complexes possibles, le prix ne me dérange pas." -> GPT - 4o
"Mais la taille du jeton d'entrée dépasse 128K." (GPT - 4o ne prend en charge que 128K ou moins) -> Opus
"Je besoin de hautes performances, mais à un prix plus bas ou la taille des jetons dépasse 200K." (Opus ne prend en charge que 200K ou moins) -> Gemini 1.5 Pro
J'ai besoin du LLM le moins cher possible. -> Haiku
Mais le rapport Input/Output est légèrement plus élevé en sortie ou dépasse 200K jetons. -> Gemini 1.5 Flash