Try using it in your preferred language.

English

  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar
translation

Ceci est un post traduit par IA.

해리슨 블로그

Prix des LLM Gemini 1.5 Flash, GPT-4o et autres

Choisir la langue

  • Français
  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar

Texte résumé par l'IA durumis

  • Comparaison des performances et des prix de différents modèles d'IA tels que GPT-4o, Opus, Gemini 1.5 Pro, Haiku et Gemini 1.5 Flash, présentant les avantages et les inconvénients de chaque modèle et recommandant le modèle adapté à votre objectif d'utilisation.
  • Fournit un guide de sélection des modèles d'IA optimaux pour les utilisateurs, en tenant compte de la taille des jetons d'entrée, du taux de sortie et de la complexité des tâches.
  • S'appuyant sur les performances et les informations de prix des modèles d'IA les plus récents au 30 mai 2024, ce document vise à aider les utilisateurs à faire des choix judicieux.

Google et OpenAI ont récemment publié une avalanche de nouvelles informations sur l'IA lors de deux journées consécutives.

Les gens se demandent généralement deux choses principales.

Les performances et le prix. (Bien sûr, il existe de nombreuses autres fonctionnalités, mais ce sont les blogueurs professionnels qui les examinent...)

Open AI - GPT

Comme toujours chez OpenAI, le nouveau 4o est moins cher que le GPT-4T existant. Les performances sont examinées dans de nombreux autres blogs, nous passons donc à autre chose et nous ne parlons ici que du prix.

Tableau des prix GPT


OpenAI a toujours réduit les prix à chaque nouvelle version depuis la sortie de GPT 4, après GPT 3.5 Turbo. Bien sûr, les performances ont été améliorées. Actuellement, si vous devez choisir l'option la moins chère, choisissez 3.5 Turbo. Sinon, 4o devrait faire l'affaire.


Anthropic - Claude 3

Tableau des prix Claude 3

Anthropic n'a pas sorti de nouveaux produits récemment, mais Haiku, qui peut être utilisé pour sa rentabilité, et Opus, qui offre des performances élevées, font de cette société de LLM une exception.

Haiku, le moins cher des trois en termes de prix des jetons d'entrée, est le plus abordable pour le traitement simple de texte.

Même avant la sortie de Gemini Flash, Haiku était plus performant que Gemini 1.0 Pro, ce qui en fait un LLM très utile.


Google - Gemini

Tableau des prix Gemini

Google maintient deux systèmes de prix.

L'un est AI Studio, l'autre est Vertex AI.

AI Studio est basé sur les jetons comme les autres entreprises, tandis que Vertex AI est unique en ce qu'il est basé sur les caractères.

Si l'on considère le tableau ci-dessus, si un jeton équivaut en moyenne à moins de trois caractères (un ou deux caractères), il est moins cher d'utiliser Vertex AI. Si le jeton équivaut à trois caractères ou plus, AI Studio est moins cher. Mais en général, le nombre de caractères en anglais est évidemment plus élevé, donc AI Studio est moins cher. De nos jours, le coréen compte également souvent plusieurs caractères par jeton...

Quoi qu'il en soit, que l'on considère les jetons d'entrée ou les performances, Gemini 1.5 Flash est bien meilleur que 1.0 Pro. 1.5 Pro est plus performant pour les tâches nécessitant des performances élevées.


Globalement

Global

En termes de performances, GPT-4o > Opus > 1.5 Pro selon le critère MMLU.

Si une tâche intellectuellement complexe est nécessaire, GPT-4o. Si vous voulez utiliser quelque chose de légèrement moins cher ou si la taille des jetons dépasse 200K (Opus ne prend en charge que 200K ou moins), Gemini 1.5 Pro fera l'affaire. En réalité, vous ressentez une légère différence lorsque vous les utilisez, vous pouvez donc utiliser celui qui vous convient le mieux.

Si vous devez effectuer un grand nombre de tâches textuelles à faible coût, vous avez deux options :

Le rapport Input/Output est faible (par exemple, si vous devez entrer un grand nombre de documents et obtenir une sortie courte), Claude 3 Haiku est le plus abordable. En revanche, Haiku a des frais de sortie élevés, donc si, à l'inverse, le rapport Input/Output est élevé (par exemple, si vous entrez un texte particulier et lui demandez de le modifier), Gemini 1.5 Flash est recommandé. Dans ce cas, Flash est le moins cher en termes de frais de sortie.


Résumé et conclusion

"Je veux effectuer les tâches les plus complexes possibles, le prix ne me dérange pas." -> GPT - 4o

"Mais la taille du jeton d'entrée dépasse 128K." (GPT - 4o ne prend en charge que 128K ou moins) -> Opus

"Je besoin de hautes performances, mais à un prix plus bas ou la taille des jetons dépasse 200K." (Opus ne prend en charge que 200K ou moins) -> Gemini 1.5 Pro


J'ai besoin du LLM le moins cher possible. -> Haiku

Mais le rapport Input/Output est légèrement plus élevé en sortie ou dépasse 200K jetons. -> Gemini 1.5 Flash


해리슨
해리슨 블로그
해리슨의 깜짝 블로그
해리슨
Comparaison des prix de ChatGPT et Gemini Nous comparons les deux principaux services LLM actuellement disponibles, ChatGPT et Gemini. ChatGPT, basé sur des jetons, coûte 0,125 $ pour 1 million de jetons, tandis que Gemini, basé sur des caractères, facture 0,125 $ pour 1 million de caractères en

7 mars 2024

Comparaison des prix de Claude 3 et Gemini Le modèle Claude 3 Haiku d'Anthropic est désormais disponible sur GCP, et une évaluation réalisée par H2O.ai à l'aide de RAG a montré qu'il offrait un meilleur rapport qualité-prix que Gemini. En termes de coût d'entrée et de sortie pour un million de jet

7 avril 2024

Services AI recommandés récemment Présentation des services AI recommandés et populaires. À l'exception de ChatGPT et Gemini, nous avons rassemblé des services qui peuvent améliorer l'efficacité du travail, notamment NotebookLM et Perplexity AI. NotebookLM est un service fourni par Google

23 juin 2024

Comparaison entre Gemini 1.5 et 1.5 Pro (avec exemples) Gemini 1.5 Pro est un modèle d'IA plus puissant que Gemini 1.5, pouvant être utilisé pour diverses tâches telles que l'analyse de code, la génération automatique de tests unitaires, la conversion de code, etc. Il est particulièrement adapté au traitement
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

28 juin 2024

AI Full Stack : Une réalisation open source De nouveaux modèles LLM (grands modèles linguistiques) open source apparaissent dans l'écosystème AI. Des modèles puissants comme Mistral, Llama et phi-2, dotés de performances élevées et de licences ouvertes, ont été publiés, et divers outils sont en cou
RevFactory
RevFactory
RevFactory
RevFactory

5 février 2024

Le paradoxe des modèles d'IA de pointe : la transparence Le manque de transparence des systèmes d'IA de pointe est devenu un problème grave. Des chercheurs de l'Université de Stanford ont analysé 10 systèmes d'IA, y compris GPT-4, et ont conclu qu'aucun modèle ne publiait de manière transparente des information
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son

14 mai 2024

Google Gemini contre ChatGPT de Microsoft : lequel est le meilleur ? Google Gemini et ChatGPT ont chacun écrit une lettre à une personne aimée en secret pendant deux ans, dans leur propre style. Google Gemini a proposé une lettre sous forme de modèle avec un ton conseil, utilisant une forme polie, tandis que ChatGPT a écri
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

24 juin 2024

Intégration de Google Gemini Ultra sur les smartphones Google a annoncé l'intégration de son modèle d'IA dédié au cloud, Gemini Ultra, dans ses smartphones l'année prochaine. Les progrès de la technologie de compression des LLM permettent désormais une exécution sur les appareils, ce qui devrait considérablem
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1 avril 2024

OpenAI lance une application de bureau ChatGPT macOS pour les utilisateurs gratuits La version macOS de ChatGPT, l'IA générative d'OpenAI, est désormais disponible gratuitement. Elle prend en charge macOS 14 ou supérieur et utilise GPT-4o pour proposer diverses fonctionnalités, notamment la possibilité de poser des questions sur le conte
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan

26 juin 2024