- enterprise-h2ogpte/rag_benchmark/results/test_client_e2e.md at main · h2oai/enterprise-h2ogpte
- Client Code Examples, Use Cases and Benchmarks for Enterprise h2oGPTe RAG-Based GenAI Platform - h2oai/enterprise-h2ogpte
Anthropic's Claude 3, qui est très populaire en ce moment, est désormais disponible sur GCP.
(En fait, il semble qu'il soit disponible depuis un certain temps.)
Toutefois, l'accès n'est pas encore complet. Seuls Sonnet et Haiku sont disponibles pour le moment, tandis qu'Opus est toujours en [ Bientôt disponible ].
Tout d'abord, voici les indicateurs d'évaluation obtenus par H2O.ai en utilisant RAG :
Résultats d'évaluation par modèle LLM
Source :https://github.com/h2oai/enterprise-h2ogpte/blob/main/rag_benchmark/results/test_client_e2e.md
Voici un tableau comparatif avec Gemini, que je préfère personnellement :
Prix et précision RAG des modèles LLM disponibles sur GCP
Le tableau de droite est une sélection des 5 modèles LLM du tableau précédent.
Le prix indiqué correspond à l'entrée et à la sortie pour 1 million de jetons.
En termes de jetons uniquement, Claude 3 Haiku semble être le plus abordable pour le moment. (En fait, Gemini Pro n'était pas non plus excessivement cher...)
Il est conseillé d'utiliser une combinaison de modèles en fonction des besoins.
Commentaires0