- enterprise-h2ogpte/rag_benchmark/results/test_client_e2e.md at main · h2oai/enterprise-h2ogpte
- Client Code Examples, Use Cases and Benchmarks for Enterprise h2oGPTe RAG-Based GenAI Platform - h2oai/enterprise-h2ogpte
Anthropic's Claude 3, que está de moda últimamente, ahora está disponible en GCP.
(En realidad, ha estado disponible durante un tiempo.)
Todavía no se puede acceder a todas las funciones, solo están disponibles Sonnet y Haiku, mientras que Opus aún está [ Próximamente ].
Primero, H2O.ai ha evaluado los indicadores utilizando RAG, y estos son los resultados.
Resultados de la evaluación de los LLM
Fuente: https://github.com/h2oai/enterprise-h2ogpte/blob/main/rag_benchmark/results/test_client_e2e.md
Personalmente, prefiero Gemini y la siguiente tabla muestra una comparación con él.
Precios y precisión RAG de los modelos LLM disponibles en GCP
La tabla de la derecha es una selección de los 5 modelos LLM de la tabla anterior.
El precio corresponde a la entrada y salida de 1 millón de tokens para cada uno.
En términos de tokens, Claude 3 Haiku parece ser el más barato en este momento. (En realidad, Gemini Pro tampoco tenía un precio tan alto...)
Sería recomendable utilizar una combinación de los diferentes modelos según las necesidades.
Comentarios0