- enterprise-h2ogpte/rag_benchmark/results/test_client_e2e.md at main · h2oai/enterprise-h2ogpte
- Client Code Examples, Use Cases and Benchmarks for Enterprise h2oGPTe RAG-Based GenAI Platform - h2oai/enterprise-h2ogpte
A napjainkban népszerű Anthropic Claude 3 modell már elérhető a GCP-n.
(Valójában már egy ideje elérhető.)
Még nem minden funkciója érhető el, csak a Sonnet és a Haiku használható, az Opus pedig még [Hamarosan].
Az H2O.ai RAG-ot használva a következő mutatókat mérte:
LLM-ek értékelési eredményei
Forrás:https://github.com/h2oai/enterprise-h2ogpte/blob/main/rag_benchmark/results/test_client_e2e.md
Személyes preferenciám alapján a Geminivel összehasonlítva a következő táblázatot kapjuk:
A GCP-n elérhető LLM modellek árai és RAG pontossága
A jobb szélső oszlop az előző táblázatból 5 LLM modell kiválasztásával készült.
Az ár 1 millió token bevitelére és kimenetére vonatkozik.
Csak a tokeneket tekintve a Claude 3 Haiku jelenleg a legolcsóbbnak tűnik. (Valójában a Gemini Pro ára sem volt túl magas...)
Szükséglet alapján a modellek kombinációja is használható lehet.
Hozzászólások0