- enterprise-h2ogpte/rag_benchmark/results/test_client_e2e.md at main · h2oai/enterprise-h2ogpte
- Client Code Examples, Use Cases and Benchmarks for Enterprise h2oGPTe RAG-Based GenAI Platform - h2oai/enterprise-h2ogpte
最近流行的 Anthropic 的 Claude 3 可以用於 GCP 了。
( 事實上可以使用已經一段時間了。)
目前還不是全部都能使用,只有 Sonnet 和 Haiku 可用,Opus 則是 [ 即将推出 ]。
首先,H2O.ai 使用 RAG 對其進行評估的指標如下。
大型語言模型評估結果
個人比較偏好的 Gemini 與其比較的表格如下。
GCP 上可用的大型語言模型的價格和 RAG 精確度
最右邊是從上表中選出的 5 個 LLM 模型。
價格分別為 100 萬個 Token 的輸入和輸出。
僅從 Token 數量來看,目前 Claude 3 Haiku 似乎最便宜。( 事實上 Gemini Pro 的價格也不算貴…)
根據需要混合使用這些模型應該會不錯。
评论0