- enterprise-h2ogpte/rag_benchmark/results/test_client_e2e.md at main · h2oai/enterprise-h2ogpte
- Client Code Examples, Use Cases and Benchmarks for Enterprise h2oGPTe RAG-Based GenAI Platform - h2oai/enterprise-h2ogpte
Günümüzde popüler olan Anthropic'in Claude 3 modeli, artık GCP'de kullanılabilir hale geldi.
(Aslında kullanılabilir olması biraz zamandır olmuş gibi.)
Henüz tüm özellikler kullanılabilir değil, sadece Sonnet ve Haiku kullanılabiliyor, Opus ise hala [ Yakında ].
Öncelikle H2O.ai, RAG kullanarak elde ettiği ölçütleri şu şekilde paylaştı:
Büyük Dil Modellerine Göre Değerlendirme Sonuçları
Kaynak:https://github.com/h2oai/enterprise-h2ogpte/blob/main/rag_benchmark/results/test_client_e2e.md
Kişisel olarak tercih ettiğim Gemini ile karşılaştırma tablosu şöyle:
GCP'de Kullanılabilir Büyük Dil Modeli Fiyatları ve RAG Doğruluğu
En sağdaki tablo, yukarıdaki tabloda yer alan 5 LLM modelini özetleyen bir tablo.
Fiyatlar, her biri 1 milyon token için giriş ve çıkışa göre belirlenmiş.
Sadece token bazında bakıldığında, şu anda Claude 3 Haiku en uygun fiyatlı gibi görünüyor. (Aslında Gemini Pro da pahalı bir fiyat değildi...)
İhtiyaca göre farklı modelleri bir arada kullanmak faydalı olabilir.
Yorumlar0