Try using it in your preferred language.

English

  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar
translation

To jest post przetłumaczony przez AI.

해리슨 블로그

Ceny Gemini 1.5 Flash, GPT-4o i innych LLM

  • Język pisania: Koreański
  • Kraj referencyjny: Wszystkie kraje country-flag

Wybierz język

  • Polski
  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Nederlands
  • हिन्दी
  • Magyar

Tekst podsumowany przez sztuczną inteligencję durumis

  • Porównanie i analiza wydajności i cen różnych modeli AI, takich jak GPT-4o, Opus, Gemini 1.5 Pro, Haiku, Gemini 1.5 Flash, prezentując zalety i wady każdego modelu oraz rekomendując odpowiedni model w zależności od celu użytkowania.
  • Dostarczenie użytkownikom przewodnika po wyborze optymalnego modelu AI, biorąc pod uwagę rozmiar tokenów wejściowych, stosunek wyjściowy i złożoność zadania.
  • Na podstawie informacji o wydajności i cenach najnowszych modeli AI, dostępnych na dzień 30 maja 2024 r., pomożemy użytkownikom w dokonaniu rozsądnego wyboru.

W ciągu ostatnich dwóch dni Google i OpenAI ogłosiły mnóstwo nowych informacji związanych ze sztuczną inteligencją.

Ogólnie rzecz biorąc, ludzie zastanawiają się głównie nad dwiema kwestiami.

Wydajność i cena. (Oczywiście są też inne funkcje, ale o tym piszą profesjonalni blogerzy...)

Open AI - GPT

Jak zwykle w przypadku OpenAI, nowy GPT-4o jest tańszy od GPT-4T. Wydajność można znaleźć w wielu recenzjach na innych blogach, więc pomijamy ten temat, skupiając się tutaj na cenie.

Cennik GPT


Zasadniczo OpenAI obniżało cenę za każdym razem, gdy wypuszczano nową wersję po GPT 3.5 Turbo i początkowym wydaniu GPT 4. Oczywiście wydajność została ulepszona. W tej chwili, jeśli priorytetem jest niska cena, najlepszym wyborem jest 3.5 Turbo. W pozostałych przypadkach warto używać 4o.


Anthropic - Claude 3

Cennik Claude 3

Chociaż Anthropic nie wypuściło ostatnio żadnych nowych produktów, nie można pominąć tej firmy LLM ze względu na Haiku, które jest modelem o dobrym stosunku ceny do jakości, oraz Opus, który jest modelem o wysokiej wydajności.

Haiku jest najtańszym modelem spośród trzech pod względem ceny za token wejściowy, co czyni go najtańszym rozwiązaniem do prostych zadań związanych z przetwarzaniem tekstu.

Co więcej, jeszcze przed pojawieniem się Gemini Flash, Haiku był bardziej wydajny niż Gemini 1.0 Pro, co czyni go bardzo użytecznym LLM.


Google - Gemini

Cennik Gemini

Google utrzymuje dwa systemy cenowe.

Jeden to AI Studio, a drugi Vertex AI.

AI Studio, podobnie jak w przypadku innych firm, opiera się na cenach tokenów, podczas gdy Vertex AI w niezwykły sposób opiera się na cenach znaków.

Jeśli spojrzeć na powyższą tabelę, w przypadku gdy 1 token zawiera mniej niż 3 znaki (1-2 znaki), korzystanie z Vertex AI jest tańsze, a w przypadku 3 lub więcej znaków, AI Studio jest tańsze. Jednak zwykle w języku angielskim liczba znaków jest oczywiście większa, więc AI Studio jest tańsze. W języku koreańskim również coraz częściej 1 token zawiera wiele znaków, więc...

Tak czy inaczej, biorąc pod uwagę zarówno tokeny wejściowe, jak i wydajność, Gemini 1.5 Flash jest znacznie lepszy od 1.0 Pro. W przypadku bardziej wymagających zadań 1.5 Pro jest lepszy.


Podsumowanie

Podsumowanie

Biorąc pod uwagę tylko wydajność, według wskaźnika MMLU, GPT-4o > Opus > 1.5 Pro.

W przypadku bardziej złożonych zadań intelektualnych, GPT-4o. Jeśli chcesz użyć czegoś tańszego lub potrzebujesz więcej niż 200 000 tokenów, Gemini 1.5 Pro może być dobrym rozwiązaniem. W rzeczywistości różnice w użytkowaniu są odczuwalne, więc każdy powinien wybrać to, co mu najlepiej odpowiada.

Jeśli potrzebujesz taniego sposobu na przetworzenie dużych ilości tekstu, masz dwie możliwości:

W przypadku niskiegostosunku wejścia do wyjścia (np. w przypadku wprowadzenia dużej ilości dokumentów i konieczności wygenerowania krótkich wyników) najtańszym rozwiązaniem jest Claude 3 Haiku. Z drugiej strony, Haiku ma wysoką cenę za token wyjściowy, więc odwrotnie, w przypadku wysokiegostosunku wejścia do wyjścia (np. w przypadku wprowadzenia konkretnego tekstu i konieczności jego modyfikacji lub zmiany) zalecamy Gemini 1.5 Flash. W takim przypadku najtańsze jest Flash.


Podsumowanie i wnioski

"Nie obchodzi mnie cena, chcę wykonać najtrudniejsze zadanie" -> GPT - 4o

"Ale rozmiar tokenów wejściowych przekracza 128 000." (GPT-4o obsługuje tylko do 128 000 tokenów) -> Opus

"Potrzebuję wysokiej wydajności, ale chcę, aby było to tańsze, albo potrzebuję więcej niż 200 000 tokenów." (Opus obsługuje tylko do 200 000 tokenów) -> Gemini 1.5 Pro


Potrzebuję najtańszego LLM. -> Haiku

Ale stosunek wejścia/wyjścia jest bardziej korzystny dla wyjścia, lub przekracza 200 000 tokenów. -> Gemini 1.5 Flash


해리슨
해리슨 블로그
해리슨의 깜짝 블로그
해리슨
Porównanie cen Claude 3 vs Gemini Model Anthropic Claude 3 Haiku stał się dostępny w GCP. W wyniku oceny przeprowadzonej przez H2O.ai z wykorzystaniem RAG, Claude 3 okazał się bardziej opłacalny w porównaniu do Gemini. Claude 3 Haiku jest najtańszy, biorąc pod uwagę koszty wejścia i wyjśc

7 kwietnia 2024

Porównanie cen ChatGPT i Gemini Porównujemy dwa główne usługi LLM, ChatGPT i Gemini, które są obecnie dostępne. ChatGPT oparty na tokenach kosztuje 0,125 USD za milion tokenów, Gemini oparty na znakach kosztuje 0,125 USD za milion znaków w przypadku wprowadzania i 0,375 USD za milion zn

7 marca 2024

Najnowsze usługi AI warte polecenia Prezentujemy najnowsze, popularne i godne polecenia usługi AI. Oprócz ChatGPT i Gemini, przedstawiamy NotebookLM i Perplexity AI, a także inne usługi zwiększające efektywność pracy. NotebookLM to usługa oferowana przez Google, która umożliwia wyszukiwanie

23 czerwca 2024

Porównanie Gemini 1.5 vs 1.5 Pro (z przykładami) Gemini 1.5 Pro to potężniejszy model AI niż Gemini 1.5, który można wykorzystać do różnych zadań, takich jak analiza kodu, automatyczne generowanie testów jednostkowych, konwersja kodu i wiele innych. Jest szczególnie dobrze dopasowany do przetwarzania du
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

28 czerwca 2024

AI Full Stack tworzony z wykorzystaniem open source W ekosystemie AI pojawiają się coraz częściej nowe modele LLM (Large Language Models) z otwartym kodem źródłowym. Mistral, Llama, phi-2 to przykłady modeli o dużej mocy i otwartych licencjach, które zostały udostępnione publicznie. Równolegle rozwijane są
RevFactory
RevFactory
RevFactory
RevFactory

5 lutego 2024

Paradoks przełomowych modeli AI, przejrzystość Brak przejrzystości w najnowocześniejszych systemach AI stał się poważnym problemem. Naukowcy ze Stanford University przeanalizowali 10 systemów AI, w tym GPT-4, dochodząc do wniosku, że żaden z nich nie ujawnia w sposób przejrzysty informacji, takich jak
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son

14 maja 2024

Oficjalna aplikacja mobilna "Return" dla japońskiej usługi czatu AI "wrtn" dostępna w wersji iOS Return Technologies Japan wprowadziło na rynek oficjalną aplikację mobilną "Return" dla usługi czatu AI "wrtn" w AppStore. Aplikacja oferuje szeroką gamę funkcji, w tym wyszukiwanie AI, czatbota, generowanie obrazów, a także możliwość korzystania z najnow
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan

9 czerwca 2024

Nadejście ery AI, harmonia innowacji technologicznych i etyki Google i OpenAI zaprezentowały nowe modele AI, „Gemini” i „GPT-4”, pokazując rewolucyjny rozwój technologii AI. Gemini przyjmuje różne modalności jako dane wejściowe, aby podsumowywać informacje i odpowiadać na pytania, a także ma zostać zintegrowany z Go
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan

18 maja 2024

Wbudowany Google Gemini Ultra w smartfony Google zapowiedziało, że w przyszłym roku jego smartfony będą wyposażone w model AI dedykowany chmurze, „Gemini Ultra”. Postęp w dziedzinie technologii kompresji LLM umożliwia uruchomienie ich na urządzeniach, co powinno znacząco rozszerzyć możliwości sma
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1 kwietnia 2024