Try using it in your preferred language.

English

  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar
translation

Dies ist ein von KI übersetzter Beitrag.

해리슨 블로그

Preise für Gemini 1.5 Flash, GPT-4o und andere LLMs

  • Schreibsprache: Koreanisch
  • Referenzland: Alle Länder country-flag

Sprache auswählen

  • Deutsch
  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar

Von durumis AI zusammengefasster Text

  • Vergleich der Leistung und Preise verschiedener KI-Modelle wie GPT-4o, Opus, Gemini 1.5 Pro, Haiku und Gemini 1.5 Flash. Es werden die Vor- und Nachteile der einzelnen Modelle vorgestellt und je nach Verwendungszweck geeignete Modelle empfohlen.
  • Ein Leitfaden zur Auswahl des optimalen KI-Modells für Benutzer unter Berücksichtigung der Größe der Eingabetoken, der Ausgabequote und der Komplexität der Aufgabe.
  • Basierend auf den Leistungs- und Preisinformationen der neuesten KI-Modelle vom 30. Mai 2024 wird Benutzern geholfen, eine fundierte Entscheidung zu treffen.

In den letzten zwei Tagen haben Google und OpenAI eine Flut neuer Ankündigungen zu künstlicher Intelligenz veröffentlicht.

Im Allgemeinen gibt es zwei Dinge, die Menschen interessiert:

Leistung und Preis. (Natürlich gibt es noch viele weitere Funktionen, aber dafür gibt es Fachblogger, die Reviews schreiben...)

Open AI - GPT

Wie immer bei OpenAI ist das neue 4o günstiger als das bestehende GPT-4T. Leistung ist ein Thema, das in vielen anderen Blogs ausführlich behandelt wird, deshalb lassen wir das hier aus. Konzentrieren wir uns zunächst auf den Preis.

GPT Preisübersicht


Grundsätzlich hat OpenAI nach der Einführung von GPT 4 immer die Preise gesenkt, wenn neue Produkte auf den Markt kamen, seit GPT 3.5 Turbo. Natürlich wurde die Leistung dabei immer verbessert. Derzeit ist es sinnvoll, sich für 3.5 Turbo zu entscheiden, wenn man einen günstigen Tarif benötigt. In allen anderen Fällen sollte man 4o verwenden.


Anthropic - Claude 3

Claude 3 Preisübersicht

Anthropic hat zwar in letzter Zeit keine neuen Produkte angekündigt, aber Haiku, das ein gutes Preis-Leistungs-Verhältnis bietet, und Opus, das Hochleistungsfähig ist, machen das Unternehmen zu einem wichtigen Akteur im Bereich der LLM.

Haiku, das im Vergleich der drei Unternehmen den günstigsten Preis pro Eingabe-Token hat, ist die günstigste Option für die einfache Verarbeitung von Texten.

Bis zum Erscheinen von Gemini Flash war Haiku sogar leistungsstärker als Gemini 1.0 Pro, was es zu einem sehr nützlichen LLM macht.


Google - Gemini

Gemini Preisübersicht

Google betreibt zwei Preissysteme.

Einerseits AI Studio, andererseits Vertex AI.

AI Studio basiert wie bei anderen Unternehmen auf einem Token-basierten Preismodell, während Vertex AI auf einem besonderen zeichenbasierten Preismodell basiert.

Betrachtet man die obige Tabelle, so ist die Verwendung von Vertex AI günstiger, wenn 1 Token weniger als 3 Zeichen (1-2 Zeichen) umfasst, während AI Studio bei 3 Zeichen oder mehr günstiger ist. Da Englisch jedoch normalerweise mehr Zeichen umfasst, ist AI Studio günstiger. Auch bei Koreanisch ist es heute oft so, dass ein Token mehrere Zeichen umfasst...

Auf jeden Fall ist Gemini 1.5 Flash sowohl in Bezug auf die Eingabe-Token als auch auf die Leistung deutlich besser als 1.0 Pro. Wenn man leistungsstarke Aufgaben benötigt, ist 1.5 Pro die bessere Wahl.


Zusammenfassung

Zusammenfassend

Betrachtet man nur die Leistung, so scheint es, dass GPT-4o > Opus > 1.5 Pro in Bezug auf den MMLU-Benchmark liegt.

Wenn man anspruchsvolle kognitive Aufgaben benötigt, sollte man sich für GPT-4o entscheiden. Wenn man ein etwas günstigeres Modell verwenden möchte, ist Gemini 1.5 Pro eine gute Option. Da die tatsächliche Nutzung ein bisschen anders ist, sollte jeder das Modell verwenden, das am besten zu ihm passt.

Wenn man eine große Menge Text zu einem günstigen Preis verarbeiten muss, gibt es zwei Möglichkeiten:

Wenn das Verhältnis von Input zu Output niedrig ist (z. B. bei der Eingabe einer großen Menge an Dokumenten und der Ausgabe eines kurzen Ergebnisses), ist Claude 3 Haiku am günstigsten. Da Haiku jedoch hohe Ausgabegebühren hat, ist es bei einem Verhältnis von Input zu Output, bei dem das Outputhoch ist (z. B. bei der Eingabe eines bestimmten Textes und der Aufforderung, ihn zu bearbeiten oder zu ändern), wird Gemini 1.5 Flash empfohlen. In diesem Fall sind die Ausgabegebühren für Flash am günstigsten.


Zusammenfassung und Fazit

"Ich brauche unbedingt das leistungsstärkste LLM, egal wie teuer es ist." -> GPT - 4o

"Aber die Größe der Eingabe-Token beträgt mehr als 128K." (GPT - 4o ist auf 128K begrenzt) -> Opus

"Ich benötige eine hohe Leistung, aber der Preis sollte etwas günstiger sein, oder die Größe der Token übersteigt 200K." (Opus ist auf 200K begrenzt) -> Gemini 1.5 Pro


Ich brauche das günstigste LLM. -> Haiku

Aber das Verhältnis von Input/Output ist so, dass das Output etwas höher ist oder mehr als 200K Token umfasst. -> Gemini 1.5 Flash


해리슨
해리슨 블로그
해리슨의 깜짝 블로그
해리슨
Claude 3 vs. Gemini Preisvergleich Der Anthropic Claude 3 Haiku-Modell ist jetzt auf GCP verfügbar und wurde von H2O.ai unter Verwendung von RAG bewertet, wobei festgestellt wurde, dass er im Vergleich zu Gemini ein besseres Preis-Leistungs-Verhältnis bietet. Basierend auf den Kosten für E

7. April 2024

ChatGPT vs. Gemini Preisvergleich Dieser Beitrag vergleicht die beiden wichtigsten derzeit öffentlich verfügbaren LLM-Dienste: ChatGPT und Gemini. ChatGPT basiert auf Token und kostet 0,125 $ pro Million Token, während Gemini auf Zeichen basiert und 0,125 $ pro Million Zeichen für die Ein

7. März 2024

Aktuelle KI-Dienste, die wir empfehlen Wir stellen Ihnen aktuelle, bekannte und empfehlenswerte KI-Dienste vor. Neben ChatGPT und Gemini stellen wir NotebookLM und Perplexity AI vor, die Ihre Arbeitseffizienz steigern können. NotebookLM ist ein von Google angebotener Dienst, mit dem Sie Inform

23. Juni 2024

Google Gemini 1.5 vs. 1.5 Pro Vergleich (mit Beispielen) Gemini 1.5 Pro ist ein leistungsstärkeres KI-Modell als Gemini 1.5 und kann für verschiedene Aufgaben wie Code-Analyse, automatische Generierung von Unit-Tests und Code-Konvertierung verwendet werden. Es ist besonders für die Verarbeitung großer Datenmeng
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

28. Juni 2024

AI Full Stack mit Open Source realisieren Im Ökosystem der künstlichen Intelligenz tauchen immer mehr Open-Source-LLM-Modelle (Large Language Models) auf. Modelle wie Mistral, Llama und phi-2 mit leistungsstarker Performance und einer Open-Source-Lizenz wurden veröffentlicht und es werden ständig
RevFactory
RevFactory
RevFactory
RevFactory

5. Februar 2024

Google Gemini Ultra auf Smartphones Google plant, sein nächstes Smartphone mit dem cloudbasierten KI-Modell „Gemini Ultra“ auszustatten. Durch Fortschritte in der LLM-Komprimierungstechnik kann die Ausführung auf Geräten ermöglicht werden, wodurch die Smartphone-Funktionen deutlich erweiter
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1. April 2024

Das Paradoxon der führenden KI-Modelle: Transparenz Der Mangel an Transparenz bei hochmodernen KI-Systemen ist zu einem ernsten Problem geworden. Forscher der Stanford University haben 10 KI-Systeme, darunter GPT-4, analysiert und festgestellt, dass kein Modell Informationen wie Datenherkunft, Trainingsmet
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son

14. Mai 2024

Offizielle mobile App "Return" der japanischen generativen KI-Chatbot-Dienst "wrtn" für iOS veröffentlicht Return Technologies Japan hat die offizielle mobile App "Return" für den generativen KI-Chatbot-Dienst "wrtn" im AppStore veröffentlicht. Die App bietet eine Vielzahl von Funktionen, darunter KI-Suche, Chatbot, Bilderzeugung und mehr, und bietet Zugriff a
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan

9. Juni 2024

Google Gemini und Microsofts ChatGPT: Was ist besser? Google Gemini und ChatGPT haben beide Briefe geschrieben, die an eine Person gerichtet sind, die sie seit zwei Jahren heimlich lieben. Google Gemini lieferte einen Brief im Template-Format mit respektvollem Ton, der dem Empfänger Ratschläge gab. ChatGPT s
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

24. Juni 2024