Try using it in your preferred language.

English

  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar
translation

Questo è un post tradotto da IA.

해리슨 블로그

Prezzi di Gemini 1.5 Flash, GPT-4o e altri LLM

Seleziona la lingua

  • Italiano
  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar

Testo riassunto dall'intelligenza artificiale durumis

  • Confronta le prestazioni e i prezzi di diversi modelli AI come GPT-4o, Opus, Gemini 1.5 Pro, Haiku, Gemini 1.5 Flash. Presenta i vantaggi e gli svantaggi di ciascun modello e consiglia il modello più adatto in base allo scopo di utilizzo.
  • Fornisce una guida alla selezione del modello AI ottimale per l'utente, tenendo conto delle dimensioni del token di input, del rapporto di output e della complessità del compito.
  • Si basa sulle prestazioni e sui prezzi dei modelli AI più recenti al 30 maggio 2024 per aiutare gli utenti a fare scelte intelligenti.

Negli ultimi due giorni, Google e OpenAI hanno annunciato una serie di nuovi contenuti relativi all'intelligenza artificiale.

Generalmente, le persone si chiedono due cose principali.

Prestazioni e prezzo. (Ovviamente ci sono molte altre funzionalità, ma questo è qualcosa di cui si occupano i blogger professionisti...)

Open AI - GPT

Come sempre, OpenAI ha reso il nuovo modello 4o più conveniente rispetto al GPT-4T precedente. Le prestazioni sono già state discusse su molti altri blog, quindi tralasciamo questo aspetto e ci concentriamo sul prezzo.

Listino prezzi GPT


In generale, OpenAI ha ridotto il prezzo ogni volta che ha rilasciato un nuovo prodotto dopo il GPT 3.5 Turbo e il GPT 4 iniziale. Naturalmente, le prestazioni sono state migliorate. Al momento, se si cerca un'opzione economica, è meglio optare per 3.5 Turbo. In tutti gli altri casi, è consigliabile utilizzare 4o.


Anthopic - Claude 3

Listino prezzi Claude 3

Anthropic non ha rilasciato nuovi prodotti di recente, ma non possiamo escludere questa azienda di LLM grazie a Haiku, un'opzione economica, e Opus, un modello ad alte prestazioni.

Haiku è il più conveniente dei tre in termini di prezzo per token di input. È l'opzione più economica per elaborare testi semplici.

Fino al recente lancio di Gemini Flash, Haiku era persino più performante di Gemini 1.0 Pro, il che lo rende un LLM molto utile.


Google - Gemini

Listino prezzi Gemini

Google mantiene due sistemi di prezzi.

Uno è AI Studio, l'altro è Vertex AI.

AI Studio, come le altre aziende, utilizza un prezzo basato sui token, mentre Vertex AI, in modo unico, utilizza un prezzo basato sui caratteri.

Considerando la tabella sopra, se un token corrisponde a meno di 3 caratteri (1-2 caratteri) in media, l'utilizzo di Vertex AI è più conveniente. Se sono 3 caratteri o più, AI Studio è più conveniente. Tuttavia, in genere, l'inglese ha un numero maggiore di caratteri, quindi AI Studio è più conveniente. Anche il coreano oggi utilizza spesso un token per più caratteri.

In ogni caso, sia in termini di token di input che di prestazioni, Gemini 1.5 Flash è molto più performante di 1.0 Pro. Per compiti ad alte prestazioni, 1.5 Pro è il migliore.


Riepilogo

Complessivo

Considerando solo le prestazioni, in base a MMLU, l'ordine è GPT-4o > Opus > 1.5 Pro.

Per attività intellettuali complesse, GPT-4o è il migliore. Se si cerca un'opzione leggermente più conveniente o se si hanno più di 200K token (Opus supporta solo 200K token), Gemini 1.5 Pro potrebbe essere una buona opzione. In realtà, queste differenze sono percepibili quando si utilizzano realmente questi modelli, quindi è meglio utilizzare quello che meglio si adatta alle proprie esigenze.

Ci sono due opzioni se si ha bisogno di elaborare grandi quantità di testo in modo economico:

Se il rapporto input-output è basso (ad esempio, se si inserisce una grande quantità di documenti e si desidera ottenere risultati brevi), Claude 3 Haiku è l'opzione più economica. Tuttavia, Haiku ha costi di output elevati, quindi, al contrario, se il rapporto è alto (ad esempio, se si inserisce un testo specifico e si desidera che venga modificato o modificato), si consiglia Gemini 1.5 Flash. In questo caso, Flash è l'opzione più economica per i costi di output.


Riepilogo e conclusioni

"Non mi interessa il prezzo, voglio il miglior LLM per attività complesse" -> GPT - 4o

"Ma la dimensione del token di input supera i 128K." (GPT - 4o supporta solo 128K o meno) -> Opus

"Ho bisogno di prestazioni elevate, ma un prezzo più conveniente o una dimensione di token superiore a 200K." (Opus supporta solo 200K o meno) -> Gemini 1.5 Pro


Ho bisogno del LLM più economico. -> Haiku

Ma il rapporto input/output è maggiore per l'output o supera i 200K token. -> Gemini 1.5 Flash


해리슨
해리슨 블로그
해리슨의 깜짝 블로그
해리슨
Confronto prezzi tra Claude 3 e Gemini Ora è possibile utilizzare il modello Anthropic Claude 3 Haiku su GCP e, dopo averlo valutato utilizzando RAG di H2O.ai, si è scoperto che offre prestazioni superiori al prezzo rispetto a Gemini. In base al costo di input e output per milione di token, Cl

7 aprile 2024

Confronto prezzi tra ChatGPT e Gemini Confrontiamo i due principali servizi LLM attualmente disponibili: ChatGPT e Gemini. ChatGPT, basato su token, costa $ 0,125 per milione di token, mentre Gemini, basato su caratteri, addebita $ 0,125 per milione di caratteri in ingresso e $ 0,375 per quel

7 marzo 2024

Servizi AI degni di nota di recente Presentiamo alcuni servizi AI di recente fama e degni di nota. A parte ChatGPT e Gemini, abbiamo raccolto alcuni servizi che possono migliorare l'efficienza lavorativa, tra cui NotebookLM e Perplexity AI. NotebookLM è un servizio offerto da Google che con

23 giugno 2024

Confronto tra Gemini 1.5 e 1.5 Pro (con esempi) Gemini 1.5 Pro è un modello AI più potente di Gemini 1.5 e può essere utilizzato per una varietà di attività, tra cui l'analisi del codice, la generazione automatica di test unitari, la conversione del codice e altro ancora. È particolarmente adatto per l
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

28 giugno 2024

Integrazione di Google Gemini Ultra negli smartphone Google ha annunciato che integrerà il suo modello AI dedicato al cloud "Gemini Ultra" nei suoi smartphone del prossimo anno. I progressi nella tecnologia di compressione LLM hanno reso possibile l'esecuzione su dispositivo, aprendo la strada a un'espansio
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1 aprile 2024

AI Full Stack completo con Open Source Nel panorama dell'intelligenza artificiale stanno emergendo sempre più modelli LLM (Large Language Model) open source. Modelli come Mistral, Llama e phi-2, con prestazioni elevate e licenze open source, sono stati rilasciati, e contemporaneamente vengono
RevFactory
RevFactory
RevFactory
RevFactory

5 febbraio 2024

Mr. Know-All 6호 - Marzo 2024 Presentiamo LM Studio, una piattaforma che consente di eseguire LLM open source come LLaMa, Falcon, MPT e StarCoder in locale, oltre a strumenti e servizi AI come Devin, un ingegnere software AI, e crewAI, una piattaforma di automazione multi-agente. Pres
Pilot AISmrteasy
Pilot AISmrteasy
Pilot AISmrteasy
Pilot AISmrteasy

21 marzo 2024

L'avvento dell'era dell'IA, armonizzando l'innovazione tecnologica e l'etica Google e OpenAI hanno mostrato progressi innovativi nella tecnologia AI con il rilascio dei nuovi modelli AI "Gemini" e "GPT-4". Gemini è in grado di accettare input da diverse modalità, riassumere informazioni e fornire risposte a domande, e sarà integra
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan

18 maggio 2024

Il paradosso dei modelli AI leader, la trasparenza La mancanza di trasparenza nei sistemi AI all'avanguardia è diventata un problema serio. I ricercatori della Stanford University hanno analizzato 10 sistemi AI, tra cui GPT-4, e hanno concluso che nessun modello ha pubblicato in modo trasparente informazi
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son

14 maggio 2024