Prezzo di Gemini 1.5 Flash, GPT-4o e altri LLM

Negli ultimi due giorni, Google e OpenAI hanno rilasciato una serie di annunci incredibili riguardanti le nuove IA.

In generale, le domande più frequenti da parte degli utenti si concentrano su due aspetti principali.

Prestazioni e prezzo. (Ovviamente ci sono molte altre funzionalità, ma quelle saranno analizzate da blogger esperti...)

Open AI - GPT

Come sempre, OpenAI ha reso il nuovo GPT-4o più conveniente rispetto al precedente GPT-4. Le prestazioni sono state ampiamente recensite in molti altri blog, quindi le tralasceremo qui; ci concentreremo invece sul prezzo.

Prezzo di Gemini 1.5 Flash, GPT-4o e altri LLM

Listino prezzi GPT

In sostanza, OpenAI ha ridotto il prezzo ogni volta che ha rilasciato un nuovo modello, a partire da GPT-3.5 Turbo, seguito da GPT-4 e poi dai modelli successivi. Naturalmente, con ogni nuova versione, le prestazioni sono state migliorate. Attualmente, se si cerca la soluzione più economica, GPT-3.5 Turbo è la scelta migliore. In tutti gli altri casi, GPT-4o sembra essere la soluzione ideale.

Anthropic - Claude 3

Listino prezzi Claude 3

Sebbene Anthropic non abbia rilasciato nuovi prodotti di recente, la sua presenza nel panorama dei modelli linguistici di grandi dimensioni (LLM) è innegabile grazie a Haiku, un'opzione conveniente, e Opus, un modello dalle alte prestazioni.

In base al prezzo dei token di input, Haiku è il modello più economico tra i tre, risultando la scelta ideale per elaborare testi semplici.

Fino al rilascio di Gemini Flash, Haiku era persino più performante di Gemini 1.0 Pro, rendendolo un LLM estremamente utile.

Google - Gemini

Listino prezzi Gemini

Google adotta due sistemi di prezzi diversi.

Uno è AI Studio, l'altro è Vertex AI.

AI Studio, come le altre aziende, utilizza un sistema di prezzi basato sui token, mentre Vertex AI adotta un sistema basato sul numero di caratteri.

In base alla tabella sopra, se un token corrisponde a meno di 3 caratteri (1-2 caratteri), Vertex AI risulta più conveniente; se sono 3 o più caratteri, AI Studio è più economico. Tuttavia, dato che i testi in inglese tendono ad avere un numero maggiore di caratteri, AI Studio è generalmente più conveniente. Anche per il coreano, attualmente, un token spesso corrisponde a più caratteri, quindi...

Comunque sia, considerando solo i token di input e le prestazioni, Gemini 1.5 Flash risulta nettamente migliore di 1.0 Pro. Per attività che richiedono prestazioni elevate, 1.5 Pro è la scelta migliore.

Riepilogo

In termini di prestazioni, basandoci sul benchmark MMLU, sembra che GPT-4o > Opus > 1.5 Pro.

Per attività intellettuali complesse, GPT-4o è la soluzione ideale. Se si cerca un'alternativa leggermente più economica, Gemini 1.5 Pro può essere una valida opzione. Tuttavia, l'esperienza d'uso può variare da persona a persona, quindi è consigliabile scegliere il modello che meglio si adatta alle proprie esigenze.

Se si devono elaborare grandi quantità di testo a basso costo, si hanno due opzioni:

Se il rapporto tra input e output èbasso (ad esempio, se si inserisce un grande volume di documenti e si desidera ottenere un breve risultato), Claude 3 Haiku è la soluzione più economica. Tuttavia, Haiku ha costi di output elevati, quindi, al contrario, se il rapporto tra input e output èalto (ad esempio, se si inserisce un testo specifico e si desidera modificarlo o trasformarlo), si consiglia Gemini 1.5 Flash. In questo caso, Flash offre i costi di output più bassi.

Sintesi e Conclusioni

"Non mi interessa il prezzo, voglio solo il modello migliore per i compiti più complessi." -> GPT - 4o

"Tuttavia, le dimensioni dell'input sono superiori a 128K." (GPT - 4o supporta solo input fino a 128K) -> Opus

"Ho bisogno di un modello ad alte prestazioni ma con un prezzo più conveniente, oppure le dimensioni dell'input superano i 200K." (Opus supporta solo input fino a 200K) -> Gemini 1.5 Pro

Ho bisogno del LLM più economico possibile. -> Haiku

Tuttavia, il rapporto input/output prevede un output leggermente maggiore oppure le dimensioni dell'input superano i 200K. -> Gemini 1.5 Flash