Questo è un post tradotto da IA.
La nuova linea Gemini di Google - Sperimentale
- Lingua di scrittura: Coreana
- •
- Paese di riferimento: Tutti i paesi
- •
- Tecnologia dell'informazione
Seleziona la lingua
Testo riassunto dall'intelligenza artificiale durumis
- Google ha rilasciato nuovi modelli sperimentali, tra cui Gemini 1.5 Pro Exp, Gemini 1.5 Flash Exp e Gemini 1.5 Flash 8B Exp. In particolare, Gemini 1.5 Pro Exp presenta prestazioni migliorate rispetto alle versioni precedenti, mentre Gemini 1.5 Flash Exp rappresenta un aggiornamento di livello superiore per la versione entry-level.
- Gemini 1.5 Flash 8B Exp offre prestazioni simili a Claude 3 Sonnet e rappresenta una versione leggera della linea Flash. Mentre nella traduzione di testi con struttura JSON complessa si dimostra leggermente inferiore rispetto alla linea Pro, in compiti di riepilogo e scrittura di testi offre risultati soddisfacenti.
- Si prevede che Google offra Gemini 1.5 Flash 8B Exp a un prezzo conveniente al momento del lancio, con un impatto significativo sulle altre linee del settore. Dopo il lancio, verrà condivisa un'analisi comparativa dei prezzi.
Google ha recentemente rilasciato nuovi modelli per Gemini.
In realtà non sono versioni ufficiali ma versioni sperimentali (Experimental).
Questi sono i modelli:
- Gemini 1.5 Pro Exp
- Gemini 1.5 Flash Exp
- Gemini 1.5 Flash 8B Exp
Innanzitutto, 1.5 Pro Exp e 1.5 Flash Exp possono essere considerati aggiornamenti delle versioni precedenti. In realtà, testandoli, si è notato che 1.5 Pro Exp ha prestazioni leggermente superiori rispetto a 1.5 Pro (anche le prestazioni del benchmark sono migliorate. Non ho trovato i dati, ma si può dire che è la migliore tra le versioni già rilasciate). Anche 1.5 Flash Exp, sebbene non sia il migliore, ha raggiunto un livello di miglioramento eccellente per una versione di base.
Si dice che queste due versioni saranno integrate nelle versioni precedenti 1.5 Pro e 1.5 Flash entro poche settimane (dato che la versione precedente era 001, è probabile che venga aggiornata alla 002).
Fonte: Chatbot Arena
Guardando la tabella, Gemini 1.5 Pro Exp è al secondo posto, mentre al sesto posto c'è Gemini 1.5 Flash Exp.
La cosa divertente è che 1.5 Flash Exp si posiziona più in alto rispetto a Gemini 1.5 Pro, che si trova al 10° e all'11° posto.
Dal 1° al 5° posto si trovano le versioni flagship di ciascuna azienda (GPT 4o, Gemini 1.5 Pro, Grok 2), mentre al 6° e 7° posto si trovano le linee di base di ciascuna azienda (GPT 4o mini, Gemini 1.5 Flash). Per un po' di tempo, Claude 3.5 Sonnet è stato al primo posto... la velocità di sviluppo di questo settore è davvero incredibile...
Comunque, personalmente, penso che queste due versioni (1.5 Pro, 1.5 Flash) diventeranno presto ufficiali, e la mia curiosità è rivolta alla versione 1.5 Flash 8b.
Prima di tutto, diamo un'occhiata al benchmark.
Fonte: Chatbot Arena
Guardando il benchmark sopra, si può vedere che le prestazioni di 1.5 Flash 8b Exp sono più o meno simili a quelle di Claude 3 Sonnet, leggermente sopra o sotto, ma leggermente inferiori rispetto a 1.5 Flash, ma simili a quelle di Llama 3 70 b.
Flash è una versione alleggerita di Pro, e Flash 8b è una versione ancora più alleggerita (suppongo?).
Ho eseguito alcuni test diretti, tra cui i test di frasi che utilizziamo spesso nel nostro servizio.
- Tradurre.
- Riassumere.
- Scrivere un testo
Esistono molti altri test altrove, quindi ho eseguito alcuni test semplici. Quando ho tradotto un testo con una struttura JSON complessa, Flash non ha prodotto un risultato soddisfacente, ma Pro ha dato un risultato soddisfacente. Inoltre, la versione Pro Exp ha prodotto un risultato più pulito.
Per quanto riguarda la sintesi e la scrittura di testi, sia Flash che Flash 8b hanno prodotto risultati soddisfacenti. È evidente che Flash 8b può essere utilizzato per compiti semplici, a meno che non si tratti di compiti altamente complessi.
Considerando le prestazioni e i parametri, Google sembra voler fissare un prezzo molto basso per Flash 8b al momento del lancio.
Probabilmente, fissando un prezzo che arrecherebbe un grande danno alle linee di prodotti concorrenti. Quando verrà rilasciato, tornerò "di nuovo" con il listino prezzi.