Esta es una publicación traducida por IA.
La nueva gama Gemini de Google - Experimental
- Idioma de escritura: Coreano
- •
- País de referencia: Todos los países
- •
- Tecnología de la información
Seleccionar idioma
Texto resumido por la IA durumis
- Google ha lanzado nuevos modelos experimentales, incluidos Gemini 1.5 Pro Exp, Gemini 1.5 Flash Exp y Gemini 1.5 Flash 8B Exp, y Gemini 1.5 Pro Exp, en particular, ha mejorado su rendimiento en comparación con las versiones anteriores, mientras que Gemini 1.5 Flash Exp se ha actualizado a un nivel superior entre las versiones de entrada.
- Gemini 1.5 Flash 8B Exp muestra un rendimiento similar al de Claude 3 Sonnet y es una versión ligera de la línea Flash. Si bien es algo deficiente en comparación con la línea Pro en la traducción de texto con estructuras JSON complejas, ha mostrado resultados satisfactorios en tareas de resumen y redacción.
- Se espera que Google ofrezca Gemini 1.5 Flash 8B Exp a un precio asequible cuando se lance oficialmente, lo que tendrá un gran impacto en las líneas de otros proveedores. Después del lanzamiento, se compartirá una nueva comparación de precios.
Google ha lanzado recientemente nuevos modelos de Gemini.
En realidad no es la versión oficial, sino la versión experimental.
Los modelos son los siguientes.
- Gemini 1.5 Pro Exp
- Gemini 1.5 Flash Exp
- Gemini 1.5 Flash 8B Exp
En primer lugar, en el caso de 1.5 Pro Exp y 1.5 Flash Exp, se puede considerar que son actualizaciones de la versión anterior. De hecho, si se prueba, en el caso de 1.5 Pro Exp, el rendimiento ha mejorado ligeramente en comparación con la versión anterior 1.5 Pro (el rendimiento de referencia también ha mejorado. No he obtenido los datos, pero se puede considerar que está entre los mejores de la versión lanzada anteriormente). En el caso de 1.5 Flash Exp, por supuesto no es el mejor, pero ha mejorado hasta alcanzar un nivel excelente dentro de la versión de entrada.
Se dice que ambas versiones se reflejarán en las versiones anteriores 1.5 Pro y 1.5 Flash dentro de unas pocas semanas. (Dado que la versión anterior era la 001, es probable que se actualice a la 002).
Fuente: Chatbot Arena
Si se mira la tabla, la versión Gemini 1.5 Pro Exp ocupa el segundo lugar y la Gemini 1.5 Flash Exp ocupa el sexto.
Lo interesante es que la Gemini 1.5 Flash Exp está por encima de la Gemini 1.5 Pro que ocupa los puestos 10 y 11.
Los puestos del 1 al 5 son las versiones insignia de cada empresa (GPT 4o, Gemini 1.5 Pro, Grok 2) y los puestos 6 y 7 son las líneas de entrada de cada empresa (GPT 4o mini, Gemini 1.5 Flash). Claude 3.5 Sonnet fue el mejor durante un tiempo... La velocidad de desarrollo de esta industria es realmente...
De todos modos, personalmente, creo que las dos versiones (1.5 Pro, 1.5 Flash) se convertirán en versiones oficiales pronto, y en este momento tengo curiosidad por la versión 1.5 Flash 8b.
Primero, echemos un vistazo a los benchmarks.
Fuente: Chatbot Arena
Si se mira el benchmark anterior, el rendimiento de 1.5 Flash 8b Exp es aproximadamente similar al de Claude 3 Sonnet, y aunque es ligeramente superior o inferior, es aproximadamente similar al rendimiento de Llama 3 70 b.
Flash es una versión ligera de Pro, pero Flash 8b es una versión aún más ligera. (¡Supongo que sí!)
En primer lugar, he hecho algunas pruebas directas, pruebas de frases que se utilizan mucho en nuestro servicio.
- Traducir.
- Resumir.
- Escribir un texto.
He hecho algunas pruebas sencillas, ya que hay muchas otras pruebas en otros lugares. Cuando traduje un texto con una estructura JSON compleja, Flash no produjo resultados satisfactorios, pero Pro sí que los produjo. Además, la versión Pro Exp produjo resultados más limpios.
Tanto Flash como Flash 8b produjeron resultados satisfactorios en el resumen y la escritura de textos. Está claro que Flash 8b puede utilizarse para tareas sencillas, a menos que sean tareas complejas.
Si se tiene en cuenta el rendimiento y los parámetros, parece que Google establecerá un precio bastante bajo para la versión oficial de Flash 8b.
Probablemente establecerán un precio que cause un gran daño a las líneas de productos de otros proveedores, pero cuando se lance, volveré con la "otra" hoja de precios.