Try using it in your preferred language.

English

  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar
translation

Esta es una publicación traducida por IA.

해리슨 블로그

Precios de Gemini 1.5 Flash, GPT-4o y otros LLM

Seleccionar idioma

  • Español
  • English
  • 汉语
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar

Texto resumido por la IA durumis

  • Compara el rendimiento y el precio de varios modelos de IA como GPT-4o, Opus, Gemini 1.5 Pro, Haiku, Gemini 1.5 Flash, y presenta las ventajas y desventajas de cada modelo, recomendando el modelo adecuado según el propósito de uso.
  • Proporciona una guía de selección de modelos de IA óptimos para los usuarios, teniendo en cuenta el tamaño de los tokens de entrada, la tasa de salida y la complejidad de las tareas.
  • Basándose en la información de rendimiento y precios de los últimos modelos de IA a 30 de mayo de 2024, ayuda a los usuarios a tomar decisiones inteligentes.

Esta vez, Google y OpenAI anunciaron una gran cantidad de nuevos contenidos relacionados con la IA durante dos días consecutivos.

En general, hay dos cosas que la gente quiere saber al usarlas.

Rendimiento y precio. (Por supuesto, hay muchas más funciones, pero eso lo revisan los blogueros profesionales ...)

Open AI - GPT

Como siempre, OpenAI ha hecho que el nuevo 4o sea más barato que el GPT-4T anterior. El rendimiento es algo que se puede encontrar en muchas reseñas en otros blogs, así que lo omitiremos aquí. Aquí solo hablamos del precio.

Tabla de precios de GPT


Básicamente, Open AI redujo el precio cada vez que lanzó un nuevo producto después de que GPT 4 salió por primera vez después de GPT 3.5 Turbo. Por supuesto, el rendimiento está mejorando. Actualmente, si tienes que elegir un precio más barato, deberías usar 3.5 Turbo. Para los demás casos, parece que 4o es el adecuado.


Anthopic - Claude 3

Tabla de precios de Claude 3

Si bien Anthropic no ha anunciado ningún producto nuevo recientemente, es una empresa de LLM que no se puede ignorar debido a Haiku, que se puede utilizar como una opción rentable, y Opus, que es de alto rendimiento.

En términos de precio por token de entrada, Haiku es el más barato de los tres, y es el más barato para procesar textos simples.

De hecho, hasta la llegada de Gemini Flash, Haiku era incluso más potente que Gemini 1.0 Pro, lo que lo convierte en un LLM muy útil.


Google - Gemini

Tabla de precios de Gemini

Google mantiene dos sistemas de precios.

Uno es AI Studio y el otro es Vertex AI.

AI Studio, como otras empresas, está basado en tokens, mientras que Vertex AI, curiosamente, está basado en caracteres.

Si consideramos la tabla anterior, si 1 token tiene menos de 3 caracteres (1-2 caracteres) de media, es más barato usar Vertex AI, pero si tiene 3 caracteres o más, es más barato AI Studio. Sin embargo, el inglés suele tener más caracteres, por lo que AI Studio es más barato. El coreano también suele tener varios caracteres por token...

En cualquier caso, tanto en términos de tokens de entrada como de rendimiento, Gemini 1.5 Flash es mucho mejor que 1.0 Pro. Si necesitas tareas de alto rendimiento, 1.5 Pro es superior.


Resumen

Resumen

En términos de rendimiento solo, basado en MMLU, parece ser GPT-4o > Opus > 1.5 Pro.

Si necesitas tareas intelectuales de alto nivel, GPT-4o. Si quieres usar algo un poco más barato o si el tamaño del token supera los 200K (Opus solo permite hasta 200K), Gemini 1.5 Pro podría funcionar. En realidad, la sensación al usarlos es un poco diferente, por lo que puedes usar el que mejor se adapte a tus necesidades.

Si necesitas trabajar con grandes cantidades de texto a bajo coste, tienes dos opciones:

Si la proporción de entrada a salida es baja (por ejemplo, si necesitas introducir una gran cantidad de documentos y obtener un resultado corto), Claude 3 Haiku es el más barato. Por otro lado, Haiku tiene un alto coste de salida, por lo que, por el contrario, si la proporción de entrada a salida es alta (por ejemplo, si necesitas introducir un texto específico y luego darle instrucciones para modificarlo o cambiarlo), te recomiendo Gemini 1.5 Flash. En ese caso, Flash es el más barato para la salida.


Resumen y conclusión

"No me importa el precio, quiero el trabajo más complejo posible" -> GPT - 4o

"Pero el tamaño del token de entrada supera los 128K" (GPT - 4o solo permite hasta 128K) -> Opus

"Necesito un alto rendimiento, pero un precio más bajo o un tamaño de token que supere los 200K" (Opus solo permite hasta 200K) -> Gemini 1.5 Pro


Necesito el LLM más barato posible. -> Haiku

Pero la relación de entrada/salida tiene más salida o supera los 200K tokens. -> Gemini 1.5 Flash


해리슨
해리슨 블로그
해리슨의 깜짝 블로그
해리슨
Comparación de precios de Claude 3 vs Gemini Anthropic's Claude 3 Haiku model is now available on GCP, and H2O.ai has evaluated it using RAG, finding that it offers better performance for the price compared to Gemini. Based on input and output costs per million tokens, Claude 3 Haiku is the most aff

7 de abril de 2024

Comparación de precios de ChatGPT vs Gemini Comparamos los dos principales servicios LLM, ChatGPT y Gemini, que se encuentran actualmente disponibles. ChatGPT, que se basa en tokens, se cobra a $0.125 por millón de tokens. Gemini, que se basa en caracteres, se cobra a $0.125 por millón de caractere

7 de marzo de 2024

Los servicios de IA más recomendables recientemente Presentamos los servicios de IA más famosos y recomendables. Además de ChatGPT y Gemini, hemos recopilado servicios que pueden aumentar la eficiencia laboral, como NotebookLM y Perplexity AI. NotebookLM es un servicio proporcionado por Google que permite

23 de junio de 2024

Comparación de Gemini 1.5 vs 1.5 Pro (con ejemplos) Gemini 1.5 Pro es un modelo de IA más potente que Gemini 1.5, y se puede utilizar para diversas tareas como el análisis de código, la generación automática de pruebas unitarias, la conversión de código, etc. Es especialmente adecuado para el procesamiento
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

28 de junio de 2024

Pila completa de IA con código abierto Nuevos modelos de LLM (modelos de lenguaje grandes) de código abierto están apareciendo rápidamente en el ecosistema de IA. Modelos como Mistral, Llama y phi-2, con un rendimiento potente y licencias abiertas, se han puesto a disposición del público, y se
RevFactory
RevFactory
RevFactory
RevFactory

5 de febrero de 2024

Integración de Google Gemini Ultra en teléfonos inteligentes Google anunció que integrará su modelo de IA dedicado a la nube "Gemini Ultra" en sus teléfonos inteligentes el próximo año. El avance en la tecnología de compresión de LLM permite la ejecución en el dispositivo, lo que amplía considerablemente las funcio
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1 de abril de 2024

¿Qué es mejor, Google Gemini o ChatGPT de Microsoft? Google Gemini y ChatGPT escribieron una carta a una persona que han estado amando en secreto durante dos años, cada uno en su propio estilo. Google Gemini proporcionó una carta en formato de plantilla con un tono de consejo, usando lenguaje formal, mientr
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

24 de junio de 2024

La paradoja de los modelos de IA líderes, la transparencia La falta de transparencia en los sistemas de IA de vanguardia se ha convertido en un problema grave. Un equipo de investigación de la Universidad de Stanford analizó 10 sistemas de IA, incluido GPT-4, y concluyó que no hay modelos que revelen información
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son

14 de mayo de 2024

Lanzamiento de la versión iOS de la aplicación móvil oficial "Return" del servicio de chatbot de IA generativa japonés "wrtn" Return Technologies Japan ha lanzado la aplicación móvil oficial "Return" del servicio de chatbot de IA generativa "wrtn" en AppStore. Ofrece una variedad de funciones, que incluyen búsqueda de IA, chatbot, generación de imágenes, etc., y también se puede
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan

9 de junio de 2024