Try using it in your preferred language.

English

  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar
translation

Esta es una publicación traducida por IA.

해리슨 블로그

Lanzamiento de OpenELM de Apple / Phi-3 de MS / Llama 3 de Meta

Seleccionar idioma

  • Español
  • English
  • 汉语
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar

Texto resumido por la IA durumis

  • Apple, Microsoft y Meta, entre las principales empresas de Big Tech, están provocando grandes cambios en la industria de la IA al lanzar recientemente nuevos modelos lingüísticos de gran tamaño.
  • Cada empresa está presentando modelos diferenciados utilizando diversas técnicas, como la reducción del tamaño del modelo, la optimización de los datos/algoritmos, la mejora de la comprensión del contexto, etc.
  • En particular, OpenELM de Apple se ha desarrollado para adaptarse a dispositivos pequeños, mientras que Llama 3 de Meta exhibe un rendimiento superior a pesar de su pequeño tamaño gracias a su estructura de modelo eficiente.

Las últimas noticias sobre el lanzamiento de grandes modelos de lenguaje

En la última semana, las principales empresas de tecnología como Apple, Microsoft y Meta han lanzado nuevos modelos de lenguaje de gran tamaño, lo que ha causado un gran revuelo en la industria de la IA. Exploremos con más detalle las características y la importancia de estos modelos recién lanzados.

OpenELM de Apple

El 25 de abril, Apple lanzó su propia línea de modelos de lenguaje OpenELM. Está compuesta por cuatro modelos de diferentes tamaños: 0.27B, 0.45B, 1.08B y 3.04B. Incluso el modelo más grande solo tiene 3 mil millones de parámetros, lo que lo convierte en un modelo relativamente pequeño. Teniendo en cuenta que la mayoría de los grandes modelos de lenguaje actuales tienen al menos 3 mil millones de parámetros, OpenELM es de un tamaño muy pequeño.
Esto se debe a que Apple diseñó OpenELM pensando en su uso en dispositivos pequeños. En el pasado, aumentar el número de parámetros era la principal forma de lograr un alto rendimiento. Sin embargo, la tendencia actual se centra en la miniaturización y la reducción de peso. Apple ha aumentado la apertura de su trabajo al publicar el conjunto completo, incluyendo los pesos del modelo y el código de inferencia, así como el conjunto de datos y el marco de trabajo.

Serie Phi-3 de MS

Microsoft también publicó primero el modelo Phi-3 Mini (3.8B parámetros) el 23 de abril, y planea lanzar Phi-3 Small (7B parámetros) y Phi-3 Medium (14B parámetros) en el futuro. Phi-3 Mini es un modelo abierto, y cualquiera puede utilizarlo comercialmente de forma gratuita. Todos los nuevos modelos de la serie Phi-3 se ofrecerán a través del servicio en la nube de MS, Azure.

Llama 3 de Meta

Meta (antes Facebook) publicó primero las versiones 8B y 70B del modelo Llama 3 el 18 de abril, y planea publicar el modelo de mayor tamaño, 400B, en verano. El modelo 8B ha recibido elogios de la comunidad de desarrolladores por su excelente rendimiento a pesar de su pequeño tamaño.
Esto se debe a que Meta ha invertido una gran cantidad de datos de entrenamiento para construir una estructura de modelo eficiente. Se puede considerar que es el resultado de centrarse en la optimización de los datos y los algoritmos en lugar de aumentar el número de parámetros.

Grok 1.5 de xAI

El modelo Grok 1.5 de xAI, presentado el 38 de marzo, puede manejar tokens de contexto largos de hasta 128K, lo que permite indicaciones complejas y largas. Si la tendencia en el desarrollo de modelos de lenguaje hasta ahora se ha centrado en aumentar simplemente el tamaño de los parámetros, Grok 1.5 presenta un nuevo objetivo: mejorar la comprensión del contexto largo.

⁠⁠⁠⁠⁠⁠⁠
El lanzamiento continuo de nuevos grandes modelos de lenguaje por parte de empresas líderes como Apple, MS y Meta en la última semana está dando lugar a una mayor diversificación de las direcciones de la evolución de la tecnología de la IA. Estamos viendo nuevos intentos en varios aspectos, como la reducción y la optimización del tamaño del modelo, la optimización de los datos y los algoritmos, y la mejora de la comprensión del contexto. Es interesante ver cómo evolucionará el ecosistema de la IA en el futuro.

해리슨
해리슨 블로그
해리슨의 깜짝 블로그
해리슨
Precios de Gemini 1.5 Flash, GPT-4o y otros LLM Comparación de rendimiento y precio de los últimos modelos de IA como GPT-4o, Gemini 1.5 Pro, Claude 3 Haiku y Gemini 1.5 Flash. Te mostramos cómo elegir el modelo adecuado para ti. Encuentra el modelo más eficiente teniendo en cuenta el tamaño de los tok

18 de mayo de 2024

Los servicios de IA más recomendables recientemente Presentamos los servicios de IA más famosos y recomendables. Además de ChatGPT y Gemini, hemos recopilado servicios que pueden aumentar la eficiencia laboral, como NotebookLM y Perplexity AI. NotebookLM es un servicio proporcionado por Google que permite

23 de junio de 2024

Comparación de precios de ChatGPT vs Gemini Comparamos los dos principales servicios LLM, ChatGPT y Gemini, que se encuentran actualmente disponibles. ChatGPT, que se basa en tokens, se cobra a $0.125 por millón de tokens. Gemini, que se basa en caracteres, se cobra a $0.125 por millón de caractere

7 de marzo de 2024

Pila completa de IA con código abierto Nuevos modelos de LLM (modelos de lenguaje grandes) de código abierto están apareciendo rápidamente en el ecosistema de IA. Modelos como Mistral, Llama y phi-2, con un rendimiento potente y licencias abiertas, se han puesto a disposición del público, y se
RevFactory
RevFactory
RevFactory
RevFactory

5 de febrero de 2024

¿Qué es un Modelo de Lenguaje Grande (LLM)? Los modelos de lenguaje grandes (LLM) son una tecnología central de la inteligencia artificial que aprende de una gran cantidad de datos de texto para adquirir habilidades de procesamiento de lenguaje similares a las humanas, y se pueden utilizar en una v
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1 de abril de 2024

Snowflake lanza 'Arctic', un LLM empresarial de nivel empresarial con la mayor apertura de la industria Snowflake ha lanzado 'Arctic', un modelo de lenguaje extenso de código abierto. Disponible para uso comercial gratuito bajo la licencia Apache 2.0, se caracteriza por su rendimiento y eficiencia de primer nivel. Ofrece una excelente eficiencia de token y
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)

25 de abril de 2024

Integración de Google Gemini Ultra en teléfonos inteligentes Google anunció que integrará su modelo de IA dedicado a la nube "Gemini Ultra" en sus teléfonos inteligentes el próximo año. El avance en la tecnología de compresión de LLM permite la ejecución en el dispositivo, lo que amplía considerablemente las funcio
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1 de abril de 2024

El modelo de lenguaje de gran tamaño Cerebro de iBrix, diseñado para empresas, recibió un gran interés en la feria AI EXPO iBrix recibió una gran atención en la AI EXPO KOREA 2024 por su modelo de lenguaje de gran tamaño Cerebro, diseñado para empresas. Cerebro ofrece funciones especializadas para empresas, como resumen, redacción de planes y generación de informes, y ha reci
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)

8 de mayo de 2024

SK C&C presenta 'Soluer LLMOps', una plataforma para implementar sLLM personalizados para clientes SK C&C ofrece la plataforma 'Soluer LLMOps' para ayudar a las empresas a construir fácilmente modelos de lenguaje de gran tamaño personalizados (sLLM). Utiliza LLM comerciales como ChatGPT, HyperCLOVA X y LLM de código abierto, y aplica hiperautomatizació
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)

20 de mayo de 2024