Try using it in your preferred language.

English

  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar
translation

Esta é uma postagem traduzida por IA.

해리슨 블로그

Lançamento do OpenELM da Apple / Phi-3 da MS / Llama 3 do Meta

  • Idioma de escrita: Coreana
  • País de referência: Todos os países country-flag

Selecionar idioma

  • Português
  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar

Texto resumido pela IA durumis

  • Apple, Microsoft e Meta, entre outras grandes empresas de tecnologia, estão causando grande impacto no setor de IA com o lançamento recente de novos modelos de linguagem de grande porte.
  • Cada empresa está apresentando modelos diferenciados por meio de redução de tamanho, otimização de dados/algoritmos e melhoria da compreensão de contexto, entre outras abordagens.
  • O OpenELM da Apple, em particular, foi desenvolvido para dispositivos pequenos, enquanto o Llama 3 do Meta, com sua estrutura de modelo eficiente, oferece desempenho superior mesmo em tamanhos pequenos.

Notícias recentes sobre o lançamento de grandes modelos de linguagem

Nas últimas semanas, empresas de tecnologia importantes como Apple, Microsoft e Meta lançaram novos modelos de linguagem de grande porte, causando grande impacto na indústria de IA. Vamos explorar em mais detalhes as características e o significado desses modelos lançados recentemente.

OpenELM da Apple

Em 25 de abril, a Apple lançou sua linha de modelos de linguagem OpenELM. Composto por quatro modelos de tamanhos diferentes — 0,27B, 0,45B, 1,08B e 3,04B —, o maior deles tem apenas 3 bilhões de parâmetros, um tamanho relativamente pequeno. Considerando que a maioria dos grandes modelos de linguagem atualmente possui pelo menos 3 bilhões de parâmetros, o OpenELM é realmente pequeno.
Isso se deve ao fato de a Apple ter desenvolvido o OpenELM com foco em usá-lo principalmente em dispositivos pequenos. No passado, aumentar o número de parâmetros era a principal maneira de atingir alto desempenho, mas a tendência atual é se concentrar em tamanhos menores e mais leves. A Apple também aumentou a transparência ao lançar não apenas os pesos e o código de inferência do modelo, mas também o conjunto de dados e o framework.

Série Phi-3 da MS

A Microsoft também lançou primeiro o modelo Phi-3 Mini (3,8 bilhões de parâmetros) em 23 de abril, e planeja lançar o Phi-3 Small (7 bilhões de parâmetros) e o Phi-3 Medium (14 bilhões de parâmetros) em breve. O Phi-3 Mini é um modelo aberto, disponível para uso comercial gratuito por qualquer pessoa. Todos os novos modelos da série Phi-3 serão oferecidos no Azure, o serviço de nuvem da Microsoft.

Llama 3 da Meta

O Meta (antigo Facebook) lançou as versões de 8 bilhões e 70 bilhões de parâmetros do modelo Llama 3 em 18 de abril, e planeja lançar a versão de 400 bilhões de parâmetros no verão. Em particular, o modelo de 8 bilhões de parâmetros está recebendo elogios da comunidade de desenvolvedores por seu desempenho superior, considerando seu tamanho menor.
Isso é atribuído ao investimento do Meta em uma quantidade significativa de dados de treinamento para criar uma estrutura de modelo eficiente. Isso pode ser visto como resultado da concentração na otimização de dados e algoritmos, em vez de aumentar o número de parâmetros.

Grok 1.5 da xAI

O modelo Grok 1.5 da xAI, apresentado em 38 de março, pode lidar com tokens de contexto longos de até 128K, permitindo prompts complexos e longos. Enquanto a tendência de desenvolvimento de modelos de linguagem até agora estava concentrada em aumentar o tamanho dos parâmetros, o Grok 1.5 apresentou um novo objetivo: melhorar a capacidade de compreensão de longos contextos.

⁠⁠⁠⁠⁠⁠⁠
Com o lançamento de novos grandes modelos de linguagem por empresas líderes como Apple, MS e Meta nas últimas semanas, a direção da evolução da tecnologia de IA está se tornando mais diversificada. Novas tentativas estão surgindo em vários aspectos, incluindo a redução do tamanho do modelo e a leveza, a otimização de dados/algoritmos e o fortalecimento da compreensão de contexto. Acompanharemos como o ecossistema de IA evoluirá no futuro.

해리슨
해리슨 블로그
해리슨의 깜짝 블로그
해리슨
Gemini 1.5 Flash e GPT-4o e preços de outros LLMs Comparação de preços e desempenho de modelos de IA mais recentes, como GPT-4o, Gemini 1.5 Pro, Claude 3 Haiku e Gemini 1.5 Flash, com orientações sobre como escolher o modelo certo para você. Considere o tamanho do token de entrada, a taxa de saída e a di

18 de maio de 2024

Serviços de IA recomendados recentemente Apresentamos os serviços de IA populares e recomendados recentemente. Excluindo o ChatGPT e o Gemini, compilamos serviços que podem aumentar sua eficiência no trabalho, incluindo NotebookLM e Perplexity AI. NotebookLM é um serviço fornecido pelo Google qu

23 de junho de 2024

Comparação de preços do ChatGPT vs Gemini Esta comparação analisa os dois principais serviços LLM atualmente lançados: ChatGPT e Gemini. O ChatGPT, baseado em tokens, é cobrado a $0,125 por 1 milhão de tokens, enquanto o Gemini, baseado em caracteres, é cobrado a $0,125 por 1 milhão de caracteres

7 de março de 2024

Construindo um AI Full Stack com Open Source Novos modelos de LLM (Large Language Model) de código aberto estão surgindo no ecossistema de IA. Mistral, Llama e phi-2 são alguns exemplos de modelos poderosos com licenças abertas que foram lançados. Ferramentas para utilizá-los também estão sendo dese
RevFactory
RevFactory
RevFactory
RevFactory

5 de fevereiro de 2024

Snowflake lança 'Arctic', LLM empresarial com o mais alto nível de abertura do setor A Snowflake lançou o 'Arctic', um modelo de linguagem de grande escala de código aberto. Ele está disponível sob a licença Apache 2.0 para uso comercial gratuito e oferece o mais alto nível de desempenho e eficiência do setor. Ele fornece eficiência de to
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)

25 de abril de 2024

O que é LLM (Large Language Model)? O modelo de linguagem de grande porte (LLM) é uma tecnologia central da inteligência artificial que aprende com uma quantidade enorme de dados de texto para adquirir a capacidade de processar linguagem semelhante à humana, podendo ser usada em uma varieda
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1 de abril de 2024

Integração do Google Gemini Ultra em Smartphones O Google anunciou planos para integrar seu modelo de IA exclusivo para nuvem, "Gemini Ultra", em smartphones no próximo ano. O avanço na tecnologia de compressão de LLM permitirá a execução em dispositivos, expandindo significativamente os recursos do sma
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1 de abril de 2024

Comparação do Gemini 1.5 vs 1.5 Pro (com exemplos) O Gemini 1.5 Pro é um modelo de IA mais poderoso que o Gemini 1.5, e pode ser usado para várias tarefas como análise de código, geração automática de testes unitários, conversão de código, etc. É particularmente adequado para o processamento de grandes vo
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

28 de junho de 2024

O paradoxo dos modelos de IA de ponta: Transparência A falta de transparência nos sistemas de IA de ponta tornou-se um problema sério. Pesquisadores da Universidade de Stanford analisaram 10 sistemas de IA, incluindo o GPT-4, e concluíram que nenhum modelo divulga informações de forma transparente, como ori
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son

14 de maio de 2024