해리슨 블로그

Revisão do Gemini Flash 8b

  • Idioma de escrita: Coreana
  • País de referência: Todos os paísescountry-flag
  • TI

Criado: 2024-10-07

Criado: 2024-10-07 21:13

Revisão do Gemini Flash 8b

Gemini 1.5 Flash 8b

Recentemente, o Gemini Flash 8b foi lançado no AI Studio.

Por enquanto (até 14 de outubro), não haverá cobrança. (Mesmo depois, haverá um nível gratuito, mas com um limite de 15 chamadas por minuto e 1500 chamadas por dia).

Atualmente, são oferecidos até 4.000 chamadas gratuitas por minuto. Por isso, estamos testando sua aplicação em alguns serviços e realizando diversos testes de desempenho e performance.


Primeiro, o desempenho.

Comparado ao Gemini Flash-002, o desempenho é definitivamente inferior. Parece semelhante ao antigo Flash-001.

Postagem anteriormencionei que o Flash8b é semelhante ao Gemini Flash 001, e após o uso prático, confirmo isso.

O preço anunciado para o Flash-8b é metade do preço do Flash, então estou em dúvida se continuarei usando.

Parece que ele só pode ser usado em funções muito simples, como tarefas de classificação simples. Para tarefas que exigem conhecimento prévio ou informações contextuais complexas para o LLM, sinto falta de recursos.

Velocidade.

Em relação à velocidade, o anúncio diz que é mais rápido que o Flash, mas não tenho certeza. É tão semelhante que não consigo distinguir.

Como não testei 4.000 chamadas por segundo, não sei ao certo a velocidade. (Provavelmente não vou usar tanto.)

Usando o AI Studio, notei alguns problemas com o filtro de segurança.

Ao classificar conteúdo de notícias, o filtro de segurança não foi desativado e, ocasionalmente, ocorreram erros.


Conclusão.

Usando apenas o AI Studio, ainda é um pouco difícil obter o uso desejado. Preciso testar novamente depois que for implementado no Vertex AI.

Comentários0