- Новая линейка Gemini от Google — Экспериментальная
- Google выпустила экспериментальные версии Gemini 1.5 Pro, Flash и Flash 8B, при этом Pro и Flash демонстрируют улучшенную производительность по сравнению с предыдущими версиями. В частности, Flash 8B — это облегченная модель, которая показывает удовлетвор
Gemini 1.5 Flash 8b
Некоторое время назад в AI Studio был выпущен Gemini Flash 8b.
В первую очередь, на некоторое время (до 14 октября) плата не будет взиматься. (Даже после этого будет бесплатный уровень, но с ограничением до 15 запросов в минуту и 1500 запросов в день)
В настоящее время бесплатно предоставляется до 4000 запросов в минуту. Поэтому мы тестируем его в некоторых сервисах и проводим различные тесты производительности и эффективности.
В первую очередь, производительность.
По сравнению с Gemini Flash-002, производительность определенно ниже. Похоже на старый Flash-001.
Предыдущая записьВ предыдущей статье говорилось, что Flash8b похож на Gemini Flash 001, и на практике это так.
Объявленная цена Flash-8b вдвое ниже, чем у Flash, поэтому сейчас я немного сомневаюсь. Смогу ли я продолжать его использовать...
Кажется, его можно использовать только для очень простых функций. Например, только для простых задач классификации. Если необходимо поручить LLM задачу, требующую сложных предварительных знаний, то это вызывает некоторое разочарование.
Скорость.
Согласно "объявленным" данным, скорость по сравнению с Flash увеличилась, но я не уверен. Они примерно одинаковы, и я не могу их различить.
Я не проверял скорость 4000 вызовов в секунду. (Вряд ли я буду это делать в будущем)
Используя AI Studio, я столкнулся с некоторыми проблемами с фильтром безопасности.
При классификации новостного контента иногда возникали ошибки из-за невозможности отключить фильтр безопасности.
Заключение.
Пока что использование AI Studio в полном объеме несколько затруднено. После внедрения в Vertex AI я проведу повторное тестирование.
Комментарии0