- Dòng sản phẩm Gemini mới của Google - Phiên bản thử nghiệm
- Google đã phát hành các phiên bản thử nghiệm Gemini 1.5 Pro, Flash và Flash 8B, với Pro và Flash có hiệu năng được cải thiện so với các phiên bản trước. Đặc biệt, Flash 8B là một mô hình được tối ưu hóa về dung lượng, cho thấy kết quả khả quan trong một s
Gemini 1.5 Flash 8b
Gần đây, Gemini Flash 8b đã được phát hành trên AI Studio.
Trước mắt, trong thời gian ngắn (đến ngày 14 tháng 10), sẽ không bị tính phí. (Sau đó, mặc dù vẫn có tầng miễn phí, nhưng bị giới hạn tối đa 15 lần/phút, 1500 lần/ngày)
Hiện tại, tối đa 4000 lần/phút được cung cấp miễn phí. Vì vậy, tôi đang thử nghiệm áp dụng nó vào một số dịch vụ và đã tiến hành nhiều bài kiểm tra về hiệu năng và hiệu suất.
Đầu tiên là hiệu năng.
So sánh với Gemini Flash-002, hiệu năng rõ ràng giảm sút. Có vẻ tương tự như Flash-001 cũ.
Bài viết trướcđã nói rằng Flash8b tương tự như Gemini Flash 001, và thực tế sử dụng cũng đúng như vậy.
Giá công bố của Flash-8b chỉ bằng một nửa so với Flash, nên hiện tại tôi đang cân nhắc. Liệu mình có thể tiếp tục sử dụng nó không...
Có vẻ chỉ có thể sử dụng cho các chức năng đơn giản. Ví dụ, có lẽ chỉ có thể sử dụng cho các tác vụ phân loại đơn giản. Nếu cần LLM thực hiện các tác vụ phức tạp hơn, đòi hỏi kiến thức chuyên môn, thì có phần thiếu sót.
Tốc độ.
Về tốc độ, "theo công bố" thì nhanh hơn Flash, nhưng tôi không chắc lắm. Tốc độ gần như tương đương nhau, khó phân biệt.
Tôi chưa thử gọi 4000 lần/giây nên không biết tốc độ đó như thế nào. (Có lẽ trong tương lai cũng không cần dùng đến)
Khi sử dụng AI Studio, vấn đề về bộ lọc an toàn khá đáng lo ngại.
Khi phân loại nội dung tin tức, đôi khi xảy ra lỗi do không thể tắt bộ lọc an toàn.
Tổng kết.
Hiện tại, chỉ với AI Studio thì việc sử dụng toàn diện vẫn còn khó khăn. Tôi sẽ thử nghiệm lại khi nó được tích hợp vào Vertex AI.
Bình luận0