Đây là bài viết được dịch bởi AI.
Chọn ngôn ngữ
Văn bản được tóm tắt bởi AI durumis
- Google đã phát hành các mô hình thử nghiệm mới, bao gồm Gemini 1.5 Pro Exp, Gemini 1.5 Flash Exp, Gemini 1.5 Flash 8B Exp. Đặc biệt, Gemini 1.5 Pro Exp có hiệu suất được cải thiện so với phiên bản trước đó, và Gemini 1.5 Flash Exp đã được nâng cấp lên mức độ cao nhất trong số các phiên bản entry.
- Gemini 1.5 Flash 8B Exp cho thấy hiệu suất tương tự như Claude 3 Sonnet và là phiên bản nhẹ hơn của dòng Flash. Trong việc dịch văn bản có cấu trúc JSON phức tạp, nó hơi kém hơn dòng Pro, nhưng trong các tác vụ tóm tắt và viết bài, nó đã cho thấy kết quả khả quan.
- Google dự kiến sẽ cung cấp Gemini 1.5 Flash 8B Exp với giá rẻ khi phát hành chính thức, điều này sẽ tác động lớn đến các dòng sản phẩm của các công ty khác. Sau khi phát hành, chúng tôi sẽ so sánh lại bảng giá và chia sẻ thông tin.
Google vừa ra mắt các mô hình mới của Gemini.
Thực tế, đây không phải là phiên bản chính thức mà là phiên bản thử nghiệm (Experimental).
Các mô hình đó là:
- Gemini 1.5 Pro Exp
- Gemini 1.5 Flash Exp
- Gemini 1.5 Flash 8B Exp
Đầu tiên, 1.5 Pro Exp và 1.5 Flash Exp có thể được coi là bản cập nhật của các phiên bản cũ. Thực tế khi thử nghiệm, 1.5 Pro Exp cho thấy hiệu suất cao hơn so với 1.5 Pro (hiệu suất điểm chuẩn cũng được cải thiện. Mặc dù không có tài liệu nhưng nó có thể được coi là phiên bản tốt nhất trong số các phiên bản đã phát hành). 1.5 Flash Exp cũng không phải là tốt nhất, nhưng nó đã được cải thiện đáng kể so với các phiên bản entry-level.
Theo họ, hai phiên bản này sẽ được tích hợp vào phiên bản 1.5 Pro và 1.5 Flash hiện tại trong vòng vài tuần. (Phiên bản hiện tại là 001 nên có thể sẽ được cập nhật lên phiên bản 002.)
Nguồn: Chatbot Arena
Nhìn vào bảng, phiên bản Gemini 1.5 Pro Exp xếp thứ 2 và Gemini 1.5 Flash Exp xếp thứ 6.
Điều thú vị là Gemini 1.5 Flash Exp lại xếp trên Gemini 1.5 Pro ở vị trí thứ 10 và 11.
Từ vị trí thứ 1 đến 5 là các phiên bản hàng đầu của mỗi công ty (GPT 4o, Gemini 1.5 Pro, Grok 2), vị trí thứ 6, 7 là các dòng entry của mỗi công ty (GPT 4o mini, Gemini 1.5 Flash). Claude 3.5 Sonnet đã từng là phiên bản tốt nhất trong một thời gian dài... Tốc độ phát triển trong ngành này thực sự...
Dù sao đi nữa, cá nhân tôi nghĩ rằng hai phiên bản này (1.5 Pro, 1.5 Flash) sẽ sớm trở thành phiên bản chính thức, và điều tôi đang tò mò là phiên bản 1.5 Flash 8b.
Trước tiên, hãy xem điểm chuẩn một lần.
Nguồn: Chatbot Arena
Nhìn vào điểm chuẩn ở trên, hiệu suất của 1.5 Flash 8b Exp xấp xỉ với Claude 3 Sonnet và cao hơn hoặc thấp hơn một chút so với 1.5 Flash, nhưng nó lại có hiệu suất tương tự với Llama 3 70 b.
Flash là phiên bản rút gọn của Pro, Flash 8b là phiên bản rút gọn hơn nữa (có lẽ là như vậy?)
Trước tiên, tôi đã thử nghiệm một số chức năng trực tiếp, đây là các bài kiểm tra câu lệnh được sử dụng nhiều trong dịch vụ của chúng tôi.
- Dịch.
- Tóm tắt.
- Viết bài.
Có rất nhiều bài kiểm tra khác ở những nơi khác, vì vậy tôi chỉ kiểm tra một số bài đơn giản. Khi dịch văn bản có cấu trúc JSON phức tạp, Flash không cho ra kết quả như mong đợi, nhưng Pro lại rất tuyệt vời. Hơn nữa, phiên bản Pro Exp lại cho ra kết quả rõ ràng hơn.
Flash và thậm chí cả Flash 8b đều cho ra kết quả tốt trong việc tóm tắt và viết bài. Điều này cho thấy Flash 8b có thể được sử dụng cho các tác vụ đơn giản, miễn là không phải là tác vụ quá phức tạp.
Theo hiệu suất và số lượng tham số, Google có khả năng sẽ định giá Flash 8b khá thấp khi ra mắt chính thức.
Có lẽ họ sẽ định giá nó đủ thấp để gây tổn hại lớn cho các dòng sản phẩm của các đối thủ cạnh tranh. Khi ra mắt, tôi sẽ "lại" mang bảng giá đến.