Chủ đề
- #OpenAI GPT
- #Anthopic Claude3
- #So sánh giá cả
- #Google Gemini
Đã viết: 2024-05-18
Đã viết: 2024-05-18 11:24
Gần đây, trong hai ngày liên tiếp, Google và OpenAI đã công bố rất nhiều nội dung liên quan đến AI mới.
Nhìn chung, người dùng thường quan tâm đến 2 điểm chính.
Hiệu năng và giá cả. ( Tất nhiên còn nhiều tính năng khác nữa, nhưng các blogger chuyên nghiệp sẽ đánh giá chúng…)
Như thường lệ, OpenAI đã giảm giá GPT-4o so với GPT-4T trước đó. Về hiệu năng, có rất nhiều bài đánh giá trên các blog khác nên tôi sẽ bỏ qua, ở đây tôi chỉ tập trung vào giá cả.
Bảng giá GPT
Về cơ bản, Open AI đã giảm giá sau khi ra mắt GPT 4, bắt đầu từ GPT 3.5 Turbo. Tất nhiên, hiệu năng cũng được nâng cấp. Hiện tại, nếu bạn ưu tiên chi phí thấp, hãy chọn 3.5 Turbo. Còn lại, bạn có thể sử dụng 4o.
Bảng giá Claude 3
Mặc dù gần đây Anthropic chưa ra mắt sản phẩm mới, nhưng với Haiku có giá cả phải chăng và Opus hiệu năng cao, họ vẫn là một công ty LLM đáng chú ý.
Xét về giá token đầu vào, Haiku là lựa chọn rẻ nhất trong 3 công ty, rất phù hợp cho các tác vụ xử lý văn bản đơn giản.
Thậm chí, trước khi Gemini Flash ra mắt, Haiku còn có hiệu năng vượt trội so với Gemini 1.0 Pro, trở thành một LLM rất hữu ích.
Bảng giá Gemini
Google đang duy trì hai hệ thống giá.
Một là AI Studio, hai là Vertex AI.
AI Studio sử dụng cơ chế giá dựa trên Token, tương tự như các công ty khác. Trong khi đó, Vertex AI lại sử dụng cơ chế giá dựa trên số lượng ký tự, điều này khá đặc biệt.
Dựa trên bảng trên, nếu 1 token chứa dưới 3 ký tự (1-2 ký tự), thì Vertex AI sẽ rẻ hơn. Ngược lại, nếu 1 token chứa 3 ký tự trở lên, thì AI Studio sẽ rẻ hơn. Tuy nhiên, thông thường tiếng Anh thường có số lượng ký tự lớn hơn, nên AI Studio thường rẻ hơn. Tiếng Việt hiện nay cũng có xu hướng 1 token chứa nhiều ký tự hơn…
Tóm lại, xét về số lượng token đầu vào và hiệu năng, Gemini 1.5 Flash vượt trội hơn 1.0 Pro. Nếu cần thực hiện các tác vụ phức tạp, 1.5 Pro sẽ là lựa chọn tốt hơn.
Tổng quan
Xét về hiệu năng, dựa trên tiêu chí MMLU, thứ tự GPT-4o > Opus > 1.5 Pro.
Đối với các tác vụ đòi hỏi trí tuệ cao, hãy chọn GPT-4o. Nếu muốn sử dụng một giải pháp có giá cả phải chăng hơn, Gemini 1.5 Pro cũng là một lựa chọn tốt. Trải nghiệm thực tế có thể hơi khác nhau, vì vậy hãy lựa chọn phù hợp nhất với bạn.
Nếu cần xử lý khối lượng lớn văn bản với chi phí thấp, bạn có 2 lựa chọn:
Tỷ lệ đầu vào/đầu ra thấp ( Ví dụ: nhập một lượng lớn tài liệu và chỉ cần xuất ra kết quả ngắn gọn ) thì Claude 3 Haiku là lựa chọn rẻ nhất. Tuy nhiên, Haiku có chi phí đầu ra cao, ngược lại, tỷ lệ đầu vào/đầu ra cao ( Ví dụ: nhập một văn bản cụ thể và yêu cầu sửa đổi, thay đổi ) thì Gemini 1.5 Flash là lựa chọn được khuyến nghị. Trong trường hợp này, Flash có chi phí đầu ra thấp nhất.
"Tôi không quan tâm đến giá cả, chỉ cần hiệu năng tốt nhất cho các tác vụ phức tạp." -> GPT - 4o
"Nhưng, kích thước token đầu vào vượt quá 128K." ( GPT - 4o chỉ hỗ trợ tối đa 128K ) -> Opus
"Cần hiệu năng cao nhưng giá cả phải chăng hơn hoặc kích thước token vượt quá 200K." ( Opus chỉ hỗ trợ tối đa 200K ) -> Gemini 1.5 Pro
Tôi cần một LLM có giá cả phải chăng nhất. -> Haiku
Nhưng, tỷ lệ đầu vào/đầu ra thiên về đầu ra nhiều hơn hoặc vượt quá 200K token. -> Gemini 1.5 Flash
Bình luận0