Giá của Gemini 1.5 Flash, GPT-4o và các LLM khác

Gần đây, trong hai ngày liên tiếp, Google và OpenAI đã công bố rất nhiều nội dung liên quan đến AI mới.

Nhìn chung, người dùng thường quan tâm đến 2 điểm chính.

Hiệu năng và giá cả. ( Tất nhiên còn nhiều tính năng khác nữa, nhưng các blogger chuyên nghiệp sẽ đánh giá chúng…)

Open AI - GPT

Như thường lệ, OpenAI đã giảm giá GPT-4o so với GPT-4T trước đó. Về hiệu năng, có rất nhiều bài đánh giá trên các blog khác nên tôi sẽ bỏ qua, ở đây tôi chỉ tập trung vào giá cả.

Giá của Gemini 1.5 Flash, GPT-4o và các LLM khác

Bảng giá GPT

Về cơ bản, Open AI đã giảm giá sau khi ra mắt GPT 4, bắt đầu từ GPT 3.5 Turbo. Tất nhiên, hiệu năng cũng được nâng cấp. Hiện tại, nếu bạn ưu tiên chi phí thấp, hãy chọn 3.5 Turbo. Còn lại, bạn có thể sử dụng 4o.

Anthropic - Claude 3

Bảng giá Claude 3

Mặc dù gần đây Anthropic chưa ra mắt sản phẩm mới, nhưng với Haiku có giá cả phải chăng và Opus hiệu năng cao, họ vẫn là một công ty LLM đáng chú ý.

Xét về giá token đầu vào, Haiku là lựa chọn rẻ nhất trong 3 công ty, rất phù hợp cho các tác vụ xử lý văn bản đơn giản.

Thậm chí, trước khi Gemini Flash ra mắt, Haiku còn có hiệu năng vượt trội so với Gemini 1.0 Pro, trở thành một LLM rất hữu ích.

Google - Gemini

Bảng giá Gemini

Google đang duy trì hai hệ thống giá.

Một là AI Studio, hai là Vertex AI.

AI Studio sử dụng cơ chế giá dựa trên Token, tương tự như các công ty khác. Trong khi đó, Vertex AI lại sử dụng cơ chế giá dựa trên số lượng ký tự, điều này khá đặc biệt.

Dựa trên bảng trên, nếu 1 token chứa dưới 3 ký tự (1-2 ký tự), thì Vertex AI sẽ rẻ hơn. Ngược lại, nếu 1 token chứa 3 ký tự trở lên, thì AI Studio sẽ rẻ hơn. Tuy nhiên, thông thường tiếng Anh thường có số lượng ký tự lớn hơn, nên AI Studio thường rẻ hơn. Tiếng Việt hiện nay cũng có xu hướng 1 token chứa nhiều ký tự hơn…

Tóm lại, xét về số lượng token đầu vào và hiệu năng, Gemini 1.5 Flash vượt trội hơn 1.0 Pro. Nếu cần thực hiện các tác vụ phức tạp, 1.5 Pro sẽ là lựa chọn tốt hơn.

Tổng quan

Xét về hiệu năng, dựa trên tiêu chí MMLU, thứ tự GPT-4o > Opus > 1.5 Pro.

Đối với các tác vụ đòi hỏi trí tuệ cao, hãy chọn GPT-4o. Nếu muốn sử dụng một giải pháp có giá cả phải chăng hơn, Gemini 1.5 Pro cũng là một lựa chọn tốt. Trải nghiệm thực tế có thể hơi khác nhau, vì vậy hãy lựa chọn phù hợp nhất với bạn.

Nếu cần xử lý khối lượng lớn văn bản với chi phí thấp, bạn có 2 lựa chọn:

Tỷ lệ đầu vào/đầu ra thấp ( Ví dụ: nhập một lượng lớn tài liệu và chỉ cần xuất ra kết quả ngắn gọn ) thì Claude 3 Haiku là lựa chọn rẻ nhất. Tuy nhiên, Haiku có chi phí đầu ra cao, ngược lại, tỷ lệ đầu vào/đầu ra cao ( Ví dụ: nhập một văn bản cụ thể và yêu cầu sửa đổi, thay đổi ) thì Gemini 1.5 Flash là lựa chọn được khuyến nghị. Trong trường hợp này, Flash có chi phí đầu ra thấp nhất.

Tóm tắt và kết luận

"Tôi không quan tâm đến giá cả, chỉ cần hiệu năng tốt nhất cho các tác vụ phức tạp." -> GPT - 4o

"Nhưng, kích thước token đầu vào vượt quá 128K." ( GPT - 4o chỉ hỗ trợ tối đa 128K ) -> Opus

"Cần hiệu năng cao nhưng giá cả phải chăng hơn hoặc kích thước token vượt quá 200K." ( Opus chỉ hỗ trợ tối đa 200K ) -> Gemini 1.5 Pro

Tôi cần một LLM có giá cả phải chăng nhất. -> Haiku

Nhưng, tỷ lệ đầu vào/đầu ra thiên về đầu ra nhiều hơn hoặc vượt quá 200K token. -> Gemini 1.5 Flash