![translation](https://cdn.durumis.com/common/trans.png)
Đây là bài viết được dịch bởi AI.
Chọn ngôn ngữ
Văn bản được tóm tắt bởi AI durumis
- So sánh và phân tích hiệu suất và giá cả của các mô hình AI khác nhau như GPT-4o, Opus, Gemini 1.5 Pro, Haiku, Gemini 1.5 Flash, nêu bật ưu điểm và nhược điểm của từng mô hình và đề xuất mô hình phù hợp với mục đích sử dụng.
- Cung cấp hướng dẫn chọn AI phù hợp nhất cho người dùng, xem xét kích thước token đầu vào, tỷ lệ đầu ra, độ phức tạp của tác vụ.
- Dựa trên thông tin hiệu suất và giá cả của các mô hình AI mới nhất tính đến ngày 30 tháng 5 năm 2024, giúp người dùng đưa ra lựa chọn sáng suốt.
Trong hai ngày liên tiếp, Google và OpenAI đã công bố rất nhiều nội dung mới liên quan đến AI.
Nói chung, người dùng thường tò mò về hai điều:
Hiệu suất và giá cả. (Có nhiều tính năng khác, nhưng những blogger chuyên nghiệp sẽ đánh giá chúng...)
Open AI - GPT
Như thường lệ, OpenAI đã giảm giá cho phiên bản GPT-4o mới hơn so với GPT-4T trước đó. Hiệu suất thì đã có rất nhiều đánh giá trên các blog khác, nên ở đây chúng ta chỉ tập trung vào giá.
Bảng giá GPT
Nói chung, OpenAI đã giảm giá mỗi khi tung ra sản phẩm mới, kể từ khi GPT 3.5 Turbo được ra mắt và GPT 4 xuất hiện. Hiệu suất được nâng cấp, tất nhiên. Hiện tại, nếu bạn muốn chọn một giải pháp tiết kiệm thì hãy chọn 3.5 Turbo. Còn lại, bạn có thể sử dụng 4o.
Anthropic - Claude 3
Bảng giá Claude 3
Mặc dù Anthropic chưa phát hành sản phẩm mới gần đây, nhưng với Haiku và Opus, hai phiên bản có hiệu suất tốt, Anthropic vẫn là một công ty LLM đáng chú ý.
Haiku là phiên bản rẻ nhất trong 3 công ty về giá token đầu vào, phù hợp để xử lý văn bản đơn giản.
Thậm chí, trước khi Gemini Flash ra mắt, Haiku còn có hiệu suất tốt hơn cả Gemini 1.0 Pro, khiến nó trở thành một LLM rất hữu ích.
Google - Gemini
Bảng giá Gemini
Google duy trì hai hệ thống giá.
Một là AI Studio, hai là Vertex AI.
AI Studio, giống như các công ty khác, sử dụng cơ chế giá dựa trên token, trong khi Vertex AI sử dụng cơ chế giá dựa trên số lượng ký tự.
Nếu xem xét bảng trên, nếu một token chứa dưới 3 ký tự (1-2 ký tự) thì sử dụng Vertex AI sẽ rẻ hơn, còn nếu trên 3 ký tự thì sử dụng AI Studio sẽ rẻ hơn. Nhưng, với tiếng Anh, số lượng ký tự thường nhiều hơn, nên AI Studio sẽ rẻ hơn. Tiếng Hàn ngày nay cũng thường có trường hợp 1 token chứa nhiều ký tự.
Dù sao, nếu chỉ xét về token đầu vào và hiệu suất, Gemini 1.5 Flash tốt hơn nhiều so với 1.0 Pro. Nếu bạn cần thực hiện các tác vụ đòi hỏi hiệu suất cao thì 1.5 Pro là lựa chọn tối ưu.
Tổng kết
Tổng quan
Chỉ xét về hiệu suất dựa trên tiêu chí MMLU thì GPT-4o > Opus > 1.5 Pro.
Nếu bạn cần thực hiện các tác vụ trí tuệ phức tạp thì hãy sử dụng GPT-4o. Nếu muốn sử dụng một giải pháp rẻ hơn thì có thể sử dụng Gemini 1.5 Pro. Trên thực tế, hiệu suất của chúng có sự khác biệt khi sử dụng, vì vậy bạn nên lựa chọn giải pháp phù hợp với nhu cầu của mình.
Nếu bạn cần thực hiện nhiều tác vụ văn bản với chi phí thấp thì có 2 lựa chọn:
Trong trường hợp tỷ lệ đầu vào/đầu ra thấp (ví dụ: nhập lượng lớn tài liệu và xuất ra kết quả ngắn gọn) thì Claude 3 Haiku là lựa chọn rẻ nhất. Tuy nhiên, Haiku có chi phí đầu ra cao, vì vậy, ngược lại, trong trường hợp tỷ lệ đầu vào/đầu ra cao (ví dụ: nhập một đoạn văn bản cụ thể và yêu cầu sửa đổi, thay đổi) thì Gemini 1.5 Flash là lựa chọn được khuyên dùng. Bởi vì trong trường hợp đó, Flash có chi phí đầu ra thấp nhất.
Tóm tắt và kết luận
"Tôi không quan tâm đến giá cả, tôi muốn sử dụng giải pháp tốt nhất để thực hiện các tác vụ phức tạp." -> GPT - 4o
"Nhưng kích thước token đầu vào của tôi vượt quá 128K" (GPT-4o chỉ hỗ trợ tối đa 128K) -> Opus
"Tôi cần hiệu suất cao nhưng giá cả phải chăng hơn hoặc kích thước token vượt quá 200K" (Opus chỉ hỗ trợ tối đa 200K) -> Gemini 1.5 Pro
"Tôi cần một LLM rẻ nhất." -> Haiku
"Nhưng tỷ lệ đầu vào/đầu ra cao hơn hoặc kích thước token vượt quá 200K." -> Gemini 1.5 Flash