Try using it in your preferred language.

English

  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar
translation

Đây là bài viết được dịch bởi AI.

해리슨 블로그

Giá của Gemini 1.5 Flash, GPT-4o và các LLM khác

  • Ngôn ngữ viết: Tiếng Hàn Quốc
  • Quốc gia cơ sở: Tất cả các quốc gia country-flag

Chọn ngôn ngữ

  • Tiếng Việt
  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar

Văn bản được tóm tắt bởi AI durumis

  • So sánh và phân tích hiệu suất và giá cả của các mô hình AI khác nhau như GPT-4o, Opus, Gemini 1.5 Pro, Haiku, Gemini 1.5 Flash, nêu bật ưu điểm và nhược điểm của từng mô hình và đề xuất mô hình phù hợp với mục đích sử dụng.
  • Cung cấp hướng dẫn chọn AI phù hợp nhất cho người dùng, xem xét kích thước token đầu vào, tỷ lệ đầu ra, độ phức tạp của tác vụ.
  • Dựa trên thông tin hiệu suất và giá cả của các mô hình AI mới nhất tính đến ngày 30 tháng 5 năm 2024, giúp người dùng đưa ra lựa chọn sáng suốt.

Trong hai ngày liên tiếp, Google và OpenAI đã công bố rất nhiều nội dung mới liên quan đến AI.

Nói chung, người dùng thường tò mò về hai điều:

Hiệu suất và giá cả. (Có nhiều tính năng khác, nhưng những blogger chuyên nghiệp sẽ đánh giá chúng...)

Open AI - GPT

Như thường lệ, OpenAI đã giảm giá cho phiên bản GPT-4o mới hơn so với GPT-4T trước đó. Hiệu suất thì đã có rất nhiều đánh giá trên các blog khác, nên ở đây chúng ta chỉ tập trung vào giá.

Bảng giá GPT


Nói chung, OpenAI đã giảm giá mỗi khi tung ra sản phẩm mới, kể từ khi GPT 3.5 Turbo được ra mắt và GPT 4 xuất hiện. Hiệu suất được nâng cấp, tất nhiên. Hiện tại, nếu bạn muốn chọn một giải pháp tiết kiệm thì hãy chọn 3.5 Turbo. Còn lại, bạn có thể sử dụng 4o.


Anthropic - Claude 3

Bảng giá Claude 3

Mặc dù Anthropic chưa phát hành sản phẩm mới gần đây, nhưng với Haiku và Opus, hai phiên bản có hiệu suất tốt, Anthropic vẫn là một công ty LLM đáng chú ý.

Haiku là phiên bản rẻ nhất trong 3 công ty về giá token đầu vào, phù hợp để xử lý văn bản đơn giản.

Thậm chí, trước khi Gemini Flash ra mắt, Haiku còn có hiệu suất tốt hơn cả Gemini 1.0 Pro, khiến nó trở thành một LLM rất hữu ích.


Google - Gemini

Bảng giá Gemini

Google duy trì hai hệ thống giá.

Một là AI Studio, hai là Vertex AI.

AI Studio, giống như các công ty khác, sử dụng cơ chế giá dựa trên token, trong khi Vertex AI sử dụng cơ chế giá dựa trên số lượng ký tự.

Nếu xem xét bảng trên, nếu một token chứa dưới 3 ký tự (1-2 ký tự) thì sử dụng Vertex AI sẽ rẻ hơn, còn nếu trên 3 ký tự thì sử dụng AI Studio sẽ rẻ hơn. Nhưng, với tiếng Anh, số lượng ký tự thường nhiều hơn, nên AI Studio sẽ rẻ hơn. Tiếng Hàn ngày nay cũng thường có trường hợp 1 token chứa nhiều ký tự.

Dù sao, nếu chỉ xét về token đầu vào và hiệu suất, Gemini 1.5 Flash tốt hơn nhiều so với 1.0 Pro. Nếu bạn cần thực hiện các tác vụ đòi hỏi hiệu suất cao thì 1.5 Pro là lựa chọn tối ưu.


Tổng kết

Tổng quan

Chỉ xét về hiệu suất dựa trên tiêu chí MMLU thì GPT-4o > Opus > 1.5 Pro.

Nếu bạn cần thực hiện các tác vụ trí tuệ phức tạp thì hãy sử dụng GPT-4o. Nếu muốn sử dụng một giải pháp rẻ hơn thì có thể sử dụng Gemini 1.5 Pro. Trên thực tế, hiệu suất của chúng có sự khác biệt khi sử dụng, vì vậy bạn nên lựa chọn giải pháp phù hợp với nhu cầu của mình.

Nếu bạn cần thực hiện nhiều tác vụ văn bản với chi phí thấp thì có 2 lựa chọn:

Trong trường hợp tỷ lệ đầu vào/đầu ra thấp (ví dụ: nhập lượng lớn tài liệu và xuất ra kết quả ngắn gọn) thì Claude 3 Haiku là lựa chọn rẻ nhất. Tuy nhiên, Haiku có chi phí đầu ra cao, vì vậy, ngược lại, trong trường hợp tỷ lệ đầu vào/đầu ra cao (ví dụ: nhập một đoạn văn bản cụ thể và yêu cầu sửa đổi, thay đổi) thì Gemini 1.5 Flash là lựa chọn được khuyên dùng. Bởi vì trong trường hợp đó, Flash có chi phí đầu ra thấp nhất.


Tóm tắt và kết luận

"Tôi không quan tâm đến giá cả, tôi muốn sử dụng giải pháp tốt nhất để thực hiện các tác vụ phức tạp." -> GPT - 4o

"Nhưng kích thước token đầu vào của tôi vượt quá 128K" (GPT-4o chỉ hỗ trợ tối đa 128K) -> Opus

"Tôi cần hiệu suất cao nhưng giá cả phải chăng hơn hoặc kích thước token vượt quá 200K" (Opus chỉ hỗ trợ tối đa 200K) -> Gemini 1.5 Pro


"Tôi cần một LLM rẻ nhất." -> Haiku

"Nhưng tỷ lệ đầu vào/đầu ra cao hơn hoặc kích thước token vượt quá 200K." -> Gemini 1.5 Flash


해리슨
해리슨 블로그
해리슨의 깜짝 블로그
해리슨
So sánh giá giữa Claude 3 và Gemini GCP hiện đã cho phép sử dụng mô hình Anthropic's Claude 3 Haiku, và kết quả đánh giá bằng cách sử dụng RAG của H2O.ai cho thấy nó có hiệu suất cao hơn so với Gemini với cùng mức giá. Claude 3 Haiku là lựa chọn tiết kiệm nhất khi xét đến chi phí đầu vào và

7 tháng 4, 2024

So sánh giá ChatGPT vs Gemini So sánh hai dịch vụ LLM chính hiện tại là ChatGPT và Gemini. ChatGPT dựa trên token có giá $0,125 cho 1 triệu token, Gemini dựa trên ký tự có giá $0,125 cho 1 triệu ký tự đầu vào, $0,375 cho 1 triệu ký tự đầu ra. Ví dụ: "Hôm nay thời tiết như thế nào?" ch

7 tháng 3, 2024

Dịch vụ AI đáng chú ý gần đây Bài viết giới thiệu các dịch vụ AI nổi tiếng và đáng chú ý gần đây. Ngoài ChatGPT và Gemini, bài viết còn tổng hợp các dịch vụ như NotebookLM và Perplexity AI giúp tăng hiệu quả công việc. NotebookLM là dịch vụ do Google cung cấp, cho phép người dùng nhập

23 tháng 6, 2024

So sánh Gemini 1.5 và 1.5 Pro (Bao gồm ví dụ) Gemini 1.5 Pro là một mô hình AI mạnh mẽ hơn Gemini 1.5, có thể được sử dụng cho nhiều tác vụ khác nhau như phân tích mã, tự động tạo kiểm thử đơn vị, chuyển đổi mã, v.v. Đặc biệt phù hợp cho xử lý dữ liệu quy mô lớn và các tác vụ phức tạp.
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

28 tháng 6, 2024

Sự nghịch lý của các mô hình AI tiên phong, tính minh bạch Thiếu tính minh bạch trong các hệ thống AI tiên tiến đã trở thành một vấn đề nghiêm trọng. Các nhà nghiên cứu tại Đại học Stanford đã phân tích 10 hệ thống AI, bao gồm cả GPT-4, và kết luận rằng không có mô hình nào công khai minh bạch thông tin về nguồn
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son

14 tháng 5, 2024

Hoàn thành AI Full Stack bằng mã nguồn mở Các mô hình LLM (mô hình ngôn ngữ lớn) mã nguồn mở mới đang xuất hiện trong hệ sinh thái AI. Mistral, Llama, phi-2, v.v., là những mô hình có hiệu suất mạnh mẽ và giấy phép mở được công khai, và nhiều công cụ khác đang được phát triển để sử dụng chúng. La
RevFactory
RevFactory
RevFactory
RevFactory

5 tháng 2, 2024

Trang bị Google Gemini Ultra cho điện thoại thông minh Google dự kiến trang bị mô hình AI dành riêng cho đám mây 'Gemini Ultra' cho điện thoại thông minh vào năm sau. Sự phát triển của công nghệ nén LLM cho phép thực thi trên thiết bị, mở rộng đáng kể chức năng của điện thoại thông minh. Morgan Stanley dự đoá
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1 tháng 4, 2024

OpenAI phát hành ứng dụng ChatGPT dành cho máy tính để bàn macOS cho người dùng miễn phí Phiên bản macOS của ChatGPT, công cụ AI tạo sinh do OpenAI cung cấp, đã được phát hành miễn phí. Hỗ trợ macOS 14 trở lên, sử dụng GPT-4o để cung cấp nhiều tính năng như đặt câu hỏi về nội dung hình ảnh, trò chuyện bằng giọng nói, chụp ảnh màn hình.
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan

26 tháng 6, 2024

Mr. Know-All – 2023.7 Tạp chí AI hàng tháng "Mr. Know-All" số 1 tháng 7 năm 2023 giới thiệu Claude 2, Azure OpenAI, LangChain, LlamaIndex và các công nghệ và xu hướng AI mới nhất. Đặc biệt, bài viết cung cấp hướng dẫn chi tiết về LlamaIndex - công cụ nhúng dữ liệu cá nhân và k
Pilot AISmrteasy
Pilot AISmrteasy
Pilot AISmrteasy
Pilot AISmrteasy

21 tháng 3, 2024