Gemini 1.5 Flash、GPT-4o 及其他 LLM 的價格

最近兩天，Google 和 OpenAI 接連發布了大量關於新 AI 的內容。

一般人最想知道的，主要有兩個方面。

效能和價格。（當然還有很多其他功能，但那些就留給專業部落客來評測了…）

Open AI - GPT

OpenAI 一如既往，新版 GPT-4o 比之前的 GPT-4T 更便宜了。效能方面，網路上有很多部落格都做了詳細的評測，這裡就不贅述了，我們先只談價格。

GPT 價格表

基本上，Open AI 在 GPT 3.5 Turbo 之後，首先推出了 GPT 4，之後每次推出新產品時，價格都會降低。當然，效能也會升級。目前來看，如果需要選擇更便宜的方案，那當然是 3.5 Turbo。其他情況下，使用 4o 就可以了。

Anthropic - Claude 3

Claude 3 價格表

最近 Anthropic 雖然沒有發布新產品，但由於其性價比高的 Haiku 和高性能的 Opus，使其成為不可忽視的 LLM 公司。

以輸入 Token 價格為基準，Haiku 在三家公司中是最便宜的，在處理簡單文本時，是最划算的選擇。

甚至，在 Gemini Flash 推出之前，Haiku 的性能比 Gemini 1.0 Pro 還要好，是一個非常有用的 LLM。

Google - Gemini

Gemini 價格表

Google 維護了兩種定價系統。

一個是 AI Studio，另一個是 Vertex AI。

AI Studio 與其他公司一樣，採用 Token 價格，而 Vertex AI 則採用了獨特的字元為基礎的定價。

根據上表，如果一個 Token 平均少於 3 個字元（1-2 個字元），那麼使用 Vertex AI 會比較便宜，如果超過 3 個字元，則使用 AI Studio 會更便宜。不過，英文通常字元數都比較多，所以 AI Studio 通常會更便宜。韓文現在也越來越多情況下一個 Token 包含多個字元了…

總之，無論是從輸入 Token 還是效能來看，Gemini 1.5 Flash 都比 1.0 Pro 好得多。如果需要進行高性能的任務，1.5 Pro 會更勝一籌。

綜合

僅從效能方面來看，以 MMLU 為基準，GPT-4o > Opus > 1.5 Pro 的順序。

如果需要進行高度智力化的工作，可以使用 GPT-4o。如果想要使用價格稍微便宜一點的，也可以考慮 Gemini 1.5 Pro。實際使用時，感受會略有不同，所以大家可以根據自己的需求選擇最適合自己的。

如果需要以低廉的價格處理大量的文本任務，則有兩個選擇。

輸入與輸出的比例較低（例如，輸入大量文件並需要輸出簡短結果的情況）時，Claude 3 Haiku 最便宜。但 Haiku 的輸出成本較高，反之，輸出的比例較高（例如，輸入特定文本後，指示其進行修改或更改的操作）時，推薦使用 Gemini 1.5 Flash。這種情況下，Flash 的輸出成本最低。

總結及結論

「我不管價格，就是要用最好的，處理最複雜的工作。」 -> GPT - 4o

「但是，輸入 Token 的大小超過了 128K。」（GPT - 4o 只能處理 128K 以內的）-> Opus

「需要高性能，但價格更便宜一些，或者 Token 的大小超過了 200K。」（Opus 只能處理 200K 以內的）-> Gemini 1.5 Pro

我需要最便宜的 LLM。-> Haiku

但是，在輸入/輸出比例中，輸出稍微多一些，或者超過了 200K Token。-> Gemini 1.5 Flash