选择语言
durumis AI 总结的文章
- GPT-4o、Opus、Gemini 1.5 Pro、Haiku、Gemini 1.5 Flash 等各種 AI 模型的性能和價格 比較分析,提出每個模型的優缺點,並根據使用目的推薦合適的模型。
- 考慮輸入 Token 大小、輸出比率、任務複雜度等,為使用者提供最佳的 AI 模型選擇指南。
- 基於 2024 年 5 月 30 日的最新 AI 模型性能和價格信息,幫助使用者做出明智的選擇。
這次, Google 和 OpenAI 在兩天內連續發布了大量與新 AI 相關的內容。
一般人想知道的重點主要有兩個。
效能和價格。(當然還有更多功能,但那些就留給專業部落客來評論了...)
Open AI - GPT
OpenAI 一如往常,新型 4o 比之前的 GPT-4T 更便宜。效能方面,其他許多部落格都有很多評論, 所以這裡就不提了,先講講價格。
GPT 價格表
基本上,Open AI 在推出 GPT 4 後,每次推出新產品都會調降價格。 當然效能也都有提升。就目前而言,如果需要選擇較便宜的選項,就用 3.5 Turbo。其他情況, 用 4o 就可以了。
Anthropic - Claude 3
Claude 3 價格表
雖然 Anthropic 最近沒有發布新產品,但因為有性價比高的 Haiku 和高性能的 Opus, 所以不能忽視這家 LLM 公司。
以輸入 Token 價格來看,Haiku 是三家中最便宜的,處理簡單文本時是最便宜的。
甚至在 Gemini Flash 推出之前,Haiku 的性能比 Gemini 1.0 Pro 還好, 是一款非常有用的 LLM。
Google - Gemini
Gemini 價格表
Google 保持了兩種定價系統。
一個是 AI Studio,另一個是 Vertex AI。
AI Studio 與其他公司一樣,採用 Token 為基礎的定價,而 Vertex AI 採用字元為基礎的定價。
根據上表,如果 1 個 Token 平均少於 3 個字元(1~2 個字元), 使用 Vertex AI 會比較便宜,而如果超過 3 個字元,則使用 AI Studio 會比較便宜。 不過,通常英文單詞的字元數都會超過,所以 AI Studio 會比較便宜。韓文現在也經常出現 1 個 Token 包含多個字元的情況...
總之,無論是輸入 Token 還是效能,Gemini 1.5 Flash 都比 1.0 Pro 好很多。 如果需要高性能的作業,1.5 Pro 會比較好。
綜合
綜合
僅從效能來看,以 MMLU 為基準,似乎是 GPT-4o > Opus > 1.5 Pro 的順序。
如果需要高度智力作業,請使用 GPT-4o。如果想要使用稍微便宜一點的, 可以使用 Gemini 1.5 Pro。實際使用起來,體驗可能會略有不同,所以使用者可以選擇最適合自己的 那個。
如果需要以低廉的價格完成大量的文本作業,有兩個選擇:
輸入與輸出比例較低的情況 (例如,輸入大量的文件,並需要輸出簡短的結果)使用 Claude 3 Haiku 最便宜。 但 Haiku 的輸出成本很高,反之,如果輸出的比例較高的情況 (例如,輸入特定文本後,指示修改或更改文本)推薦使用 Gemini 1.5 Flash。 這種情況下,Flash 的輸出成本最低。
總結和結論
"我不在乎價格,我只想完成最複雜的作業。" -> GPT - 4o
"但是,輸入 Token 的大小超過了 128K。"(GPT - 4o 只能處理 128K 以下的 Token) -> Opus
"需要高性能,但價格更便宜,或者 Token 大小超過 200K。"(Opus 只能處理 200K 以下的 Token) -> Gemini 1.5 Pro
"我需要最便宜的 LLM。" -> Haiku
"但是,在輸入/輸出比例中,輸出的比例略高,或者超過了 200K 個 Token。" -> Gemini 1.5 Flash