해리슨 블로그

ราคาของ Gemini 1.5 Flash, GPT-4o และ LLM อื่นๆ

สร้าง: 2024-05-18

สร้าง: 2024-05-18 11:24

ช่วงนี้ Google และ OpenAI ได้ออกมาประกาศเกี่ยวกับ AI ใหม่ๆ อย่างต่อเนื่องเป็นเวลาสองวันติดต่อกัน

โดยทั่วไปแล้ว สิ่งที่ผู้คนสงสัยเมื่อใช้งานก็จะมีอยู่ 2 ประเด็นหลัก

คือประสิทธิภาพและราคา (แน่นอนว่ายังมีฟีเจอร์อื่นๆ อีกมากมาย แต่บล็อกเกอร์ผู้เชี่ยวชาญหลายท่านได้รีวิวไปแล้ว)

Open AI - GPT

OpenAI เหมือนเดิม GPT-4o รุ่นใหม่มีราคาถูกลงกว่า GPT-4 รุ่นก่อนหน้า ส่วนประสิทธิภาพนั้นมีบล็อกมากมายที่รีวิวไว้แล้ว เราจะข้ามไปก่อน ในที่นี้จะพูดถึงเรื่องราคาเป็นหลัก

ราคาของ Gemini 1.5 Flash, GPT-4o และ LLM อื่นๆ

ตารางราคา GPT


โดยพื้นฐานแล้ว Open AI ได้ลดราคา GPT ลงเรื่อยๆ นับตั้งแต่ GPT 3.5 Turbo ตามมาด้วย GPT 4 และรุ่นใหม่ๆ ที่ออกมา ราคาจะถูกลงเรื่อยๆ พร้อมกับการอัปเกรดประสิทธิภาพ ในปัจจุบัน ถ้าเลือกใช้แบบประหยัดที่สุดก็ควรเลือก 3.5 Turbo ส่วนกรณีอื่นๆ ก็ใช้ 4o ได้เลย


Anthopic - Claude 3

ราคาของ Gemini 1.5 Flash, GPT-4o และ LLM อื่นๆ

ตารางราคา Claude 3

ถึงแม้ว่า Anthropic จะยังไม่ได้ประกาศเปิดตัวผลิตภัณฑ์ใหม่ แต่ก็เป็นบริษัท LLM ที่ไม่ควรมองข้าม เพราะมีทั้ง Haiku ที่คุ้มค่ากับราคา และ Opus ที่มีประสิทธิภาพสูง

ถ้าพิจารณาจากราคาต่อโทเคนในการป้อนข้อมูล Haiku จะมีราคาถูกที่สุดในบรรดา 3 บริษัท เหมาะสำหรับการประมวลผลข้อความง่ายๆ

ยิ่งไปกว่านั้น ก่อนที่ Gemini Flash จะออกมา Haiku ยังมีประสิทธิภาพดีกว่า Gemini 1.0 Pro ด้วย จึงเป็น LLM ที่มีประโยชน์มาก


Google - Gemini

ราคาของ Gemini 1.5 Flash, GPT-4o และ LLM อื่นๆ

ตารางราคา Gemini

Google ใช้ระบบราคา 2 แบบ

แบบหนึ่งคือ AI Studio อีกแบบหนึ่งคือ Vertex AI

AI Studio คิดราคาแบบ Token เหมือนกับบริษัทอื่นๆ ส่วน Vertex AI นั้นแปลกตรงที่คิดราคาแบบนับจำนวนตัวอักษร

จากตารางด้านบน ถ้า 1 โทเคนมีจำนวนตัวอักษรน้อยกว่า 3 ตัว (1-2 ตัวอักษร) การใช้ Vertex AI จะถูกกว่า แต่ถ้า 3 ตัวอักษรขึ้นไป AI Studio จะถูกกว่า โดยทั่วไปแล้วภาษาอังกฤษจะมีจำนวนตัวอักษรเกินกว่านั้น ดังนั้น AI Studio จึงถูกกว่า ภาษาไทยในปัจจุบันนี้ 1 โทเคนมักจะมีหลายตัวอักษรด้วยเช่นกัน

อย่างไรก็ตาม ถ้าพิจารณาจากโทเคนในการป้อนข้อมูลและประสิทธิภาพ Gemini 1.5 Flash จะดีกว่า 1.0 Pro มาก และถ้าต้องการงานที่มีประสิทธิภาพสูง 1.5 Pro จะเหนือกว่า


สรุป

ราคาของ Gemini 1.5 Flash, GPT-4o และ LLM อื่นๆ

สรุป

ถ้าพิจารณาจากประสิทธิภาพเพียงอย่างเดียว ตามเกณฑ์ MMLU จะเรียงลำดับได้ดังนี้ GPT-4o > Opus > 1.5 Pro

ถ้าต้องทำงานที่ซับซ้อนระดับสูง ให้ใช้ GPT-4o แต่ถ้าต้องการใช้แบบที่ราคาถูกลงหน่อย Gemini 1.5 Pro ก็เป็นตัวเลือกที่ดีเช่นกัน เพราะเมื่อใช้งานจริงแล้วจะรู้สึกได้ถึงความแตกต่างเล็กน้อย ผู้ใช้แต่ละคนควรเลือกใช้ตามความเหมาะสม

ถ้าต้องทำงานกับข้อความจำนวนมากในราคาประหยัด จะมี 2 ตัวเลือก

ถ้าอัตราส่วนระหว่างข้อมูลป้อนเข้ากับข้อมูลส่งออกต่ำ (เช่น ต้องป้อนเอกสารจำนวนมากแล้วต้องการผลลัพธ์สั้นๆ) Claude 3 Haiku จะถูกที่สุด แต่ Haiku มีค่าใช้จ่ายในการส่งออกสูง ดังนั้น ถ้าอัตราส่วนระหว่างข้อมูลป้อนเข้ากับข้อมูลส่งออกสูง (เช่น ต้องป้อนข้อความบางส่วนแล้วสั่งให้แก้ไขหรือปรับเปลี่ยน) แนะนำให้ใช้ Gemini 1.5 Flash เพราะ Flash มีค่าใช้จ่ายในการส่งออกถูกที่สุด


สรุปและข้อสรุป

"ฉันไม่สนใจราคา ฉันต้องการใช้ LLM ที่ดีที่สุดสำหรับงานที่ซับซ้อนที่สุด" -> GPT - 4o

"แต่โทเคนในการป้อนข้อมูลเกิน 128K" (GPT - 4o รองรับได้แค่ 128K) -> Opus

"ฉันต้องการประสิทธิภาพสูงแต่ราคาถูกกว่า หรือโทเคนในการป้อนข้อมูลเกิน 200K" (Opus รองรับได้แค่ 200K) -> Gemini 1.5 Pro


ฉันต้องการ LLM ที่ถูกที่สุด -> Haiku

แต่ข้อมูลส่งออกมากกว่าข้อมูลป้อนเข้า หรือโทเคนในการป้อนข้อมูลเกิน 200K -> Gemini 1.5 Flash


ความคิดเห็น0

เปรียบเทียบ Google Gemini 1.5 กับ 1.5 Pro (พร้อมตัวอย่าง)เปรียบเทียบความแตกต่างและการใช้งานของ Google Gemini 1.5 และ 1.5 Pro เพื่อช่วยให้คุณเลือกใช้โมเดลที่เหมาะสมกับขนาดงานและงบประมาณของคุณ
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

June 28, 2024

ยุคของ Gemini 2.0 Google TPU AI Agent เริ่มต้นแล้ว - ใช้งานมัลติโมดอลได้อย่างไรบ้าง?Gemini 2.0 ของ Google เป็น AI Agent แบบมัลติโมดอลที่สามารถประมวลผลข้อมูลหลายรูปแบบ เช่น ข้อความและรูปภาพ และช่วยให้ผู้ใช้บรรลุเป้าหมายได้ โดดเด่นด้วยประสิทธิภาพและความมีประสิทธิภาพสูงที่ขับเคลื่อนด้วย TPU ที่ทรงพลัง
Curator Danbi - Creator Story
Curator Danbi - Creator Story
Curator Danbi - Creator Story
Curator Danbi - Creator Story

December 17, 2024

สร้าง AI Full Stack ด้วยโอเพนซอร์สบทความนี้จะแนะนำเครื่องมือต่างๆ สำหรับสร้าง AI 풀สแตก (Full Stack) ด้วยโอเพนซอร์ส รวมถึง LLM, เครื่องมืออนุมานและให้บริการ, เฟรมเวิร์ก และโซลูชันการตรวจสอบต่างๆ เรียนรู้การพัฒนาแอปพลิเคชัน AI โดยใช้ LangChain, LlamaIndex และอื่นๆ
RevFactory
RevFactory
RevFactory
RevFactory

February 5, 2024

สร้างพลังบล็อกของชเวบงฮยอก – วิเคราะห์คีย์เวิร์ดการค้นหาที่พุ่งสูงขึ้น ทะลุเพดาน พุ่งขึ้น พุ่งลง การแสดงผลบนอันดับต้นๆชเวบงฮยอก นักข่าวแบ่งปันผลการวิเคราะห์คีย์เวิร์ดบล็อกประจำเดือนกันยายน พร้อมแนะนำเทรนด์ล่าสุด เช่น ไอโฟน 16 ปัญญาประดิษฐ์ และเครื่องมือ No-Code
NEWS FDN (다큐)
NEWS FDN (다큐)
NEWS FDN (다큐)
NEWS FDN (다큐)

September 18, 2024

ข้อขัดแย้งของแบบจำลอง AI ชั้นนำ: ความโปร่งใสท่ามกลางความกังวลเกี่ยวกับการขาดความโปร่งใสของแบบจำลอง AI ที่ล้ำสมัย การเพิ่มการเข้าถึงข้อมูลเพื่อให้มั่นใจในความสามารถในการทำซ้ำมีความสำคัญมากขึ้น โดยเฉพาะอย่างยิ่งเมื่อพิจารณาถึงการผูกขาดในอุตสาหกรรม AI และอิทธิพลต่อสังคม ความโปร่งใสจึงเป็นสิ่งจำเป็น
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son

May 14, 2024

AI หลายภาษาฟรี - เอไอดอท (A.) เวอร์ชันพีซี - ใช้โมเดล AI หลากหลายได้ในที่เดียวเอไอดอท เวอร์ชันพีซีจาก SK Telecom เปิดตัวแล้ว บริการตัวแทน LLM หลายภาษาที่สามารถใช้งานและเปรียบเทียบโมเดล AI ต่างๆ ได้ฟรี
Curator Danbi - Creator Story
Curator Danbi - Creator Story
Curator Danbi - Creator Story
Curator Danbi - Creator Story

November 26, 2024