หัวข้อ
- #AI model (แบบจำลอง AI)
- #ราคา
- #Gemini
- #เกณฑ์มาตรฐาน
- #ประสิทธิภาพ
สร้าง: 2024-09-03
สร้าง: 2024-09-03 12:06
Google ได้เปิดตัวโมเดลใหม่ๆ ของ Gemini ล่าสุด
จริงๆ แล้วมันไม่ใช่เวอร์ชันอย่างเป็นทางการ แต่เป็นเวอร์ชันทดลอง (Experimental)
โมเดลเหล่านั้นมีดังนี้
ก่อนอื่นเลย สำหรับ Gemini 1.5 Pro Exp และ 1.5 Flash Exp นั้น ถือเป็นการอัปเดตจากเวอร์ชันก่อนหน้าได้เลย เมื่อทดสอบจริงแล้ว Gemini 1.5 Pro Exp นั้น มีประสิทธิภาพดีขึ้นเล็กน้อยเมื่อเทียบกับ Gemini 1.5 Pro เดิม (ประสิทธิภาพของเกณฑ์มาตรฐานก็ดีขึ้นด้วย แม้ว่าจะไม่ได้นำข้อมูลมาแสดง แต่ก็ถือว่าเป็นรุ่นที่ดีที่สุดในบรรดาเวอร์ชันที่เปิดตัวออกมาแล้ว) ส่วน Gemini 1.5 Flash Exp ก็แน่นอนว่าไม่ได้ดีที่สุด แต่ก็ถือว่าพัฒนาขึ้นอย่างยอดเยี่ยมในบรรดาเวอร์ชันเริ่มต้น
ทั้งสองเวอร์ชันนี้จะถูกนำไปใช้กับเวอร์ชันเดิม 1.5 Pro และ 1.5 Flash ภายในไม่กี่สัปดาห์ข้างหน้า (ถ้าเวอร์ชันเดิมเป็นเวอร์ชัน 001 ก็คงจะอัปเดตเป็นเวอร์ชัน 002)
ที่มา : Chatbot Arena
ถ้าดูจากตาราง จะเห็นว่า Gemini 1.5 Pro Exp อยู่ในอันดับที่ 2 และ Gemini 1.5 Flash Exp อยู่ในอันดับที่ 6
ที่น่าสนใจคือ Gemini 1.5 Flash Exp อยู่ในอันดับที่สูงกว่า Gemini 1.5 Pro ที่อยู่ในอันดับที่ 10 และ 11
อันดับที่ 1-5 เป็นเวอร์ชันเรือธงของแต่ละบริษัท (GPT 4o, Gemini 1.5 Pro, Grok 2) และอันดับที่ 6 และ 7 เป็นสายเริ่มต้นของแต่ละบริษัท (GPT 4o mini, Gemini 1.5 Flash) Claude 3.5 Sonnet เคยครองอันดับสูงสุดมาระยะหนึ่งแล้ว… อุตสาหกรรมนี้พัฒนาเร็วจริงๆ
อย่างไรก็ตาม ส่วนตัวแล้ว ผมคิดว่าทั้งสองเวอร์ชัน (1.5 Pro และ 1.5 Flash) คงจะกลายเป็นเวอร์ชันอย่างเป็นทางการในเร็วๆ นี้ และตอนนี้ผมก็อยากรู้เกี่ยวกับเวอร์ชัน 1.5 Flash 8b
ลองมาดูเกณฑ์มาตรฐานก่อนแล้วค่อยพูดกัน
ที่มา : Chatbot Arena
จากเกณฑ์มาตรฐานด้านบน ประสิทธิภาพของ Gemini 1.5 Flash 8B Exp นั้น คล้ายๆ กับ Claude 3 Sonnet และอยู่ในระดับเดียวกับรุ่นเดิม 1.5 Flash แต่ก็ต่ำกว่าเล็กน้อย แต่ก็มีประสิทธิภาพใกล้เคียงกับ Llama 3 70b
Flash เป็นเวอร์ชันที่ลดทอนขนาดจาก Pro แต่ Flash 8b นั้นมีขนาดเล็กลงไปอีก (น่าจะเป็นอย่างนั้นใช่ไหม?)
ลองทดสอบจริงดูบ้างแล้วครับ โดยใช้ประโยคที่บริการของเรา (durumis) ใช้บ่อยๆ
การทดสอบอื่นๆ ก็มีให้เห็นมากมายในที่อื่นๆ ดังนั้น ผมจึงทดสอบแค่บางอย่างเท่านั้น เมื่อแปลข้อความที่มีโครงสร้างเป็น JSON ที่ซับซ้อน Flash ให้ผลลัพธ์ที่ไม่น่าพอใจ แต่ Pro ให้ผลลัพธ์ที่น่าพอใจอย่างแน่นอน และเวอร์ชัน Pro Exp ก็ให้ผลลัพธ์ที่ดูดีขึ้นอีกด้วย
ทั้งการสรุปและการเขียนบทความ Flash และ Flash 8b ให้ผลลัพธ์ที่น่าพอใจ ดังนั้นจึงเห็นได้ว่าสามารถใช้ Flash 8b ในงานที่ไม่ซับซ้อนได้
เมื่อพิจารณาจากประสิทธิภาพและพารามิเตอร์แล้ว Google คงจะตั้งราคา Flash 8b ในเวอร์ชันที่เปิดตัวอย่างเป็นทางการให้ต่ำมาก
อาจจะตั้งราคาต่ำจนสร้างความเสียหายให้กับสายผลิตภัณฑ์ของบริษัทอื่นๆ เลยก็ได้ พอเปิดตัวเมื่อไหร่ ผมจะกลับมาพร้อมกับตารางราคา "อีกครั้ง" ครับ
ความคิดเห็น0