해리슨 블로그

Google Gemini รุ่นใหม่ - ทดลองใช้

สร้าง: 2024-09-03

สร้าง: 2024-09-03 12:06

Google ได้เปิดตัวโมเดลใหม่ๆ ของ Gemini ล่าสุด

จริงๆ แล้วมันไม่ใช่เวอร์ชันอย่างเป็นทางการ แต่เป็นเวอร์ชันทดลอง (Experimental)

โมเดลเหล่านั้นมีดังนี้

  • Gemini 1.5 Pro Exp
  • Gemini 1.5 Flash Exp
  • Gemini 1.5 Flash 8B Exp

ก่อนอื่นเลย สำหรับ Gemini 1.5 Pro Exp และ 1.5 Flash Exp นั้น ถือเป็นการอัปเดตจากเวอร์ชันก่อนหน้าได้เลย เมื่อทดสอบจริงแล้ว Gemini 1.5 Pro Exp นั้น มีประสิทธิภาพดีขึ้นเล็กน้อยเมื่อเทียบกับ Gemini 1.5 Pro เดิม (ประสิทธิภาพของเกณฑ์มาตรฐานก็ดีขึ้นด้วย แม้ว่าจะไม่ได้นำข้อมูลมาแสดง แต่ก็ถือว่าเป็นรุ่นที่ดีที่สุดในบรรดาเวอร์ชันที่เปิดตัวออกมาแล้ว) ส่วน Gemini 1.5 Flash Exp ก็แน่นอนว่าไม่ได้ดีที่สุด แต่ก็ถือว่าพัฒนาขึ้นอย่างยอดเยี่ยมในบรรดาเวอร์ชันเริ่มต้น

ทั้งสองเวอร์ชันนี้จะถูกนำไปใช้กับเวอร์ชันเดิม 1.5 Pro และ 1.5 Flash ภายในไม่กี่สัปดาห์ข้างหน้า (ถ้าเวอร์ชันเดิมเป็นเวอร์ชัน 001 ก็คงจะอัปเดตเป็นเวอร์ชัน 002)

Google Gemini รุ่นใหม่ - ทดลองใช้

ที่มา : Chatbot Arena

ถ้าดูจากตาราง จะเห็นว่า Gemini 1.5 Pro Exp อยู่ในอันดับที่ 2 และ Gemini 1.5 Flash Exp อยู่ในอันดับที่ 6

ที่น่าสนใจคือ Gemini 1.5 Flash Exp อยู่ในอันดับที่สูงกว่า Gemini 1.5 Pro ที่อยู่ในอันดับที่ 10 และ 11

อันดับที่ 1-5 เป็นเวอร์ชันเรือธงของแต่ละบริษัท (GPT 4o, Gemini 1.5 Pro, Grok 2) และอันดับที่ 6 และ 7 เป็นสายเริ่มต้นของแต่ละบริษัท (GPT 4o mini, Gemini 1.5 Flash) Claude 3.5 Sonnet เคยครองอันดับสูงสุดมาระยะหนึ่งแล้ว… อุตสาหกรรมนี้พัฒนาเร็วจริงๆ


อย่างไรก็ตาม ส่วนตัวแล้ว ผมคิดว่าทั้งสองเวอร์ชัน (1.5 Pro และ 1.5 Flash) คงจะกลายเป็นเวอร์ชันอย่างเป็นทางการในเร็วๆ นี้ และตอนนี้ผมก็อยากรู้เกี่ยวกับเวอร์ชัน 1.5 Flash 8b

ลองมาดูเกณฑ์มาตรฐานก่อนแล้วค่อยพูดกัน

Google Gemini รุ่นใหม่ - ทดลองใช้

ที่มา : Chatbot Arena

จากเกณฑ์มาตรฐานด้านบน ประสิทธิภาพของ Gemini 1.5 Flash 8B Exp นั้น คล้ายๆ กับ Claude 3 Sonnet และอยู่ในระดับเดียวกับรุ่นเดิม 1.5 Flash แต่ก็ต่ำกว่าเล็กน้อย แต่ก็มีประสิทธิภาพใกล้เคียงกับ Llama 3 70b

Flash เป็นเวอร์ชันที่ลดทอนขนาดจาก Pro แต่ Flash 8b นั้นมีขนาดเล็กลงไปอีก (น่าจะเป็นอย่างนั้นใช่ไหม?)


ลองทดสอบจริงดูบ้างแล้วครับ โดยใช้ประโยคที่บริการของเรา (durumis) ใช้บ่อยๆ

  • การแปล
  • การสรุป
  • การเขียนบทความ

การทดสอบอื่นๆ ก็มีให้เห็นมากมายในที่อื่นๆ ดังนั้น ผมจึงทดสอบแค่บางอย่างเท่านั้น เมื่อแปลข้อความที่มีโครงสร้างเป็น JSON ที่ซับซ้อน Flash ให้ผลลัพธ์ที่ไม่น่าพอใจ แต่ Pro ให้ผลลัพธ์ที่น่าพอใจอย่างแน่นอน และเวอร์ชัน Pro Exp ก็ให้ผลลัพธ์ที่ดูดีขึ้นอีกด้วย

ทั้งการสรุปและการเขียนบทความ Flash และ Flash 8b ให้ผลลัพธ์ที่น่าพอใจ ดังนั้นจึงเห็นได้ว่าสามารถใช้ Flash 8b ในงานที่ไม่ซับซ้อนได้

เมื่อพิจารณาจากประสิทธิภาพและพารามิเตอร์แล้ว Google คงจะตั้งราคา Flash 8b ในเวอร์ชันที่เปิดตัวอย่างเป็นทางการให้ต่ำมาก

อาจจะตั้งราคาต่ำจนสร้างความเสียหายให้กับสายผลิตภัณฑ์ของบริษัทอื่นๆ เลยก็ได้ พอเปิดตัวเมื่อไหร่ ผมจะกลับมาพร้อมกับตารางราคา "อีกครั้ง" ครับ




ความคิดเห็น0

เปรียบเทียบ Google Gemini 1.5 กับ 1.5 Pro (พร้อมตัวอย่าง)เปรียบเทียบความแตกต่างและการใช้งานของ Google Gemini 1.5 และ 1.5 Pro เพื่อช่วยให้คุณเลือกใช้โมเดลที่เหมาะสมกับขนาดงานและงบประมาณของคุณ
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

June 28, 2024

กูเกิลติดตั้ง Gemini Ultra บนสมาร์ทโฟนกูเกิลมีแผนที่จะติดตั้งแบบจำลองภาษาขนาดใหญ่ 'Gemini Ultra' บนสมาร์ทโฟนในปีหน้า คาดว่าจะมีฟีเจอร์ใหม่ๆ เช่น AI เอเจนต์ แต่ก็ยังมีอุปสรรคด้านเทคนิคที่ต้องแก้ไข
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

April 1, 2024

ยุคของ Gemini 2.0 Google TPU AI Agent เริ่มต้นแล้ว - ใช้งานมัลติโมดอลได้อย่างไรบ้าง?Gemini 2.0 ของ Google เป็น AI Agent แบบมัลติโมดอลที่สามารถประมวลผลข้อมูลหลายรูปแบบ เช่น ข้อความและรูปภาพ และช่วยให้ผู้ใช้บรรลุเป้าหมายได้ โดดเด่นด้วยประสิทธิภาพและความมีประสิทธิภาพสูงที่ขับเคลื่อนด้วย TPU ที่ทรงพลัง
Curator Danbi - Creator Story
Curator Danbi - Creator Story
Curator Danbi - Creator Story
Curator Danbi - Creator Story

December 17, 2024

สร้างพลังบล็อกของชเวบงฮยอก – วิเคราะห์คีย์เวิร์ดการค้นหาที่พุ่งสูงขึ้น ทะลุเพดาน พุ่งขึ้น พุ่งลง การแสดงผลบนอันดับต้นๆชเวบงฮยอก นักข่าวแบ่งปันผลการวิเคราะห์คีย์เวิร์ดบล็อกประจำเดือนกันยายน พร้อมแนะนำเทรนด์ล่าสุด เช่น ไอโฟน 16 ปัญญาประดิษฐ์ และเครื่องมือ No-Code
NEWS FDN (다큐)
NEWS FDN (다큐)
NEWS FDN (다큐)
NEWS FDN (다큐)

September 18, 2024

Google Gemini กับ Microsoft 챗GPT อะไรดีกว่ากัน?ผลการเปรียบเทียบความสามารถในการสร้างข้อความของ Google Gemini และ 챗GPT พบว่าทั้งสองแบบมีประสิทธิภาพสูง แต่มีความแตกต่างกันในเรื่องรูปแบบและวิธีการแสดงออก
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

June 24, 2024

สร้าง AI Full Stack ด้วยโอเพนซอร์สบทความนี้จะแนะนำเครื่องมือต่างๆ สำหรับสร้าง AI 풀สแตก (Full Stack) ด้วยโอเพนซอร์ส รวมถึง LLM, เครื่องมืออนุมานและให้บริการ, เฟรมเวิร์ก และโซลูชันการตรวจสอบต่างๆ เรียนรู้การพัฒนาแอปพลิเคชัน AI โดยใช้ LangChain, LlamaIndex และอื่นๆ
RevFactory
RevFactory
RevFactory
RevFactory

February 5, 2024