หัวข้อ
- #Llama3
- #Grok
- #Phi-3
- #AppleOpenELM
- #LLM
สร้าง: 2024-04-27
สร้าง: 2024-04-27 10:41
ในช่วงสัปดาห์ที่ผ่านมา บริษัทเทคโนโลยีขนาดใหญ่ เช่น แอปเปิล ไมโครซอฟท์ และเมตา ได้เปิดตัวแบบจำลองภาษาขนาดใหญ่รุ่นใหม่ๆ อย่างต่อเนื่อง ส่งผลให้เกิดกระแสสะท้อนอย่างมากในวงการ AI เราลองมาดูรายละเอียดเกี่ยวกับคุณสมบัติและความสำคัญของแบบจำลองที่เปิดตัวในครั้งนี้กัน
เมื่อวันที่ 25 เมษายน แอปเปิลได้เปิดตัวกลุ่มผลิตภัณฑ์แบบจำลองภาษา OpenELM ที่พัฒนาขึ้นเอง โดยประกอบด้วยแบบจำลองที่มีขนาดแตกต่างกัน 4 ขนาด ได้แก่ 0.27B, 0.45B, 1.08B และ 3.04B ซึ่งแม้แต่แบบจำลองที่มีขนาดใหญ่ที่สุดก็มีพารามิเตอร์เพียง 3 พันล้านตัวเท่านั้น ถือว่ามีขนาดเล็กเมื่อเทียบกับแบบจำลองภาษาขนาดใหญ่ส่วนใหญ่ในปัจจุบันที่มักมีพารามิเตอร์อย่างน้อย 3 พันล้านตัวขึ้นไป
สาเหตุที่แอปเปิลพัฒนา OpenELM ให้มีขนาดเล็กเช่นนี้ เนื่องจากมีเป้าหมายที่จะนำไปใช้ในอุปกรณ์ขนาดเล็กเป็นหลัก ในอดีต การเพิ่มจำนวนพารามิเตอร์เป็นวิธีหลักในการเพิ่มประสิทธิภาพ แต่ในปัจจุบัน มีแนวโน้มที่ให้ความสำคัญกับการลดขนาดและน้ำหนักมากขึ้น แอปเปิลได้เปิดเผยทั้งน้ำหนักของแบบจำลอง โค้ดสำหรับการอนุมาน ชุดข้อมูล และเฟรมเวิร์กทั้งหมด ทำให้มีความโปร่งใสมากขึ้น
ทางด้านไมโครซอฟท์ ได้เปิดตัว Phi-3 Mini (พารามิเตอร์ 3.8 พันล้านตัว) เมื่อวันที่ 23 เมษายนที่ผ่านมา และมีแผนจะเปิดตัว Phi-3 Small ขนาด 7 พันล้านตัว และ Phi-3 Medium ขนาด 14 พันล้านตัวในอนาคต Phi-3 Mini เป็นแบบจำลองแบบเปิดที่ทุกคนสามารถใช้งานได้ฟรีและสามารถนำไปใช้ในเชิงพาณิชย์ได้ แบบจำลอง Phi-3 ซีรีส์ใหม่ทั้งหมดจะให้บริการผ่าน Azure บริการคลาวด์ของ MS
เมตา (เดิมคือเฟซบุ๊ก) ได้เปิดตัว Llama 3 รุ่น 8 พันล้านตัวและ 70 พันล้านตัวเมื่อวันที่ 18 เมษายนที่ผ่านมา และมีแผนจะเปิดตัวรุ่นขนาดใหญ่ 400 พันล้านตัวในช่วงฤดูร้อน โดยเฉพาะรุ่น 8 พันล้านตัวได้รับคำชมจากชุมชนนักพัฒนา เนื่องจากมีประสิทธิภาพที่ดีแม้จะมีขนาดเล็ก
การวิเคราะห์พบว่าเป็นผลมาจากการที่เมตาใช้ข้อมูลฝึกฝนจำนวนมหาศาลและสร้างโครงสร้างแบบจำลองที่มีประสิทธิภาพ สามารถกล่าวได้ว่าเป็นผลลัพธ์จากการเน้นที่ข้อมูลและการปรับแต่งอัลกอริทึมแทนที่จะเพิ่มจำนวนพารามิเตอร์
แบบจำลอง Grok 1.5 ของ xAI ที่เปิดตัวเมื่อวันที่ 38 มีนาคม สามารถประมวลผลโทเค็นที่มีบริบทยาวได้สูงสุดถึง 128K ทำให้สามารถใช้พรอมต์ที่ซับซ้อนและยาวได้ หากเทรนด์การพัฒนาแบบจำลองภาษาในอดีตมุ่งเน้นไปที่การเพิ่มขนาดพารามิเตอร์ Grok 1.5 ได้นำเสนอมุมมองใหม่ในการพัฒนาแบบจำลองภาษา โดยเน้นที่การปรับปรุงความเข้าใจบริบทที่ยาวขึ้น
การเปิดตัวแบบจำลองภาษาขนาดใหญ่รุ่นใหม่ๆ จากบริษัทชั้นนำอย่างแอปเปิล MS เมตา ฯลฯ ในช่วงสัปดาห์ที่ผ่านมา ทำให้ทิศทางการพัฒนาเทคโนโลยี AI มีความหลากหลายมากขึ้น มีการทดลองใหม่ๆ เกิดขึ้นในหลายด้าน เช่น การลดขนาดและน้ำหนักของแบบจำลอง การปรับแต่งข้อมูลและอัลกอริทึม การเพิ่มความสามารถในการทำความเข้าใจบริบท เป็นต้น เรามาติดตามกันว่าระบบนิเวศ AI จะพัฒนาไปในทิศทางใดต่อไปในอนาคต
ความคิดเห็น0