해리슨 블로그

Apple เปิดตัว OpenELM / MS เปิดตัว Phi-3 / Meta เปิดตัว Llama 3

สร้าง: 2024-04-27

สร้าง: 2024-04-27 10:41

ข่าวการเปิดตัวแบบจำลองภาษาขนาดใหญ่ที่น่าจับตามองในช่วงล่าสุด

ในช่วงสัปดาห์ที่ผ่านมา บริษัทเทคโนโลยีขนาดใหญ่ เช่น แอปเปิล ไมโครซอฟท์ และเมตา ได้เปิดตัวแบบจำลองภาษาขนาดใหญ่รุ่นใหม่ๆ อย่างต่อเนื่อง ส่งผลให้เกิดกระแสสะท้อนอย่างมากในวงการ AI เราลองมาดูรายละเอียดเกี่ยวกับคุณสมบัติและความสำคัญของแบบจำลองที่เปิดตัวในครั้งนี้กัน

OpenELM ของแอปเปิล

เมื่อวันที่ 25 เมษายน แอปเปิลได้เปิดตัวกลุ่มผลิตภัณฑ์แบบจำลองภาษา OpenELM ที่พัฒนาขึ้นเอง โดยประกอบด้วยแบบจำลองที่มีขนาดแตกต่างกัน 4 ขนาด ได้แก่ 0.27B, 0.45B, 1.08B และ 3.04B ซึ่งแม้แต่แบบจำลองที่มีขนาดใหญ่ที่สุดก็มีพารามิเตอร์เพียง 3 พันล้านตัวเท่านั้น ถือว่ามีขนาดเล็กเมื่อเทียบกับแบบจำลองภาษาขนาดใหญ่ส่วนใหญ่ในปัจจุบันที่มักมีพารามิเตอร์อย่างน้อย 3 พันล้านตัวขึ้นไป
สาเหตุที่แอปเปิลพัฒนา OpenELM ให้มีขนาดเล็กเช่นนี้ เนื่องจากมีเป้าหมายที่จะนำไปใช้ในอุปกรณ์ขนาดเล็กเป็นหลัก ในอดีต การเพิ่มจำนวนพารามิเตอร์เป็นวิธีหลักในการเพิ่มประสิทธิภาพ แต่ในปัจจุบัน มีแนวโน้มที่ให้ความสำคัญกับการลดขนาดและน้ำหนักมากขึ้น แอปเปิลได้เปิดเผยทั้งน้ำหนักของแบบจำลอง โค้ดสำหรับการอนุมาน ชุดข้อมูล และเฟรมเวิร์กทั้งหมด ทำให้มีความโปร่งใสมากขึ้น

Phi-3 ซีรีส์ของ MS

ทางด้านไมโครซอฟท์ ได้เปิดตัว Phi-3 Mini (พารามิเตอร์ 3.8 พันล้านตัว) เมื่อวันที่ 23 เมษายนที่ผ่านมา และมีแผนจะเปิดตัว Phi-3 Small ขนาด 7 พันล้านตัว และ Phi-3 Medium ขนาด 14 พันล้านตัวในอนาคต Phi-3 Mini เป็นแบบจำลองแบบเปิดที่ทุกคนสามารถใช้งานได้ฟรีและสามารถนำไปใช้ในเชิงพาณิชย์ได้ แบบจำลอง Phi-3 ซีรีส์ใหม่ทั้งหมดจะให้บริการผ่าน Azure บริการคลาวด์ของ MS

Llama 3 ของเมตา

เมตา (เดิมคือเฟซบุ๊ก) ได้เปิดตัว Llama 3 รุ่น 8 พันล้านตัวและ 70 พันล้านตัวเมื่อวันที่ 18 เมษายนที่ผ่านมา และมีแผนจะเปิดตัวรุ่นขนาดใหญ่ 400 พันล้านตัวในช่วงฤดูร้อน โดยเฉพาะรุ่น 8 พันล้านตัวได้รับคำชมจากชุมชนนักพัฒนา เนื่องจากมีประสิทธิภาพที่ดีแม้จะมีขนาดเล็ก
การวิเคราะห์พบว่าเป็นผลมาจากการที่เมตาใช้ข้อมูลฝึกฝนจำนวนมหาศาลและสร้างโครงสร้างแบบจำลองที่มีประสิทธิภาพ สามารถกล่าวได้ว่าเป็นผลลัพธ์จากการเน้นที่ข้อมูลและการปรับแต่งอัลกอริทึมแทนที่จะเพิ่มจำนวนพารามิเตอร์

Grok 1.5 ของ xAI

แบบจำลอง Grok 1.5 ของ xAI ที่เปิดตัวเมื่อวันที่ 38 มีนาคม สามารถประมวลผลโทเค็นที่มีบริบทยาวได้สูงสุดถึง 128K ทำให้สามารถใช้พรอมต์ที่ซับซ้อนและยาวได้ หากเทรนด์การพัฒนาแบบจำลองภาษาในอดีตมุ่งเน้นไปที่การเพิ่มขนาดพารามิเตอร์ Grok 1.5 ได้นำเสนอมุมมองใหม่ในการพัฒนาแบบจำลองภาษา โดยเน้นที่การปรับปรุงความเข้าใจบริบทที่ยาวขึ้น

⁠⁠⁠⁠⁠⁠⁠
การเปิดตัวแบบจำลองภาษาขนาดใหญ่รุ่นใหม่ๆ จากบริษัทชั้นนำอย่างแอปเปิล MS เมตา ฯลฯ ในช่วงสัปดาห์ที่ผ่านมา ทำให้ทิศทางการพัฒนาเทคโนโลยี AI มีความหลากหลายมากขึ้น มีการทดลองใหม่ๆ เกิดขึ้นในหลายด้าน เช่น การลดขนาดและน้ำหนักของแบบจำลอง การปรับแต่งข้อมูลและอัลกอริทึม การเพิ่มความสามารถในการทำความเข้าใจบริบท เป็นต้น เรามาติดตามกันว่าระบบนิเวศ AI จะพัฒนาไปในทิศทางใดต่อไปในอนาคต

ความคิดเห็น0

สร้าง AI Full Stack ด้วยโอเพนซอร์สบทความนี้จะแนะนำเครื่องมือต่างๆ สำหรับสร้าง AI 풀สแตก (Full Stack) ด้วยโอเพนซอร์ส รวมถึง LLM, เครื่องมืออนุมานและให้บริการ, เฟรมเวิร์ก และโซลูชันการตรวจสอบต่างๆ เรียนรู้การพัฒนาแอปพลิเคชัน AI โดยใช้ LangChain, LlamaIndex และอื่นๆ
RevFactory
RevFactory
RevFactory
RevFactory

February 5, 2024

LLM สำหรับเด็กประถมคำอธิบายแนวคิด LLM ที่แม้แต่เด็กประถมก็เข้าใจ! LLM คือ AI ที่ตอบคำถามเป็นข้อความเมื่อได้รับคำถามเป็นข้อความ สามารถทำงานได้หลากหลาย เช่น การเขียนโค้ด การวิเคราะห์ภาพ ฯลฯ ปัจจุบันนักพัฒนาใช้ AI เป็นเครื่องมือ
Sunrabbit
Sunrabbit
Sunrabbit
Sunrabbit

March 4, 2025

Ollama: กรอบงาน LLM ที่ติดตั้งในเครื่องOllama คือ กรอบงาน LLM ขนาดเล็กที่ติดตั้งในเครื่อง รองรับโมเดลหลากหลาย และโมเดล llama-3 8B ให้ประสิทธิภาพเทียบเท่า GPT-3.5 เหมาะสำหรับผู้ใช้ที่ให้ความสำคัญกับการปกป้องข้อมูลส่วนบุคคล
InvisibleHand Blog
InvisibleHand Blog
InvisibleHand Blog
InvisibleHand Blog

November 9, 2024

Snowflake เปิดตัว LLM ระดับองค์กร Arctic ที่มีระดับความเปิดกว้างสูงสุดในอุตสาหกรรมSnowflake เปิดตัว Arctic LLM ระดับองค์กรแบบโอเพ่นซอร์สที่มีความเปิดกว้างสูงสุดในอุตสาหกรรม โดยใช้สิทธิ์การใช้งาน Apache 2.0 ทำให้สามารถรองรับเฟรมเวิร์กต่างๆ และปรับแต่งได้หลากหลาย
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)

April 25, 2024

สร้างพลังบล็อกของชเวบงฮยอก – วิเคราะห์คีย์เวิร์ดการค้นหาที่พุ่งสูงขึ้น ทะลุเพดาน พุ่งขึ้น พุ่งลง การแสดงผลบนอันดับต้นๆชเวบงฮยอก นักข่าวแบ่งปันผลการวิเคราะห์คีย์เวิร์ดบล็อกประจำเดือนกันยายน พร้อมแนะนำเทรนด์ล่าสุด เช่น ไอโฟน 16 ปัญญาประดิษฐ์ และเครื่องมือ No-Code
NEWS FDN (다큐)
NEWS FDN (다큐)
NEWS FDN (다큐)
NEWS FDN (다큐)

September 18, 2024

กูเกิลติดตั้ง Gemini Ultra บนสมาร์ทโฟนกูเกิลมีแผนที่จะติดตั้งแบบจำลองภาษาขนาดใหญ่ 'Gemini Ultra' บนสมาร์ทโฟนในปีหน้า คาดว่าจะมีฟีเจอร์ใหม่ๆ เช่น AI เอเจนต์ แต่ก็ยังมีอุปสรรคด้านเทคนิคที่ต้องแก้ไข
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

April 1, 2024