![translation](https://cdn.durumis.com/common/trans.png)
Bu, AI tarafından çevrilen bir gönderidir.
Dil Seç
Text summarized by durumis AI
- Apple, Microsoft ve Meta gibi büyük teknoloji şirketleri, son zamanlarda yeni büyük dil modelleri yayınlayarak yapay zeka sektöründe büyük bir değişime neden oldu.
- Her şirket, model boyutunu küçültmek veya veri/algoritma optimizasyonu, bağlamsal anlayış güçlendirme gibi çeşitli yöntemlerle farklılaştırılmış modeller sunuyor.
- Özellikle Apple'ın OpenELM'i, küçük cihazlar için optimize edilmiş ve Meta'nın Llama 3'ü, verimli model yapısı sayesinde küçük boyutuna rağmen üstün performans gösteriyor.
Son zamanlarda dikkat çeken büyük dil modelleri hakkında haberler
Son bir hafta içinde Apple, Microsoft ve Meta gibi büyük teknoloji şirketleri ard arda yeni büyük dil modelleri açıkladı ve yapay zekâ sektöründe önemli yankılar uyandırdı. Bu yeni modellerin temel özellikler ve önemlerini daha ayrıntılı olarak inceleyelim.
Apple'ın OpenELM'i
Apple, 25 Nisan'da kendi geliştirdiği OpenELM dil modeli ailesini duyurdu. 0.27B, 0.45B, 1.08B, 3.04B gibi dört farklı boyuttan oluşan bu model ailesinde, en büyük model bile sadece 3 milyar parametreye sahip ve nispeten küçük bir boyuttadır. Şu anda çoğu büyük dil modelinin en az 3 milyar parametreye sahip olduğunu düşünürsek, OpenELM oldukça küçük bir boyuttadır.
Bunun nedeni, Apple'ın OpenELM'i öncelikle küçük cihazlara entegre ederek kullanmayı amaçlayarak geliştirdiği gerçeğidir. Geçmişte yüksek performans elde etmenin temel yolu parametre sayısını artırmaktı, ancak son zamanlarda küçültme ve hafifletmeye odaklanma eğilimi var. Apple bu sefer model ağırlıklarının ve çıkarım kodunun yanı sıra veri kümesi ve çerçeveyi de açığa çıkararak şeffaflığı artırdı.
MS'nin Phi-3 serisi
Microsoft da 23 Nisan'da önce Phi-3 Mini modelini (3,8 milyar parametre) açıkladı ve daha sonra 7 milyar parametreye sahip Phi-3 Small ve 14 milyar parametreye sahip Phi-3 Medium modellerini de piyasaya süreceğini açıkladı. Phi-3 Mini açık bir modeldir ve herkes ücretsiz olarak ticari olarak kullanabilir. Yeni Phi-3 serisi modellerinin tamamı MS'nin bulut hizmeti Azure'da sunulacak.
Meta'nın Llama 3'ü
Meta (eski Facebook), 18 Nisan'da Llama 3 modelinin 8B ve 70B sürümlerini açıkladı ve 400B büyüklüğündeki büyük boyutlu modeli yaz aylarında yayınlamayı planlıyor. Özellikle 8B modeli, küçük boyutuna rağmen yüksek performansıyla geliştirici topluluğundan olumlu tepkiler aldı.
Bunun sebebi Meta'nın, büyük miktarda eğitim verisi kullanarak verimli bir model yapısı oluşturmuş olması olarak analiz ediliyor. Parametre sayısını artırmak yerine, veri ve algoritma optimizasyonuna odaklanan bir sonuç olarak değerlendirilebilir.
xAI'nın Grok 1.5'i
38 Mart'ta duyurulan xAI'nın Grok 1.5 modeli, 128K'ya kadar uzun bağlamsal belirteçleri işleyebildiği için karmaşık ve uzun istemleri kabul edebiliyor. Bugüne kadar büyük dil modelleri geliştirme trendi yalnızca parametre boyutunu artırmaya odaklanmışken, Grok 1.5 uzun bağlamsal anlayışı geliştirme yönünde yeni bir bakış açısı sundu.
Son bir haftada Apple, MS ve Meta gibi öncü şirketlerin yeni büyük dil modelleri piyasaya sürmesiyle yapay zekâ teknolojisinin evrimleşme yönleri daha da çeşitlendi. Model boyutlarının küçültülmesi ve hafifletilmesi, veri/algoritma optimizasyonu, bağlamsal anlayışın güçlendirilmesi gibi çeşitli yönlerde yeni girişimler gözlemleniyor. Yapay zekâ ekosisteminin gelecekte nasıl evrimleşeceği merak konusu.