Try using it in your preferred language.

English

  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar

Çıkış Yap

translation

Bu, AI tarafından çevrilen bir gönderidir.

해리슨 블로그

Apple'ın OpenELM'i / MS'in Phi-3'ü / Meta'nın Llama 3'ü Açıklandı

  • tr Writing language: Korece
  • tr Referans Ülke: tr Tüm ülkeler country-flag

Dil Seç

  • Türkçe
  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar

Text summarized by durumis AI

  • Apple, Microsoft ve Meta gibi büyük teknoloji şirketleri, son zamanlarda yeni büyük dil modelleri yayınlayarak yapay zeka sektöründe büyük bir değişime neden oldu.
  • Her şirket, model boyutunu küçültmek veya veri/algoritma optimizasyonu, bağlamsal anlayış güçlendirme gibi çeşitli yöntemlerle farklılaştırılmış modeller sunuyor.
  • Özellikle Apple'ın OpenELM'i, küçük cihazlar için optimize edilmiş ve Meta'nın Llama 3'ü, verimli model yapısı sayesinde küçük boyutuna rağmen üstün performans gösteriyor.

Son zamanlarda dikkat çeken büyük dil modelleri hakkında haberler

Son bir hafta içinde Apple, Microsoft ve Meta gibi büyük teknoloji şirketleri ard arda yeni büyük dil modelleri açıkladı ve yapay zekâ sektöründe önemli yankılar uyandırdı. Bu yeni modellerin temel özellikler ve önemlerini daha ayrıntılı olarak inceleyelim.

Apple'ın OpenELM'i

Apple, 25 Nisan'da kendi geliştirdiği OpenELM dil modeli ailesini duyurdu. 0.27B, 0.45B, 1.08B, 3.04B gibi dört farklı boyuttan oluşan bu model ailesinde, en büyük model bile sadece 3 milyar parametreye sahip ve nispeten küçük bir boyuttadır. Şu anda çoğu büyük dil modelinin en az 3 milyar parametreye sahip olduğunu düşünürsek, OpenELM oldukça küçük bir boyuttadır.
Bunun nedeni, Apple'ın OpenELM'i öncelikle küçük cihazlara entegre ederek kullanmayı amaçlayarak geliştirdiği gerçeğidir. Geçmişte yüksek performans elde etmenin temel yolu parametre sayısını artırmaktı, ancak son zamanlarda küçültme ve hafifletmeye odaklanma eğilimi var. Apple bu sefer model ağırlıklarının ve çıkarım kodunun yanı sıra veri kümesi ve çerçeveyi de açığa çıkararak şeffaflığı artırdı.

MS'nin Phi-3 serisi

Microsoft da 23 Nisan'da önce Phi-3 Mini modelini (3,8 milyar parametre) açıkladı ve daha sonra 7 milyar parametreye sahip Phi-3 Small ve 14 milyar parametreye sahip Phi-3 Medium modellerini de piyasaya süreceğini açıkladı. Phi-3 Mini açık bir modeldir ve herkes ücretsiz olarak ticari olarak kullanabilir. Yeni Phi-3 serisi modellerinin tamamı MS'nin bulut hizmeti Azure'da sunulacak.

Meta'nın Llama 3'ü

Meta (eski Facebook), 18 Nisan'da Llama 3 modelinin 8B ve 70B sürümlerini açıkladı ve 400B büyüklüğündeki büyük boyutlu modeli yaz aylarında yayınlamayı planlıyor. Özellikle 8B modeli, küçük boyutuna rağmen yüksek performansıyla geliştirici topluluğundan olumlu tepkiler aldı.
Bunun sebebi Meta'nın, büyük miktarda eğitim verisi kullanarak verimli bir model yapısı oluşturmuş olması olarak analiz ediliyor. Parametre sayısını artırmak yerine, veri ve algoritma optimizasyonuna odaklanan bir sonuç olarak değerlendirilebilir.

xAI'nın Grok 1.5'i

38 Mart'ta duyurulan xAI'nın Grok 1.5 modeli, 128K'ya kadar uzun bağlamsal belirteçleri işleyebildiği için karmaşık ve uzun istemleri kabul edebiliyor. Bugüne kadar büyük dil modelleri geliştirme trendi yalnızca parametre boyutunu artırmaya odaklanmışken, Grok 1.5 uzun bağlamsal anlayışı geliştirme yönünde yeni bir bakış açısı sundu.

⁠⁠⁠⁠⁠⁠⁠
Son bir haftada Apple, MS ve Meta gibi öncü şirketlerin yeni büyük dil modelleri piyasaya sürmesiyle yapay zekâ teknolojisinin evrimleşme yönleri daha da çeşitlendi. Model boyutlarının küçültülmesi ve hafifletilmesi, veri/algoritma optimizasyonu, bağlamsal anlayışın güçlendirilmesi gibi çeşitli yönlerde yeni girişimler gözlemleniyor. Yapay zekâ ekosisteminin gelecekte nasıl evrimleşeceği merak konusu.

해리슨
해리슨 블로그
해리슨의 깜짝 블로그
해리슨
Gemini 1.5 Flash, GPT-4o ve Diğer LLM'lerin Fiyatları GPT-4o, Gemini 1.5 Pro, Claude 3 Haiku, Gemini 1.5 Flash gibi en son AI modellerinin performans ve fiyat karşılaştırması. İhtiyaçlarınıza en uygun modeli seçmenize yardımcı oluyoruz. Giriş token boyutu, çıktı oranı, görev zorluğu gibi faktörleri göz önünd

18 Mayıs 2024

Son zamanlarda Önerilebilecek AI Servisleri Son zamanlarda popüler ve önerilebilecek AI servislerini tanıtıyoruz. ChatGPT ve Gemini dışında, NotebookLM ve Perplexity AI dahil olmak üzere iş verimliliğini artırabilecek servisleri derledik. NotebookLM, Google tarafından sunulan bir servis olup, Googl

23 Haziran 2024

Durumis Geliştirme Günlüğü - Bölüm 3: Gemini Pro Durumis, Google'ın yeni nesil LLM'si 'Gemini Pro'yu kullanarak çeşitli özellikler geliştirdi. URL otomatik oluşturma, özetleme, yazı açıklaması oluşturma, konu oluşturma, otomatik sınıflandırma gibi AI teknolojilerini uygulayarak blog işletmesini verimli

3 Şubat 2024

LLM (Büyük Dil Modeli) nedir? Büyük Dil Modelleri (LLM'ler), yapay zekânın temel teknolojisidir ve büyük miktarda metin verisi üzerinde eğitilerek insan benzeri dil işleme becerileri kazanır. Bu beceriler, sohbet robotları, çeviri, metin oluşturma gibi çeşitli alanlarda kullanılabilir
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1 Nisan 2024

Snowflake, Sektöre Öncü Açıklık Sağlayan Kurumsal Düzeyde LLM 'Arctic'i Piyasaya Sürüyor Snowflake, açık kaynak kodlu büyük dil modeli 'Arctic'i piyasaya sürdü. Apache 2.0 lisansı altında ücretsiz ticari kullanım mümkün olan Arctic, sektörün en iyi performans ve verimliliğini sunuyor. Üstün token verimliliği ve en yüksek kaliteyi sağlayan Arc
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)

25 Nisan 2024

AI Tam Yığınını Açık Kaynaklarla Tamamlamak AI ekosisteminde yeni açık kaynaklı LLM (Büyük Dil Modeli) modelleri hızla ortaya çıkıyor. Mistral, Llama, phi-2 gibi güçlü performans ve açık lisanslara sahip modeller yayınlandı ve bunları kullanmak için çeşitli araçlar da geliştiriliyor. LangChain, Lla
RevFactory
RevFactory
RevFactory
RevFactory

5 Şubat 2024

Öncü Yapay Zeka Modellerinin Çelişkisi, Şeffaflık Son teknoloji ürünü yapay zeka sistemlerinin şeffaflık eksikliği ciddi bir sorun haline geldi. Stanford Üniversitesi araştırmacıları, GPT-4 dahil olmak üzere 10 yapay zeka sistemini analiz etti ve sonuç olarak, veri kaynakları, eğitim yöntemleri, enerji t
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son

14 Mayıs 2024

Google Gemini Ultra Akıllı Telefonlara Entegre Ediliyor Google, önümüzdeki yıl piyasaya süreceği akıllı telefonlarda bulut tabanlı AI modeli 'Gemini Ultra'yı entegre edeceğini duyurdu. LLM sıkıştırma teknolojilerindeki gelişmeler sayesinde cihaz içi çalıştırma mümkün hale geldi ve akıllı telefon işlevselliğini
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1 Nisan 2024

SK C&C, Müşteriye Özel sLLM Uygulama Destek Platformu 'Soluer LLMOps'u Tanıttı SK C&C, şirketlere özel küçük ölçekli büyük dil modeli (sLLM) oluşturma platformu 'Soluer LLMOps'u piyasaya sürdü. Bu platform, ChatGPT, HyperCLOVA X gibi çeşitli temel modelleri kullanarak sLLM'leri sürükle ve bırak yöntemiyle kolayca oluşturmayı destekl
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)

20 Mayıs 2024