Try using it in your preferred language.

English

  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar
translation

Ini adalah postingan yang diterjemahkan oleh AI.

해리슨 블로그

Rilis OpenELM Apple / Phi-3 MS / Llama 3 Meta

  • Bahasa penulisan: Bahasa Korea
  • Negara referensi: Semua negara country-flag

Pilih Bahasa

  • Bahasa Indonesia
  • English
  • 汉语
  • Español
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar

Teks yang dirangkum oleh AI durumis

  • Apple, Microsoft, Meta, dan perusahaan big tech utama lainnya baru-baru ini merilis model bahasa besar baru, yang menyebabkan perubahan besar dalam industri AI.
  • Setiap perusahaan menampilkan model yang berbeda dengan mengurangi ukuran model, mengoptimalkan data/algoritma, atau meningkatkan pemahaman konteks.
  • Terutama OpenELM Apple dikembangkan untuk perangkat kecil, dan Llama 3 Meta menunjukkan kinerja yang unggul meskipun berukuran kecil melalui struktur model yang efisien.

Berita Peluncuran Model Bahasa Besar yang Menarik Perhatian Baru-baru Ini

Dalam seminggu terakhir, perusahaan teknologi besar utama seperti Apple, Microsoft, dan Meta telah secara berturut-turut meluncurkan model bahasa besar baru, yang menyebabkan gema yang cukup besar di industri AI. Mari kita bahas lebih dalam tentang fitur utama dan signifikansi model yang diluncurkan baru-baru ini.

OpenELM dari Apple

Pada tanggal 25 April, Apple meluncurkan rangkaian produk model bahasa OpenELM yang dikembangkan sendiri. Terdiri dari empat model dengan berbagai ukuran, yaitu 0.27B, 0.45B, 1.08B, dan 3.04B, model terbesarnya hanya memiliki 3 miliar parameter, yang relatif kecil. Mengingat bahwa sebagian besar model bahasa besar saat ini memiliki setidaknya 3 miliar parameter, OpenELM dapat dikatakan berukuran sangat kecil.
Hal ini dikarenakan Apple mengembangkan OpenELM dengan tujuan khusus untuk diintegrasikan dan digunakan pada perangkat kecil. Di masa lalu, meningkatkan jumlah parameter adalah cara utama untuk mencapai kinerja tinggi, tetapi baru-baru ini, trennya bergeser ke arah miniaturisasi dan ringan. Dalam peluncuran kali ini, Apple tidak hanya merilis bobot model dan kode inferensi, tetapi juga seluruh data set dan framework, menunjukkan komitmen mereka terhadap keterbukaan.

Seri Phi-3 dari MS

Microsoft juga meluncurkan model Phi-3 Mini (3,8 miliar parameter) pada tanggal 23 April, dan berencana untuk merilis Phi-3 Small berukuran 7 miliar dan Phi-3 Medium berukuran 14 miliar di masa mendatang. Phi-3 Mini adalah model terbuka yang dapat digunakan secara komersial oleh siapa saja secara gratis. Semua model dalam seri Phi-3 baru akan tersedia di layanan cloud MS, Azure.

Llama 3 dari Meta

Meta (sebelumnya Facebook) meluncurkan versi 8B dan 70B dari model Llama 3 pada 18 April, dan berencana untuk merilis model berukuran besar 400B pada musim panas. Model 8B khususnya telah mendapat pujian dari komunitas pengembang karena kinerjanya yang luar biasa meskipun berukuran kecil.
Hal ini diyakini karena Meta menginvestasikan banyak data pelatihan untuk membangun struktur model yang efisien. Dapat dikatakan bahwa ini adalah hasil dari fokus pada optimalisasi data dan algoritma daripada sekadar meningkatkan jumlah parameter.

Grok 1.5 dari xAI

Model Grok 1.5 dari xAI, yang diumumkan pada tanggal 38 Maret, dapat memproses token konteks yang panjang hingga 128K, yang memungkinkan prompting yang kompleks dan panjang. Sementara tren pengembangan model bahasa hingga saat ini berfokus pada peningkatan ukuran parameter, Grok 1.5 telah menetapkan arah baru dengan meningkatkan kemampuan pemahaman konteks yang panjang.

⁠⁠⁠⁠⁠⁠⁠
Peluncuran model bahasa besar baru dari perusahaan terkemuka seperti Apple, MS, dan Meta dalam seminggu terakhir telah menunjukkan bahwa arah evolusi teknologi AI menjadi semakin beragam. Upaya baru sedang dilakukan di berbagai aspek, termasuk pengurangan ukuran model dan ringan, optimalisasi data/algoritma, dan peningkatan kemampuan pemahaman konteks. Sangat menarik untuk melihat bagaimana ekosistem AI akan berkembang di masa depan.

해리슨
해리슨 블로그
해리슨의 깜짝 블로그
해리슨
Harga Gemini 1.5 Flash, GPT-4o dan LLM Lainnya Membandingkan performa dan harga berbagai model AI seperti GPT-4o, Opus, Gemini 1.5 Pro, Haiku, dan Gemini 1.5 Flash untuk menunjukkan ciri khas masing-masing model dan kasus penggunaan yang sesuai. Terutama, panduan pemilihan model disediakan berdasarkan

18 Mei 2024

Layanan AI yang Direkomendasikan Baru-baru Ini Kami memperkenalkan layanan AI yang populer dan direkomendasikan baru-baru ini. Selain ChatGPT dan Gemini, kami telah mengumpulkan layanan yang dapat meningkatkan efisiensi kerja, termasuk NotebookLM dan Perplexity AI. NotebookLM adalah layanan yang dised

23 Juni 2024

Perbandingan Harga ChatGPT vs Gemini Artikel ini membandingkan dua layanan LLM utama yang saat ini tersedia, ChatGPT dan Gemini. ChatGPT yang berbasis token dikenakan biaya $0,125 per 1 juta token, sedangkan Gemini yang berbasis karakter dikenakan biaya $0,125 per 1 juta karakter untuk input

7 Maret 2024

Membangun AI Full Stack dengan Open Source Model LLM (Large Language Model) sumber terbuka baru terus bermunculan di ekosistem AI. Mistral, Llama, phi-2, dan model lain dengan kinerja kuat dan lisensi terbuka telah dirilis, dan berbagai alat untuk memanfaatkannya juga sedang dikembangkan. Framewor
RevFactory
RevFactory
RevFactory
RevFactory

5 Februari 2024

Snowflake Meluncurkan 'Arctic', LLM Tingkat Perusahaan dengan Terbuka Terbaik di Industri Snowflake telah meluncurkan 'Arctic', model bahasa besar (LLM) sumber terbuka. Arctic tersedia untuk penggunaan komersial gratis di bawah lisensi Apache 2.0, dan menawarkan kinerja dan efisiensi terbaik di kelasnya. Arctic menawarkan efisiensi token yang
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)

25 April 2024

Apa itu LLM (Large Language Model)? Model bahasa besar (LLM) adalah teknologi inti kecerdasan buatan yang mempelajari kumpulan data teks yang besar untuk memperoleh kemampuan pemrosesan bahasa yang mirip manusia dan dapat digunakan di berbagai bidang seperti chatbot, terjemahan, dan pembuat
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1 April 2024

Google Gemini Ultra Ditenagai Ponsel Cerdas Google, tahun depan, berencana untuk menghadirkan model AI eksklusif cloud 'Gemini Ultra' pada smartphone-nya. Perkembangan teknologi kompresi LLM memungkinkan untuk dijalankan di perangkat, yang berpotensi meningkatkan fungsi smartphone secara signifikan
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1 April 2024

Paradoks Model AI Terkemuka, Transparansi Kurangnya transparansi dalam sistem AI canggih telah menjadi masalah serius. Para peneliti di Universitas Stanford menganalisis 10 sistem AI, termasuk GPT-4, dan menyimpulkan bahwa tidak ada model yang secara transparan mengungkapkan informasi seperti sum
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son

14 Mei 2024

Perbandingan Google Gemini 1.5 vs 1.5 Pro (Termasuk Contoh) Gemini 1.5 Pro adalah model AI yang lebih kuat daripada Gemini 1.5, dan dapat digunakan untuk berbagai tugas seperti analisis kode, pembuatan pengujian unit otomatis, dan konversi kode. Ini sangat cocok untuk pemrosesan data skala besar dan tugas kompleks
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

28 Juni 2024