Try using it in your preferred language.

English

  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar
translation

Đây là bài viết được dịch bởi AI.

해리슨 블로그

Công khai OpenELM của Apple / Phi-3 của MS / Llama 3 của Meta

  • Ngôn ngữ viết: Tiếng Hàn Quốc
  • Quốc gia cơ sở: Tất cả các quốc gia country-flag

Chọn ngôn ngữ

  • Tiếng Việt
  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar

Văn bản được tóm tắt bởi AI durumis

  • Apple, Microsoft, Meta và các công ty công nghệ lớn khác đang tạo ra những thay đổi lớn trong ngành AI bằng cách phát hành các mô hình ngôn ngữ lớn mới gần đây.
  • Mỗi công ty đều giới thiệu các mô hình khác biệt bằng cách giảm kích thước mô hình hoặc tối ưu hóa dữ liệu/thuật toán, tăng cường khả năng hiểu ngữ cảnh.
  • Đặc biệt, OpenELM của Apple được phát triển phù hợp với các thiết bị nhỏ, trong khi Llama 3 của Meta thể hiện hiệu suất vượt trội mặc dù có kích thước nhỏ nhờ cấu trúc mô hình hiệu quả.

Tin tức về việc phát hành các mô hình ngôn ngữ lớn đáng chú ý gần đây

Trong vòng một tuần qua, các công ty công nghệ lớn hàng đầu như Apple, Microsoft và Meta đã liên tiếp ra mắt các mô hình ngôn ngữ lớn mới, tạo nên tiếng vang đáng kể trong ngành AI. Chúng ta hãy cùng tìm hiểu chi tiết hơn về các tính năng chính và ý nghĩa của các mô hình được phát hành gần đây.

OpenELM của Apple

Vào ngày 25 tháng 4, Apple đã công bố bộ mô hình ngôn ngữ OpenELM do chính hãng phát triển. Bộ mô hình này bao gồm 4 mô hình với kích cỡ khác nhau: 0.27B, 0.45B, 1.08B, 3.04B. Mô hình lớn nhất chỉ có 3 tỷ tham số, tương đối nhỏ so với các mô hình ngôn ngữ lớn khác hiện nay.
Điều này cho thấy Apple đang nhắm mục tiêu sử dụng OpenELM chủ yếu trên các thiết bị nhỏ. Trước đây, việc tăng số lượng tham số là cách chính để đạt được hiệu suất cao, nhưng gần đây xu hướng tập trung vào việc thu nhỏ và nhẹ hóa mô hình. Apple đã tăng cường tính minh bạch bằng cách công khai toàn bộ, bao gồm trọng số mô hình, mã suy luận, bộ dữ liệu và khung phát triển.

Phi-3 series của MS

Microsoft cũng đã công bố Phi-3 Mini (3,8 tỷ tham số) vào ngày 23 tháng 4, và dự kiến sẽ ra mắt Phi-3 Small với kích cỡ 7B và Phi-3 Medium với kích cỡ 14B trong tương lai. Phi-3 Mini là một mô hình mở, cho phép bất kỳ ai sử dụng miễn phí cho mục đích thương mại. Tất cả các mô hình trong bộ Phi-3 series mới sẽ được cung cấp thông qua dịch vụ đám mây Azure của MS.

Llama 3 của Meta

Meta (trước đây là Facebook) đã công bố phiên bản 8B và 70B của mô hình Llama 3 vào ngày 18 tháng 4, và dự kiến ​​sẽ phát hành phiên bản 400B vào mùa hè này. Đặc biệt, mô hình 8B được đánh giá cao bởi cộng đồng nhà phát triển bởi hiệu suất vượt trội so với kích cỡ nhỏ.
Điều này được phân tích là do Meta đã đầu tư vào việc đào tạo với khối lượng dữ liệu khổng lồ và xây dựng cấu trúc mô hình hiệu quả. Có thể nói, kết quả này là minh chứng cho việc tập trung tối ưu hóa dữ liệu và thuật toán thay vì tăng số lượng tham số.

Grok 1.5 của xAI

Mô hình Grok 1.5 của xAI được công bố vào ngày 38 tháng 3 có thể xử lý các token ngữ cảnh dài tối đa 128K, cho phép các câu lệnh phức tạp và dài. Trong khi xu hướng phát triển mô hình ngôn ngữ trước đây tập trung vào việc tăng kích cỡ tham số, Grok 1.5 đã mang đến một hướng đi mới, đó là nâng cao khả năng hiểu ngữ cảnh dài.

⁠⁠⁠⁠⁠⁠⁠
Với chuỗi ra mắt mô hình ngôn ngữ lớn mới từ các công ty hàng đầu như Apple, MS, Meta trong vòng một tuần qua, hướng phát triển của công nghệ AI ngày càng đa dạng. Nhiều nỗ lực mới đang được thực hiện trên nhiều khía cạnh, bao gồm thu nhỏ và nhẹ hóa mô hình, tối ưu hóa dữ liệu/thuật toán, tăng cường khả năng hiểu ngữ cảnh. Chúng ta cùng chờ xem hệ sinh thái AI sẽ phát triển như thế nào trong tương lai.

해리슨
해리슨 블로그
해리슨의 깜짝 블로그
해리슨
Giá của Gemini 1.5 Flash, GPT-4o và các LLM khác So sánh hiệu suất và giá cả của các mô hình AI mới nhất như GPT-4o, Gemini 1.5 Pro, Claude 3 Haiku, Gemini 1.5 Flash để giúp bạn chọn mô hình phù hợp với mình. Xem xét kích thước token đầu vào, tỷ lệ đầu ra, độ khó của tác vụ, v.v. để tìm mô hình hiệu quả

18 tháng 5, 2024

Dịch vụ AI đáng chú ý gần đây Bài viết giới thiệu các dịch vụ AI nổi tiếng và đáng chú ý gần đây. Ngoài ChatGPT và Gemini, bài viết còn tổng hợp các dịch vụ như NotebookLM và Perplexity AI giúp tăng hiệu quả công việc. NotebookLM là dịch vụ do Google cung cấp, cho phép người dùng nhập

23 tháng 6, 2024

So sánh giá giữa Claude 3 và Gemini GCP hiện đã cho phép sử dụng mô hình Anthropic's Claude 3 Haiku, và kết quả đánh giá bằng cách sử dụng RAG của H2O.ai cho thấy nó có hiệu suất cao hơn so với Gemini với cùng mức giá. Claude 3 Haiku là lựa chọn tiết kiệm nhất khi xét đến chi phí đầu vào và

7 tháng 4, 2024

Hoàn thành AI Full Stack bằng mã nguồn mở Các mô hình LLM (mô hình ngôn ngữ lớn) mã nguồn mở mới đang xuất hiện trong hệ sinh thái AI. Mistral, Llama, phi-2, v.v., là những mô hình có hiệu suất mạnh mẽ và giấy phép mở được công khai, và nhiều công cụ khác đang được phát triển để sử dụng chúng. La
RevFactory
RevFactory
RevFactory
RevFactory

5 tháng 2, 2024

LLM (Large Language Model) là gì? Mô hình ngôn ngữ lớn (LLM) là một công nghệ cốt lõi của trí tuệ nhân tạo, được đào tạo trên lượng dữ liệu văn bản khổng lồ để có khả năng xử lý ngôn ngữ tương tự con người, có thể được sử dụng trong nhiều lĩnh vực như chatbot, dịch thuật, tạo văn bản,...
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1 tháng 4, 2024

Snowflake ra mắt 'Arctic', mô hình ngôn ngữ lớn cấp doanh nghiệp với tính mở cao nhất ngành Snowflake đã ra mắt mô hình ngôn ngữ lớn nguồn mở 'Arctic'. Được cấp phép Apache 2.0, cho phép sử dụng thương mại miễn phí, Arctic nổi bật với hiệu suất và hiệu quả hàng đầu ngành. Cung cấp hiệu quả mã thông báo vượt trội và chất lượng tốt nhất, hỗ trợ nh
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)

25 tháng 4, 2024

Sự nghịch lý của các mô hình AI tiên phong, tính minh bạch Thiếu tính minh bạch trong các hệ thống AI tiên tiến đã trở thành một vấn đề nghiêm trọng. Các nhà nghiên cứu tại Đại học Stanford đã phân tích 10 hệ thống AI, bao gồm cả GPT-4, và kết luận rằng không có mô hình nào công khai minh bạch thông tin về nguồn
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son

14 tháng 5, 2024

Snowflake phát hành báo cáo xu hướng dữ liệu năm 2024… Nhà phát triển AI trung bình phát triển 90 ứng dụng mỗi ngày Snowflake đã tiết lộ rằng, dựa trên khảo sát với hơn 9.000 khách hàng, tỷ lệ chatbot trong các ứng dụng LLM đã tăng lên, các nhà phát triển ưu tiên sử dụng Python và khối lượng xử lý dữ liệu phi cấu trúc cũng tăng lên. Tìm hiểu thêm thông tin trong báo cá
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)

16 tháng 5, 2024

So sánh Gemini 1.5 và 1.5 Pro (Bao gồm ví dụ) Gemini 1.5 Pro là một mô hình AI mạnh mẽ hơn Gemini 1.5, có thể được sử dụng cho nhiều tác vụ khác nhau như phân tích mã, tự động tạo kiểm thử đơn vị, chuyển đổi mã, v.v. Đặc biệt phù hợp cho xử lý dữ liệu quy mô lớn và các tác vụ phức tạp.
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

28 tháng 6, 2024