Try using it in your preferred language.

English

  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar
translation

AI가 번역한 다른 언어 보기

해리슨 블로그

Apple 의 OpenELM / MS 의 Phi-3 / Meta 의 Llama 3 공개

  • 작성 언어: 한국어
  • 기준국가: 모든 국가 country-flag

언어 선택

  • 한국어
  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar

durumis AI가 요약한 글

  • 최근 애플, 마이크로소프트, 메타 등 주요 빅테크 기업들이 새로운 대형 언어모델을 공개하며 AI 업계에 큰 변화를 일으키고 있습니다.
  • 각 기업은 모델 사이즈 축소와 경량화, 데이터/알고리즘 최적화, 문맥 이해력 강화 등 다양한 측면에서 새로운 시도를 선보이고 있습니다.
  • 특히 애플의 OpenELM은 소형 디바이스에 최적화된 모델이고, MS의 Phi-3 시리즈는 오픈 모델로 상업적 활용이 가능하며, 메타의 Llama 3는 효율적인 모델 구조를 통해 우수한 성능을 보여주고 있습니다.

최근 주목할 만한 대형 언어모델 출시 소식들

최근 1주일 동안 애플, 마이크로소프트, 메타 등 주요 빅테크 기업들이 연이어 새로운 대형 언어모델을 공개하면서 AI 업계에 상당한 반향을 일으키고 있습니다. 이번에 출시된 모델들의 주요 특징과 의의를 좀 더 자세히 알아보겠습니다.

애플의 OpenELM

4월 25일, 애플은 자체 개발한 OpenELM 언어모델 제품군을 공개했습니다. 0.27B, 0.45B, 1.08B, 3.04B 등 4가지 다양한 사이즈의 모델로 구성되어 있는데, 가장 큰 모델도 겨우 30억 개의 파라미터로 상대적으로 작은 편입니다. 현재 대부분의 대형 언어모델들이 최소 3B 이상의 파라미터를 갖고 있다는 점을 고려하면 OpenELM은 매우 작은 사이즈라고 할 수 있습니다.
이는 애플이 OpenELM을 주로 소형 디바이스에 탑재하여 활용할 것을 염두에 두고 개발했기 때문입니다. 과거에는 파라미터 수를 늘리는 것이 고성능 달성의 주요 방식이었지만, 최근에는 소형화와 경량화에 초점을 맞추는 추세입니다. 애플은 이번에 모델 가중치와 추론 코드뿐만 아니라 데이터셋과 프레임워크까지 전체를 공개함으로써 개방성도 높였습니다.

MS의 Phi-3 시리즈

마이크로소프트 역시 4월 23일 Phi-3 Mini 모델(3.8B 파라미터)을 먼저 공개했고, 향후 7B 사이즈의 Phi-3 Small과 14B 사이즈의 Phi-3 Medium도 출시할 예정입니다. Phi-3 Mini는 오픈 모델로 누구나 무료로 상업적 활용이 가능합니다. 새로운 Phi-3 시리즈 모델들은 모두 MS의 클라우드 서비스 Azure에서 제공될 예정입니다.

메타의 Llama 3

메타(구 페이스북)는 지난 4월 18일 Llama 3 모델의 8B와 70B 버전을 먼저 공개했고, 대형 사이즈인 400B 모델은 여름에 공개할 계획입니다. 특히 8B 모델이 작은 사이즈에 비해 우수한 성능을 보이면서 개발자 커뮤니티로부터 호평을 받고 있습니다.
이는 메타가 방대한 양의 학습데이터를 투입하여 효율적인 모델 구조를 구축했기 때문으로 분석됩니다. 파라미터 수를 늘리는 대신 데이터와 알고리즘 최적화에 주력한 결과라고 볼 수 있습니다.

xAI의 Grok 1.5

3월 38일 발표된 xAI의 Grok 1.5 모델은 최대 128K의 긴 컨텍스트 토큰을 처리할 수 있어 복잡하고 긴 프롬프팅이 가능합니다. 지금까지의 언어모델 개발 트렌드가 단순히 파라미터 사이즈를 키우는 데 초점이 맞춰졌다면, Grok 1.5는 긴 문맥 이해력 향상이라는 새로운 지향점을 제시했습니다.

⁠⁠⁠⁠⁠⁠⁠
이처럼 최근 1주일간 애플, MS, 메타 등 선두 기업들의 신규 대형 언어모델 출시가 이어지면서 AI 기술의 진화 방향성이 더욱 다양해지고 있습니다. 모델 사이즈 축소와 경량화, 데이터/알고리즘 최적화, 문맥 이해력 강화 등 여러 측면에서 새로운 시도가 잇따르고 있는 상황입니다. 향후 AI 생태계가 어떻게 진화할지 주목됩니다.

해리슨
해리슨 블로그
해리슨의 깜짝 블로그
해리슨
Gemini 1.5 Flash 와 GPT-4o 그리고 기타 LLM들의 가격 GPT-4o, Opus, Gemini 1.5 Pro, Haiku, Gemini 1.5 Flash 등 다양한 AI 모델의 성능과 가격을 비교하여 각 모델의 특징과 적합한 사용 사례를 제시합니다. 특히, 입력 토큰 크기와 출력 비율에 따른 모델 선택 가이드를 제공합니다.

2024년 5월 18일

최근 추천할 만한 AI 서비스 최근 유명하고 추천할 만한 AI 서비스들을 소개합니다. ChatGPT와 Gemini를 제외하고, NotebookLM과 Perplexity AI를 비롯해 업무 효율성을 높일 수 있는 서비스들을 정리했습니다. NotebookLM은 구글에서 제공하는 서비스로, 구글 드라이브, PDF, 텍스트 파일, 웹페이지 링크 등을 입력하면 정보를 검색할 수 있습니다. 특히 방대한 길이의 문서에서 자료를 찾을 때 유용하며, 최대 50만 단어까지 업로드할 수 있습니다. Pe

2024년 6월 23일

ChatGPT vs Gemini 가격 비교 ChatGPT와 Google의 Vertex AI - Palm2 & Gemini의 클라우드 서비스 가격을 토큰 또는 글자 수 기준으로 비교하여 보여줍니다.

2024년 3월 7일

오픈소스로 완성하는 AI Full Stack AI 오픈소스 생태계는 LangChain의 성공을 시작으로 Open LLM, LLM 추론 및 서빙, LLM 프록싱, LLM 모니터링, LLM 프레임워크 등 다양한 분야에서 빠르게 발전하고 있습니다. Mistral, Llama 2, phi-2 등의 Open LLM 모델과 Ollama, vLLM, KServe 등의 추론 및 서빙 도구를 비롯해 LangChain, LlamaIndex, Haystack 등의 프레임워크까지 폭넓은 오픈소스들이 제공되고 있습니다.
RevFactory
RevFactory
RevFactory
RevFactory

2024년 2월 5일

선도적 AI 모델의 역설, 투명성 스탠퍼드 대학교 연구진은 GPT-4를 포함한 10개의 AI 시스템의 투명성을 평가한 결과, 데이터셋, 훈련 방법, 하드웨어 등의 정보 공개 수준이 매우 낮다는 것을 밝혀냈습니다. 이는 AI 업계의 폐쇄성이 심화되고 있으며, AI 발전에 재현성 확보와 투명성이 중요함을 시사합니다. 특히 데이터셋에 대한 접근성을 확대하여 AI 시스템의 신뢰성과 안전성을 높여야 한다는 주장이 제기됩니다.
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son

2024년 5월 14일

스노우플레이크, 업계 최고 수준의 개방성 갖춘 엔터프라이즈급 LLM ‘아크틱’ 출시 스노우플레이크는 업계 최고 수준의 개방성과 성능을 갖춘 대규모 언어 모델 '스노우플레이크 아크틱'을 출시했습니다. 아파치 2.0 라이선스로 무료로 상업적 이용이 가능하며, 다양한 프레임워크를 지원하여 커스터마이징이 가능합니다. 아크틱은 SQL 코드 생성, 명령 이행 등 다양한 기준에서 최고 수준의 성능을 제공하며, 검색 사용을 위한 텍스트 임베딩 모델도 포함되어 있습니다.
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)

2024년 4월 25일

LLM (Large Language Model) 이란? LLM은 방대한 텍스트 데이터를 학습하여 인간과 유사한 언어를 이해하고 생성하는 대형 언어 모델입니다. 문장 생성, 답변 제공, 텍스트 요약, 번역 등 다양한 작업을 수행할 수 있으며, 인공 지능 챗봇, 자동 번역, 텍스트 생성 등 다양한 분야에 활용될 수 있습니다.
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

2024년 4월 1일

구글 제미나이 울트라 스마트폰 탑재 구글이 내년 출시하는 스마트폰에 클라우드에서만 사용 가능했던 ‘제미나이 울트라’급 LLM을 탑재할 예정입니다. LLM 압축 기술 발전으로 스마트폰에서 AI 기능을 직접 실행할 수 있게 되면서, 음성 명령, 개인 맞춤형 정보 제공 등 새로운 기능이 가능해질 전망입니다.
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

2024년 4월 1일

구글 제미니 1.5 vs 1.5 Pro 비교(예시 포함) 제미니 1.5 Pro는 제미니 1.5보다 더 강력한 AI 모델로, 코드 분석, 단위 테스트 자동 생성, 코드 변환 등 다양한 작업에 활용할 수 있습니다. 특히 대규모 데이터 처리와 복잡한 작업에 적합합니다.
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

2024년 6월 28일