Try using it in your preferred language.

English

  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar
translation

AI가 번역한 다른 언어 보기

해리슨 블로그

Gemini 1.5 Flash 와 GPT-4o 그리고 기타 LLM들의 가격

  • 작성 언어: 한국어
  • 기준국가: 모든 국가 country-flag

언어 선택

  • 한국어
  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar

durumis AI가 요약한 글

  • OpenAI의 GPT-4o, Anthropic의 Claude 3, Google의 Gemini 등 최근 출시된 AI 모델들의 성능과 가격을 비교 분석했습니다.
  • GPT-4o는 성능은 뛰어나지만, 128K 토큰 이상의 입력은 불가능하며, Opus는 200K 토큰까지 지원하지만 GPT-4o 보다 성능이 약간 떨어집니다.
  • 저렴한 LLM을 찾는 경우에는 Claude 3의 Haiku를, 입력 대비 출력 비율이 높거나 200K 토큰을 초과하는 작업에는 Gemini 1.5 Flash를 추천합니다.

이번에 이틀동안 연달아 구글과 OpenAI 에서 새로운 AI 와 관련된 내용들을 엄청나게 발표했다.

일반적으로 사람들이 사용하기에 궁금한 부분은 크게 2가지.

성능과 가격. ( 물론 더 많은 기능들이 있지만 그건 전문 블로거들분들이 리뷰해주니까..)

Open AI - GPT

OpenAI 가 늘 그렇듯 신형 4o 는 기존 GPT-4T 보다 저렴해졌다. 성능이야 다른 많은 블로그를 검색하면 너무나도 많은 리뷰가 나오니까 패스하고, 여기서는 우선 가격만 놓고 이야기.

GPT 가격표


기본적으로 Open AI 는 GPT 3.5 Turbo 이후 처음에 GPT 4 가 나온뒤 신제품이 나올때는 매번 가격을 낮췄다. 물론 성능은 업그레이드. 현재로써는 당연히 저렴한 비용을 선택해야 할 경우에는 3.5 Turbo . 나머지 케이스는 4o 를 사용하면 될듯.


Anthopic - Claude 3

Claude 3 가격표

최근 Anthropic 은 신제품 발표가 없긴 하지만 가성비로 사용할 수 있는 Haiku 와 고성능의 Opus 때문에 논외로 할 수 없는 LLM 회사.

Input 토큰 가격 기준으로는 3사 중에서 가장 저렴한 Haiku 는 간단하게 텍스트들을 처리할때는 제일 저렴.

심지어, 이번에 Gemini Flash 가 나오기 전까지만 해도 Haiku 는 Gemini 1.0 Pro 보다도 성능이 좋아서 매우 유용한 LLM.


Google - Gemini

Gemini 가격표

구글은 2개의 가격 시스템을 유지하고 있다.

하나는 AI Studio 다른 하나는 Vertex AI.

AI Studio 는 다른 회사들과 마찬가지로 Token 기반 가격으로 되어 있고, Vertex AI 는 특이하게도 글자 기반 가격으로 되어 있다.

위의 표를 기준으로 생각하면 1 토큰이 평균 3글자미만(1~2글자) 일 경우에는 Vertex AI 에서 사용하는게 저렴하고, 3글자 이상일경우에는 AI Studio 가 더 저렴. 근데, 보통 영문은 당연히 글자수가 넘으니까, AI Studio 가 더 저렴. 한글도 요즘은 1토큰이 여러글자인 경우가 많아서..

아무튼 입력 토큰이나 성능만 놓고 봐도 Gemini 1.5 Flash 가 1.0 Pro 보다 훨씬 낫고. 고성능의 작업이 필요한 경우에는 1.5 Pro 가 우세.


종합

종합

성능만 놓고 봤을때 MMLU 기준으로 GPT-4o > Opus > 1.5 Pro 순인듯.

고도의 지적 작업이 필요한 경우에는 GPT-4o. 조금은 가격이 더 저렴한것을 사용하려면 Gemini 1.5 Pro 를 사용해도 괜찮을것 같다. 저게 실제로 사용해보면 체감이 살짝 다르기 때문에 사용자마다 잘 맞는것을 사용하면 된다.

저렴하게 대량의 텍스트 작업을 해야 할 경우에는 2가지 선택지가 있는데,

Input 대비 Output 의 비율이 낮은 경우 ( 예를들면 대량의 문서를 입력하고 짧은 결과물을 출력해야 하는 경우 )에는 Claude 3 Haiku 가 제일 저렴하다. 대신에 Haiku 는 출력비용이 높아서, 반대로 Output 의 비율이 높은 경우 ( 예를들면 특정한 텍스트를 입력한뒤, 이것을 수정,변경하는 작업을 지시하는 경우 ) 에는 Gemini 1.5 Flash 를 추천한다. 그런 경우에는 출력 비용이 제일 저렴한게 Flash 이다.


요약 및 결론

"나는 가격은 상관없이 무조건 최고로 복잡한 작업을 할것이다." -> GPT - 4o

"그런데, 입력 토큰의 크기가 128K 가 넘는다." ( GPT - 4o 는 128K 이하만 가능 ) -> Opus

"고성능이 필요하지만, 가격이 좀 더 저렴하거나 혹은 토큰의 크기가 200K 가 넘는다." ( Opus 는 200K 이하만 가능 ) -> Gemini 1.5 Pro


나는 최고로 저렴한 LLM 이 필요하다. -> Haiku

그런데, Input/Output 비율에서 Output 이 조금 더 많거나 혹은 200K 토큰을 넘는다. -> Gemini 1.5 Flash


해리슨
해리슨 블로그
해리슨의 깜짝 블로그
해리슨
Claude 3 vs Gemini 가격 비교 Anthropic의 Claude 3 Haiku가 GCP에서 사용 가능하며, H2O.ai의 RAG 평가 결과 Gemini Pro와 비교하여 100만 토큰 기준 가장 저렴한 가격으로 확인됩니다.

2024년 4월 7일

ChatGPT vs Gemini 가격 비교 ChatGPT와 Google의 Vertex AI - Palm2 & Gemini의 클라우드 서비스 가격을 토큰 또는 글자 수 기준으로 비교하여 보여줍니다.

2024년 3월 7일

최근 추천할 만한 AI 서비스 최근 유명하고 추천할 만한 AI 서비스들을 소개합니다. ChatGPT와 Gemini를 제외하고, NotebookLM과 Perplexity AI를 비롯해 업무 효율성을 높일 수 있는 서비스들을 정리했습니다. NotebookLM은 구글에서 제공하는 서비스로, 구글 드라이브, PDF, 텍스트 파일, 웹페이지 링크 등을 입력하면 정보를 검색할 수 있습니다. 특히 방대한 길이의 문서에서 자료를 찾을 때 유용하며, 최대 50만 단어까지 업로드할 수 있습니다. Pe

2024년 6월 23일

구글 제미니 1.5 vs 1.5 Pro 비교(예시 포함) 제미니 1.5 Pro는 제미니 1.5보다 더 강력한 AI 모델로, 코드 분석, 단위 테스트 자동 생성, 코드 변환 등 다양한 작업에 활용할 수 있습니다. 특히 대규모 데이터 처리와 복잡한 작업에 적합합니다.
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

2024년 6월 28일

오픈소스로 완성하는 AI Full Stack AI 오픈소스 생태계는 LangChain의 성공을 시작으로 Open LLM, LLM 추론 및 서빙, LLM 프록싱, LLM 모니터링, LLM 프레임워크 등 다양한 분야에서 빠르게 발전하고 있습니다. Mistral, Llama 2, phi-2 등의 Open LLM 모델과 Ollama, vLLM, KServe 등의 추론 및 서빙 도구를 비롯해 LangChain, LlamaIndex, Haystack 등의 프레임워크까지 폭넓은 오픈소스들이 제공되고 있습니다.
RevFactory
RevFactory
RevFactory
RevFactory

2024년 2월 5일

선도적 AI 모델의 역설, 투명성 스탠퍼드 대학교 연구진은 GPT-4를 포함한 10개의 AI 시스템의 투명성을 평가한 결과, 데이터셋, 훈련 방법, 하드웨어 등의 정보 공개 수준이 매우 낮다는 것을 밝혀냈습니다. 이는 AI 업계의 폐쇄성이 심화되고 있으며, AI 발전에 재현성 확보와 투명성이 중요함을 시사합니다. 특히 데이터셋에 대한 접근성을 확대하여 AI 시스템의 신뢰성과 안전성을 높여야 한다는 주장이 제기됩니다.
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son

2024년 5월 14일

Mr. Know-All 6호 - 2024년 3월 LLaMa, Falcon, MPT, StarCoder와 같은 오픈소스 LLM을 로컬에서 다운로드하고 실행할 수 있는 플랫폼인 LM Studio와 AnythingLLM을 소개합니다. LM Studio는 개인 용도로 무료이며, AnythingLLM은 소프트웨어 개발에 유용한 Copilot 기능을 제공합니다.
Pilot AISmrteasy
Pilot AISmrteasy
Pilot AISmrteasy
Pilot AISmrteasy

2024년 3월 21일

구글 제미나이 울트라 스마트폰 탑재 구글이 내년 출시하는 스마트폰에 클라우드에서만 사용 가능했던 ‘제미나이 울트라’급 LLM을 탑재할 예정입니다. LLM 압축 기술 발전으로 스마트폰에서 AI 기능을 직접 실행할 수 있게 되면서, 음성 명령, 개인 맞춤형 정보 제공 등 새로운 기능이 가능해질 전망입니다.
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

2024년 4월 1일

구글 제미니와 마소의 챗GPT 뭐가 더 나을까? 구글 제미니와 챗GPT는 2년 동안 짝사랑하는 이성에게 보내는 편지를 각자의 스타일로 작성해 주었습니다. 구글 제미니는 조언을 해주는 듯한 느낌으로 존댓말을 사용하며 템플릿 형식의 편지를 제공했고, 챗GPT는 친구에게 이야기하듯이 반말로 좀 더 자세한 내용의 편지를 작성했습니다.
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증
Unusual Curiosity: 흔치 않은 궁금증

2024년 6월 24일