OpenAI, 가장 비용 효율적인 작은 모델 GPT-4o mini 공개

OpenAI가 야심차게 선보인 새로운 모델, GPT-4o mini는 인공지능을 한층 더 저렴하고 접근 가능하게 만들어, 다양한 AI 애플리케이션의 범위를 크게 확장할 예정이다.

GPT-4o mini는 MMLU에서 82%의 점수를 기록하며, 현재 LMSYS 리더보드의 채팅 선호도에서 GPT-4를 능가하는 성과를 보여주고 있다.

가장 큰 장점 중 하나는 저렴한 가격이다. GPT-4o mini는 입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트로, 이전 최첨단 모델보다 10배 저렴하며 GPT-3.5 Turbo보다 60% 이상 저렴하다. 이러한 비용 절감은 AI 기술을 더욱 폭넓게 활용할 수 있는 길을 열어준다.

GPT-4o mini의 주요 기능

GPT-4o mini의 주요 기능은 다음과 같다.

GPT-4o mini 기능설명
낮은 비용입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트
지연 시간 감소빠른 응답 시간으로 다양한 작업 수행 가능
멀티모델 호출여러 API 호출을 병렬화하거나 연결 가능
대용량 컨텍스트 처리전체 코드 베이스나 대화 기록 등 많은 양의 컨텍스트 처리 가능
고객 지원실시간 텍스트 응답을 주고받는 애플리케이션에 적합
멀티모달 지원텍스트와 비전, 향후 이미지, 비디오, 오디오 입출력 지원
큰 컨텍스트 윈도우128K 토큰의 컨텍스트 윈도우, 요청당 최대 16K 출력 토큰 지원
최신 지식2023년 10월까지의 지식을 보유

낮은 비용과 지연 시간으로 광범위한 작업을 수행할 수 있으며, 여러 모델 호출을 연결하거나 병렬화하는 애플리케이션에 적합하다.

예를 들어, 여러 API 호출이 필요한 복잡한 애플리케이션에 매우 유용하다.

모델에 많은 양의 컨텍스트를 전달하는 애플리케이션, 예를 들어 전체 코드 베이스나 대화 기록을 처리해야 하는 경우에도 적합하다.

고객과 빠르고 실시간으로 텍스트 응답을 주고받는 애플리케이션, 예를 들어 고객 지원 챗봇에서도 탁월한 성능을 발휘한다.

GPT-4o mini는 API에서 텍스트와 비전을 지원하며, 향후에는 텍스트, 이미지, 비디오 및 오디오 입출력을 모두 지원할 예정이다. 128K 토큰의 컨텍스트 윈도우를 가지고 있으며, 요청당 최대 16K 출력 토큰을 지원한다.

또한, 2023년 10월까지의 지식을 보유하고 있어 최신 정보를 바탕으로 한 응답을 제공할 수 있다. GPT-4o와 공유하는 개선된 토크나이저 덕분에 영어 이외의 텍스트 처리도 더욱 비용 효율적으로 가능하다.

GPT-4o mini는 텍스트 인텔리전스와 멀티모달 추론에서 GPT-3.5 Turbo 및 기타 소형 모델을 능가하는 성능을 보여준다.

GPT-4o와 동일한 언어 범위를 지원하며, 함수 호출 성능이 우수하여 개발자가 외부 시스템에서 데이터를 가져오거나 작업을 수행하는 애플리케이션을 구축할 수 있다. 또한, GPT-3.5 Turbo에 비해 장문 컨텍스트 성능이 향상되었다.

성능 및 학습

GPT-4o mini는 MMLU에서 82.0%, MGSM에서 87.0%, HumanEval에서 87.2%, MMMU에서 59.4%의 점수를 받아 다른 소형 모델들보다 우수한 성능을 자랑한다.

Evaluation Scores Chart

Evaluation Scores

이 모델은 사전 학습 시 모델이 학습하거나 출력하지 않기를 원하는 정보를 필터링하며, 사후 학습 시 인간 피드백을 통한 강화 학습(RLHF) 등의 기법을 사용하여 모델의 동작을 정책에 맞게 조정한다.

평가 기준점수
MMLU82.0%
MGSM87.0%
HumanEval87.2%
MMMU59.4%
텍스트 인텔리전스GPT-3.5 Turbo 및 기타 소형 모델을 능가
멀티모달 추론GPT-3.5 Turbo 및 기타 소형 모델을 능가
장문 컨텍스트 성능GPT-3.5 Turbo보다 향상

이를 통해 모델 응답의 정확성과 신뢰성을 개선했다. 또한, GPT-4o mini는 GPT-4o와 동일한 안전 완화 기능을 내장하고 있으며, 70명 이상의 외부 전문가들이 GPT-4o를 테스트해 잠재적 위험을 식별하고 해결했다.

가격 및 가용성

가격 및 가용성 측면에서 보면, GPT-4o mini는 이제 Assistants API, Chat Completions API 및 Batch API에서 텍스트 및 비전 모델로 사용 가능하다.

항목설명
API 제공Assistants API, Chat Completions API, Batch API에서 텍스트 및 비전 모델 사용 가능
가격입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트
파인튜닝 출시향후 며칠 내에 파인튜닝 출시 예정
ChatGPT 접근성무료, 플러스, 팀 사용자는 오늘부터 GPT-3.5 대신 GPT-4o mini 사용 가능
엔터프라이즈 접근성다음 주부터 엔터프라이즈 사용자도 접근 가능

개발자는 입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트를 지불하면 된다. 향후 며칠 내에 GPT-4o mini에 대한 파인튜닝이 출시될 예정이다. ChatGPT의 무료, 플러스 및 팀 사용자는 오늘부터 GPT-3.5 대신 GPT-4o mini에 접근할 수 있으며, 엔터프라이즈 사용자도 다음 주부터 접근 가능하다.

앞으로의 계획

앞으로의 계획에 따르면, AI 인텔리전스의 놀라운 발전과 함께 상당한 비용 절감이 이루어지고 있다.

GPT-4o mini의 토큰당 비용은 2022년에 도입된 text-davinci-003보다 99% 낮아졌다. 모든 앱과 웹사이트에 모델이 원활하게 통합되는 미래를 구상하고 있으며, GPT-4o mini는 개발자가 강력한 AI 애플리케이션을 더 효율적이고 저렴하게 구축하고 확장할 수 있는 길을 열어준다.

AI의 미래는 더 접근하기 쉽고, 신뢰할 수 있으며, 우리의 일상적인 디지털 경험에 내재되어 갈 것이다.

Leave a Comment