본문 바로가기

GPT o1, o1-mini 모델 공개 - 모델 설명, 성능 및 사용법

Léaf 2024. 9. 13.

오픈AI 추론 모델 'o1 시리즈' 공개

OpenAI o1 발표
OpenAI o1 발표

2024년 9월 12일에 오픈 AI의 코드명 스트로베리 모델인 o1를 출시하였습니다. 

한 번 자세히 알아보겠습니다. 

오픈AI o1 시리즈란?

OpenAI가 9월 12일부터 공개한 o1 시리즈는 복잡한 문제 해결을 위해 설계된 새로운 추론 모델입니다.

모델의 가장 큰 특징은 응답하기 전에 더 많은 시간을 들여 사람과 같이 '생각'한다는 점입니다. 마치 인간처럼 문제를 깊이 고민하고 다양한 전략을 시도하며, 자신의 실수를 인식하는 능력을 갖추고 있다고 합니다.

곧 AI가 SF영화에서 봤던 모습을 볼 날이 멀지 않은 것 같아 무섭습니다.

오픈 AI o1 시리즈 성능

물리학, 화학, 생물학 분야의 어려운 벤치마크 테스트에서 PhD 학생들과 비슷한 수준의 성과를 보였다고 합니다.

특히 수학과 코딩 분야에서 두각을 나타냈다고 합니다, 국제 수학 올림피아드(IMO) 예선 문제의 83%를 정확히 풀어냈습니다. 이는 기존 GPT-4o의 13% 정답률과 비교하면 엄청난 발전입니다!

코딩 능력도 뛰어나서 Codeforces 대회에서 89%에 도달했다고 합니다. 

차이가 너무 크게 나서 놀랍습니다.

추론 벤치마크 결과
추론 벤치마크 결과

다른 벤치마크에서도 GPT-4o보다 성능이 훨씬 높은 걸 보실 보실 수 있습니다. 

벤치마크 결과
벤치마크 결과

벤치마크 결과는 o1 >>>>> GPT-4o이네요

o1-mini 모델 소개 

o1 시리즈의 일부로 'o1-mini'도 함께 출시되었습니다.

모델은 특히 코딩에 효과적인 더 빠르고 저렴한 추론 모델입니다. o1-preview보다 80% 저렴하면서도 추론 능력이 강력하다고 합니다.

벤치마크 결과에서도 o1랑 크게 차이가 없고 비슷한 성능을 보여준다고 합니다. 

o1 모델 사용법

o1모델은 현재 ChatGPT 서비스에서 이용할 수 있다고 합니다. 

오픈 AI 데스크탑 앱, 모바일 앱, 웹에서 모두 이용이 가능합니다.

모델 설정할 때 o1 모델을 선택해 주시면 됩니다. mini모델보다는 먼저 Preview모델을 선택해서 사용해 보시는 걸 추천드립니다.

모델 설정 화면
모델 설정 화면

ChatGPT Plus와 Team 사용자들은 o1 모델을 사용할 수 있습니다.

ChatGPT Enterprise와 Edu 사용자도 사용 사용을 할 수 있다고 합니다. (다음 주부터)

그리고 무료 사용자는 preview버전은 사용 못하고, o1-mini는 사용할 수 있다고 합니다. 하지만, 언제 사용할 수 있을지는 모르겠습니다.

o1 사용 후기 - o1, o1-mini

먼저, o1-preview 모델을 선택해서 보겠습니다.

전과 다른 점은 "생각하기"라는 기능이 생긴 것 같습니다. 위에 언급했던 거와 같이 질문에 대해 스스로 생각하는 기능입니다.

GPT-4o 썼을 때는 바로 나왔는데, 생각한다고 하니 신기하네요. 그리고 생각하는데 24가 걸렸다고 나옵니다.

어떻게 생각을 구상했는지 나오고, 그 아래 일정을 만들어 주었습니다. 

o1-preview 답변
o1-preview 답변

이번에는 똑같은 질문으로 o1-mini를 써보겠습니다. 

o1-mini 답변
o1-mini 답변

o1-mini는 답변에 2초가 걸렸습니다. 

근데, 결과가 o1-preveiw와 o1-mini의 결과 차이가 안나는 것 같습니다. 답변이 비슷하다고 해야 하나... 아마 이런 쪽은 별 다른 점이 없나 보네요. 추론 쪽으로 필요할 때만 사용하면 될 것 같습니다. 코딩이나 수학, R&D 이쪽으로 그 외는 그냥 GPT-4o 쓰는 게 좋을 듯합니다.

메시지 제한 

o1 모델에 메시지 제한이 있습니다.

o1-preview : 1주일 당 30개

o1-mini :1주일 당 50개

막 쓸 수는 없을 듯합니다 ㅠ

오픈 AI의 새로운 계획

OpenAI는 이번 o1 시리즈를 시작으로 계속해서 모델을 개선하고 새로운 기능을 추가할 예정이라고 합니다.

웹 브라우징, 파일 및 이미지 업로드 등의 기능이 추가될 것으로 보입니다.

또한, 기존의 GPT 시리즈도 계속 개발하여 발표한다고 합니다. GPT 시리즈와 o1 시리즈 두 개의 시리즈를 운영한다고 하네요.

댓글