OpenAI, ‘추론’ 능력을 갖춘 새로운 AI 모델 시리즈 출시
Microsoft 지원 OpenAI는 목요일에 질문에 대한 답변을 처리하는 데 더 많은 시간을 할애하여 어려운 문제를 해결하도록 설계된 “Strawberry” 시리즈의 AI 모델을 출시한다고 밝혔습니다.
로이터가 처음 보도한 이 모델은 복잡한 작업을 추론할 수 있으며, AI 회사는 블로그 게시물을 통해 이전 모델보다 과학, 코딩, 수학 분야에서 더 어려운 문제를 해결할 수 있다고 밝혔습니다.
OpenAI는 내부적으로 프로젝트를 지칭하기 위해 코드명 Strawberry를 사용했고, 목요일에 발표된 모델은 o1과 o1-mini라고 불렀습니다. o1은 목요일부터 ChatGPT와 해당 API에서 사용할 수 있다고 회사는 밝혔습니다.
OpenAI의 연구원인 노엄 브라운은 회사 모델의 추론 기능 개선에 집중하며 소셜 미디어 플랫폼 X에 게시한 게시물에서 해당 모델이 Strawberry 프로젝트와 동일하다고 확인했습니다.
브라운은 “진정한 일반 추론이 가능한 AI 모델을 만들기 위한 OpenAI의 노력의 결실을 여러분과 공유하게 되어 기쁩니다.”라고 썼습니다.
OpenAI는 블로그 게시물에서 o1 모델이 국제 수학 올림피아드 예선 시험에서 83%의 성적을 받았고, 이전 모델인 GPT-4o는 13%를 받았다고 밝혔습니다.
회사 측은 이 모델이 경쟁적 프로그래밍 문제에 대한 성과도 향상시켰고, 과학 문제의 벤치마크에서 인간 박사 수준의 정확도를 넘어섰다고 밝혔습니다.
브라운은 모델이 복잡한 문제를 더 작은 논리적 단계로 분해하는 것을 포함하는 “사고의 사슬” 추론으로 알려진 기술을 통합하여 점수를 달성할 수 있었다고 말했습니다.
연구자들은 복잡한 문제에 대한 AI 모델 성능이 이 접근 방식이 프롬프팅 기술로 사용되었을 때 향상되는 경향이 있다는 것을 알아챘습니다. OpenAI는 이제 이 기능을 자동화하여 모델이 사용자 프롬프팅 없이 스스로 문제를 분석할 수 있도록 했습니다.
OpenAI는 “우리는 이 모델들이 사람이 하듯이 반응하기 전에 문제를 생각하는 데 더 많은 시간을 할애하도록 훈련시켰습니다. 그들은 훈련을 통해 사고 과정을 개선하고, 다양한 전략을 시도하고, 실수를 인식하는 법을 배웁니다.”라고 말했습니다.
Reuters는 2023년 11월에 OpenAI의 추론 프로젝트(당시 Q*라고 불림)에 대한 작업을 처음으로 보도했습니다. 7월에 이 프로젝트가 Strawberry로 알려지게 되었다고 보도했습니다.
(이것은 신디케이트된 뉴스피드에서 편집되지 않은 자동 생성된 기사입니다. 파이에듀뉴스 직원이 콘텐츠 텍스트를 변경하거나 편집하지 않았을 수 있습니다.)