성능 개선됐다더니 환각률 48%”…챗GPT 새 모델 무슨 일

페이지 정보

작성자 성수현 작성일25-04-23 11:16 조회72회 댓글0건

본문

<a href="https://weddingguide.kr/wedding/cheongju/" target="_blank" rel="noopener" title="청주웨딩박람회" class="seo-link good-link">청주웨딩박람회</a> 오픈AI가 최근 공개한 추론형 인공지능(AI) 모델 챗GPT ‘o3’와 ‘o4-미니’가 이전 세대보다 강력해진 성능을 갖췄지만, 환각(hallucination) 현상은 더 심해진 것으로 나타났다. 환각은 생성형 AI가 실제 존재하지 않는 정보를 사실처럼 만들어내는 현상을 말한다. 4월 20일 미국 정보기술(IT) 전문매체 테크크런치는 오픈AI의 자체 벤치마크 테스트인 ‘퍼슨 QA’ 평가 결과를 인용해 o3와 o4-미니 모델이 각각 33%와 48%의 환각 반응률을 보였다고 보도했다.

이전 추론 모델인 o1과 o3-미니 모델의 환각 반응률은 각각 16%와 14.8%다. 전작과 비교하면 신작 모델 환각 반응이 거의 2배 이상 증가한 셈이다. 심지어 비추론 모델인 GPT-4o보다도 o3, o4-미니에서 환각이 더 자주 발생한 것으로 드러났다.

앞서 오픈AI는 4월 16일(현지 시각) “역대 가장 뛰어난 추론 모델이자 챗GPT의 마지막 독립형 AI 추론 모델이 될 것”이라고 홍보하며 o3·o4-미니 모델을 공개했다. 두 모델은 수학·코딩·과학 분야 테스트에서 기존 모델 대비 우수한 성능을 냈다. 이미지와 텍스트를 함께 해석하는 대학 수준 문제에 o3는 82.9%, o4-미니는 81.6%의 정답률을 기록했다..

댓글목록

등록된 댓글이 없습니다.

성능 개선됐다더니 환각률 48%”…챗GPT 새 모델 무슨 일 > 공지/문의게시판

공지/문의게시판

성능 개선됐다더니 환각률 48%”…챗GPT 새 모델 무슨 일

페이지 정보

본문

댓글목록