ARC-AGI v2, 인간 사고의 '모사 능력'을 정면으로 겨누다

[KtN 임우경기자] 2025년 7월, 인공지능 업계의 지형도가 급변하고 있다. 미국의 AI 스타트업 xAI는 'Grok 4'를 앞세워 인간 수준의 추론 능력을 시험하는 두 개의 벤치마크 평가에서 모두 압도적인 성과를 거두었다. ARC-AGI v2와 Humanity’s Last Exam이라는 두 시험은 단순 정보 예측이 아닌 ‘사고의 구조’를 시험하는 평가로, 기존 언어모델의 한계를 가장 분명히 드러내는 기준으로 작동하고 있다.

지금, AI는 지식과 데이터를 넘어 ‘지능의 본질’을 묻는 시대로 접어들고 있다. 한국 사회가 이 흐름에 적극적으로 대응하기 위해선, AI의 성능을 측정하는 기준부터 근본적으로 재정립할 필요가 있다.

ARC-AGI v2, 인간 사고의 '모사 능력'을 정면으로 겨누다

구독자 전용 기사 입니다.
회원 로그인 구독신청