[AI 트렌드] 50달러 AI의 혁명… 초저비용·고효율 모델이 바꾸는 AI 패권

AI 모델 개발의 패러다임 전환… ‘s1’이 던진 저비용·고효율 혁신

2025-02-11 임우경 기자

[KtN 임우경기자] AI 기술 발전 속도가 한계를 뛰어넘고 있다. 스탠퍼드대학과 워싱턴 대학의 연구진이 발표한 새로운 추론 모델 ‘s1’은 AI 개발의 판도를 바꿀 가능성을 보여줬다. 이번 연구에서 특히 주목할 점은, 50달러(약 7만2000원)라는 초저비용으로 최첨단 AI 모델과 유사한 성능을 구현했다는 점이다.

‘s1’ 모델은 수학 능력을 측정하는 ‘MATH 500’ 벤치마크에서 93%의 정확도를 기록하며, 오픈AI의 ‘o1’(94.8%), 딥시크 ‘R1’(97.3%) 등 최첨단 AI 모델과 성능 면에서 대등한 위치에 섰다. 하지만 기존 모델들이 수백만 달러의 훈련 비용을 필요로 했던 것과 비교하면, ‘s1’의 저비용 구조는 AI 연구 및 개발 방식의 근본적인 변화를 의미한다.

AI 연구의 새로운 방향, 최소한의 비용으로 최대 성능

‘s1’ 모델이 저비용·고효율을 실현할 수 있었던 핵심 요인은 기존 AI 기술 자원을 효과적으로 결합한 점에 있다. 연구진은 알리바바가 공개한 ‘Qwen2.5-32B-Instruct’를 기반 모델로 활용하고, 구글 ‘제미나이 2.0 플래시 씽킹’에서 추론 데이터셋을 수집한 후, 이를 ‘증류(distillation)’ 방식으로 압축하여 최적화된 학습 데이터를 구축했다.

학습 방식 또한 기존과 차별화됐다. 연구진은 온라인 수학 학습 플랫폼 ‘NuminaMATH’에서 약 5만9000개의 문제를 수집한 뒤, 이를 구글 ‘제미나이 2.0 플래시 씽킹’ 모델을 통해 해답을 생성하는 방식으로 데이터를 확보했다. 이후 1000개의 샘플을 선별해 ‘s1K’라는 고품질 데이터셋을 최종 구축했고, 이를 활용해 지도 학습(SFT, Supervised Fine-Tuning) 방식으로 단 26분 만에 모델을 훈련했다.

이전까지 AI 모델을 훈련하는 데는 수백, 수천 시간의 연산이 필요했지만, ‘s1’은 이를 단 30분도 걸리지 않는 속도로 구현해냈다. 이는 AI 연구에서 새로운 비용 절감 및 최적화 전략의 가능성을 시사하는 대목이다.

AI 추론 성능 향상을 위한 ‘기다려(Wait)’ 기법

이번 연구에서는 모델의 사고 종료를 지연시키는 방식으로 추론 성능을 극대화한 점도 눈길을 끈다. 연구진은 ‘테스트 타임 스케일링(Test Time Scaling)’ 기법을 적용해 AI가 더 오래 사고할수록 정확한 답을 도출할 수 있도록 설계했다.

이 과정에서 모델이 성급하게 답을 도출하지 않도록 유도하기 위해 ‘기다려(Wait)’라는 개념을 도입했다. 이는 AI가 추론을 멈추지 않고 더 깊이 사고하도록 하는 메커니즘으로, 최종적으로 정답률을 높이는 역할을 했다.

AI 개발 비용 혁신, 대형 기술 기업 독점 깨지나

‘s1’ 모델의 등장은 AI 개발 비용의 장벽을 크게 낮추는 계기가 될 것으로 보인다. 기존 AI 연구에서는 수십억 달러의 투자 없이는 강력한 모델을 구축하기 어려웠다. 하지만 이번 연구는 저비용으로도 경쟁력 있는 AI 모델을 만들 수 있음을 입증했다.

이는 AI 생태계에서 대형 기술 기업의 독점적 지위를 흔들 가능성을 내포하고 있다. 연구소, 스타트업, 개인 개발자들도 적은 비용으로 고성능 AI 모델을 훈련할 수 있는 환경이 조성되면, AI 연구 및 상업화의 패러다임이 달라질 수밖에 없다.

다만, 이러한 변화는 AI 연구의 윤리적 논쟁을 더욱 심화시킬 가능성도 있다.

AI 모델 ‘증류(distillation)’ 방식, 저작권 논쟁 불러오나

‘s1’ 모델이 높은 성능을 구현할 수 있었던 배경에는 기존 AI 모델을 활용한 ‘증류(distillation)’ 기법이 있었다. 연구진은 구글 ‘제미나이 2.0 플래시 씽킹’을 교사 모델로 삼아 학습 데이터를 생성했다. 문제는 이러한 방식이 기존 AI 모델의 데이터를 활용하는 만큼, 법적·윤리적 논란을 불러올 수 있다는 점이다.

현재 오픈AI는 딥시크가 자사의 데이터를 ‘증류’ 방식으로 활용했다고 의심하며 조사에 착수했다. 하지만 이 논쟁을 깊이 들여다보면, 오픈AI 역시 과거 웹 데이터를 허가 없이 수집해 학습한 전례가 있다. AI 연구가 발전할수록, 데이터의 소유권과 사용 방식에 대한 법적 해석은 더욱 복잡해질 전망이다.

AI 연구의 새 방향, 개방형 협력 모델이 대세될까

‘s1’ 모델이 보여준 저비용·고효율의 혁신은 AI 연구에서 폐쇄적 독점이 아닌 개방형 협력 모델이 점점 더 중요한 역할을 하게 될 것임을 시사한다. 이번 연구는 알리바바(기초 모델), 구글(데이터), 오픈AI(방법론) 등 여러 기술 자산을 조합해 성과를 이끌어냈다.

향후 AI 연구는 거대 기술 기업들의 독점 모델보다는 개방형 협력 구조를 중심으로 발전할 가능성이 높다. 연구자들과 오픈 소스 AI 진영이 데이터를 공유하고, 새로운 알고리즘을 공동 개발하는 방식이 더욱 주목받게 될 것이다.

하지만 기술 독점과 개방성 간의 균형을 어떻게 맞출 것인가에 대한 논의는 계속될 것으로 보인다. AI의 학습 데이터는 누구의 소유인가? 특정 AI 모델이 다른 AI 모델을 학습하는 방식은 어디까지 허용되어야 하는가? 이러한 문제들이 AI 연구의 핵심 논쟁으로 떠오르고 있다.

AI 연구의 새로운 전환점, 앞으로의 과제

앞으로 AI 기술 발전이 이어지면서, 데이터 활용의 기준을 어떻게 설정할 것인가, AI 모델의 법적·윤리적 책임을 어디까지 부여할 것인가에 대한 논의가 더욱 심화될 것으로 보인다.

AI가 급속도로 발전하는 시대, 이제 중요한 것은 단순한 기술 혁신이 아니라, 이를 뒷받침할 수 있는 법적·윤리적 체계 구축이다. AI 연구의 미래는 단순한 기술 경쟁이 아니라, 인간과 AI가 공존할 수 있는 구조를 어떻게 설계하느냐에 달려 있다.