일부 테스트서 오픈AI 경쟁모델 능가
개발비는 크게 적어... 미 AI 업계 긴장
중국 인공지능(AI) 스타트업 '딥시크(DeepSeek)'가 공개한 AI 모델 '딥시크 R1'이 미국 실리콘밸리에서 파란을 일으키고 있다. 비교적 적은 예산, 두 달이라는 짧은 시간 동안 개발됐음에도 오픈AI, 메타, 앤스로픽 같은 미국 AI 선두 기업들의 최신 모델과 비슷한 성능을 내는 것으로 확인됐기 때문이다. 딥시크의 성과는 특히 미국의 대(對)중국 첨단 반도체 수출 제재를 뚫고 달성한 것이라는 점에서, 미국 AI 업계의 긴장감도 높아지고 있다.
2개월간 저사양 칩으로만 개발
25일(현지시간) 영국 파이낸셜타임스(FT) 등에 따르면 중국 AI 스타트업 딥시크는 최근 '딥시크 R1'이라는 추론형 AI 모델을 오픈소스(무료 공개) 형태로 공개하고, 이 모델 구축 과정을 담은 보고서를 발표했다. 딥시크 R1은 오픈AI가 지난해 9월 출시한 AI 모델 'o1'처럼 '추론'에 특화한 모델이다. 문제를 단계별로 분석하고 해결하는 연쇄적 사고를 통해 스스로 답을 찾아나간다는 의미다.
딥시크는 R1이 일부 성능 테스트에서 o1을 앞섰다고 보고서에서 밝혔다. 미국 수학경시대회 벤치마크(성능 측정 기준) 테스트에서 R1은 79.8%를 얻어 79.2%를 획득한 o1을 앞섰고, 코딩 테스트에서도 정확도 65.9%를 기록해 o1(63.4%)보다 높았다고 한다.
이 같은 결과는 딥시크가 자체적으로 행한 테스트에서 나온 것인 만큼 '신뢰하기 어렵다'는 평가도 있다. 그러나 실리콘밸리는 딥시크가 '2개월'이라는 짧은 기간 동안 560만 달러(약 80억2,200만 원) 정도의 예산을 들여 R1을 개발했다는 데 주목한다. 오픈AI 같은 미국 회사들이 AI 모델 개발에 최소 1억 달러(약 1,432억5,000만 원) 이상을 투입하는 것과 비교하면 훨씬 적은 액수다.
더 놀라운 것은 R1이 2,048개의 엔비디아 H800 칩을 이용해 개발됐다는 점이다. H800은 엔비디아가 2022년 미국 정부의 통제 조치로 첨단 AI 칩의 중국 수출길이 막히자, 오로지 중국 시장만을 겨냥해 개발한 저사양 칩이다. 딥시크 주장이 사실이라면 첨단 칩 대비 처리 속도가 절반밖에 되지 않는 저사양 칩만을 이용해 오픈AI의 경쟁 모델보다 성능이 뛰어난 AI 모델을 만들었다는 얘기가 된다.
"미국의 대중국 통제, 의도한 효과 못 내"
실제 R1을 접한 미국 AI 업계 관계자들은 R1의 성능이 무시할 수 없는 수준이라는 반응을 보이고 있다. 실리콘밸리 유명 벤처캐피털 앤드리슨 호로위츠의 공동 창업자 마크 앤드리슨은 "딥시크 R1은 내가 본 것 중 가장 놀랍고 인상적인 혁신 중 하나"라고 평했다. UC 버클리대의 AI 정책 연구원 리트윅 굽타도 R1에 대해 "AI 모델을 훈련하는 사람은 많은 자원을 소비해야 하지만 그다음부터는 더 적은 비용으로 더 빠르게 일정 수준에 도달할 수 있음을 보여 줬다"고 FT에 말했다.
딥시크의 사례는 중국 AI 기업들의 경쟁력을 약화시키려는 미국의 통제가 의도대로 작동하지 않고 있다는 방증이라는 분석도 나온다. AI 검색 플랫폼 기업 퍼플렉시티의 아라빈드 스리니바스 최고경영자(CEO)는 "제재가 (오히려) 혁신의 원동력이 됐다"고 잘라 말했다. 미국 매사추세츠공대(MIT)가 펴내는 과학기술잡지 MIT 테크놀로지 리뷰는 "여러 초기 증거에 따르면 미국의 대중국 통제 조치들은 의도한 효과를 내지 못하고 있는 것으로 보인다"며 "도리어 딥시크 같은 스타트업들이 효율성, 자원의 공유, 협력을 우선시하면서 협력하도록 만들고 있다"고 분석했다.