경제문화 Economy, Culture/경제금융 Economy Finance

중국의 DeepSeek AI 모델 세계 충격...엔비디아 팔아야 하나 China's DeepSeek AI Model Shocks the World: Should You Sell Your Nvidia Stock?

Engi- 2025. 1. 28. 13:28

 

중국 AI 스타트업 DeepSeek이 OpenAI의 o1 추론 모델과 유리하게 비교되는 자체 R-1 모델 출시

DeepSeek은 o1과 Meta의 Llama 3.1의 비용의 일부만으로 R1을 훈련시켰다고 주장

엔비디아 주주들은 걱정해야 할까요? 나머지 "Magnificent Seven" 주식을 보유한 사람들은 어떨까?

 

   엔비디아 ( NVDA -16.97% ) 의 마법 같은 2년 행진이 끝나갈 까요 ? 지금까지 엔비디아의 최신 최고의 그래픽 처리 장치(GPU)에 대한 수요는 끊이지 않았습니다. 인공지능 경쟁이 치열해지면서 대형 기술 기업과 신생 기업은 더 나은 모델을 만들기 위해 가능한 한 많은 엔비디아의 고성능 GPU를 사거나 임대하기 위해 서둘렀습니다.

 

하지만 지난주 중국 AI 스타트업 DeepSeek이 기술계를 놀라게 한 R1 모델을 출시했습니다. R1은 12월 초에 출시된 OpenAI의 o1 추론 모델과 동등하거나 더 뛰어난 "추론" 모델이지만 비용은 훨씬 저렴합니다.

 
cbs news

 

제한된 컴퓨팅 리소스로 최첨단 대규모 언어 모델(LLM)을 생성할 수 있다는 것은 AI 회사가 앞으로 고비용 컴퓨팅 리소스를 많이 구매하거나 임대할 필요가 없을 수 있음을 의미할 수 있습니다. 그 결과는 Nvidia와 작년 AI 우승자 모두에게 파괴적일 수 있습니다.

 

하지만 언제나 그렇듯이 진실은 훨씬 더 복잡합니다.

 

 

DeepSeek란 무엇인가요?

DeepSeek은 High-Flyer라는 양적 헤지펀드에서 분사된 AI 랩입니다. CEO인 량원펑은 2015년에 High-Flyer를 설립하고 2023년에 ChatGPT 의 획기적인 데뷔 이후 DeepSeek 벤처를 시작했습니다 .

 

DeepSeek은 그 이후로 AI 모델을 구축해 왔으며, 제한되기 전에 10,000개의 Nvidia A100을 구매한 것으로 알려졌으며, 이는 현재 Blackwell 칩보다 2세대 앞선 것입니다. DeepSeek은 또한 중국 시장을 위해 설계된 Nvidia H100의 제한되거나 느린 버전인 Nvidia H800 클러스터를 보유하고 있는 것으로 알려졌습니다. 주목할 점은 H100이 최근 Blackwell 출시 이전의 최신 세대 Nvidia GPU라는 것입니다.

 

R1이 세상을 충격에 빠뜨렸다

1월 20일, DeepSeek은 V3 LLM을 기반으로 한 최초의 "추론" 모델인 R1을 출시했습니다. 추론 모델은 비교적 새로운 것으로, 강화 학습이라는 기술을 사용하는데, 이는 본질적으로 LLM을 사고의 사슬을 따라 내려가게 한 다음, "벽"에 부딪히면 역전한 다음, 최종 답에 도달하기 전에 다양한 대안적 접근 방식을 탐색합니다. 따라서 추론 모델은 단순한 질의응답 모델보다 더 정밀하게 복잡한 질문에 답할 수 있습니다.

 

놀랍게도 R1은 여러 벤치마크에서 OpenAI의 o1을 충족하거나 심지어 능가하는 성과를 거두었으며, 비용은 훨씬 적게 들었다고 합니다.

 

우리가 이야기하는 것은 얼마나 저렴한가? R1 논문은 이 모델이 대여 GPU 시간 560만 달러에 해당하는 금액으로 훈련되었다고 주장하는데, 이는 OpenAI와 다른 미국 리더들이 지출한 것으로 알려진 수억 달러의 일부에 불과합니다. DeepSeek은 또한 OpenAI의 o1이 실행하는 데 드는 가격의 약 30분의 1을 청구하는 반면, Wenfeng은 DeepSeek이 비용보다 더 높은 "소액의 이익"을 청구한다고 주장합니다. 전문가들은 Meta Platforms ( META 1.91% ) 의 Llama 3.1 405B 모델이 대여 GPU 시간으로 약 6,000만 달러가 들었고, V3의 경우 약 600만 달러가 들었지만, V3는 다양한 벤치마크에서 Llama의 최신 모델보다 성능이 뛰어났다고 추정했습니다.

 

DeepSeek는 어떻게 성공했는가

Kevin Xu의 유익한 블로그 게시물에 따르면, DeepSeek은 세 가지 독특한 장점을 통해 이 작은 기적을 실현할 수 있었습니다.

 

첫째, 웬팡은 명확한 사업 모델 없이 일종의 이상적인 AI 연구실로서 DeepSeek을 구축했습니다. 현재 DeepSeek은 다른 사람들이 그 위에 제품을 구축하는 데 약간의 비용을 청구하지만, 그 외에는 오픈소스 모델을 무료로 제공합니다. 웬팡은 또한 학교를 갓 졸업했거나 중국 최고 대학에서 박사 과정을 밟고 있는 젊은이들을 주로 모집했습니다. 이로 인해 큰 기대 없이 자유로운 실험과 시행착오의 문화가 생겨났고, DeepSeek은 중국의 기술 거대 기업과 차별화되었습니다.

 

두 번째로, DeepSeek는 자체 데이터 센터를 사용하여 하드웨어 랙을 자체 목적에 맞게 최적화할 수 있었습니다.

 

마지막으로, DeepSeek은 다양한 방법으로 학습 알고리즘을 최적화할 수 있었고, 이를 종합적으로 활용하여 하드웨어의 성능을 극대화할 수 있었습니다.

 

예를 들어 DeepSeek은 HAI-LLM 프레임워크라는 자체 병렬 처리 알고리즘을 처음부터 구축하여 제한된 수의 칩에서 컴퓨팅 워크로드를 최적화했습니다. DeepSeek은 또한 F32보다 덜 정확한 프레임워크인 F8 또는 8비트 데이터 입력 프레임워크를 사용합니다. F8은 "덜 정확"하지만 메모리 사용량을 엄청나게 절약하고 R1의 다른 프로세스도 더 많은 효율적인 계산으로 정밀도 부족을 메울 수 있었습니다. DeepSeek은 또한 부하 분산 네트워킹 커널을 최적화하여 각 H800 클러스터에서 수행하는 작업을 극대화하여 어떤 하드웨어도 데이터를 "기다리지" 않는 일이 없었습니다.

 

 

이것들은 DeepSeek가 더 적은 것으로 더 많은 것을 할 수 있게 한 혁신 중 일부에 불과합니다. 하지만 이 모든 "해킹"을 함께 조합했을 때, 성능이 놀라울 정도로 향상되었습니다.

 

엔비디아에 대한 부정적인 영향은 DeepSeek가 한 것처럼 소프트웨어 수준에서 혁신을 이루면 AI 회사가 하드웨어에 대한 의존도를 낮출 수 있다는 것입니다. 이는 엔비디아의 매출 성장과 마진에 영향을 미칠 수 있습니다.

 

 

파멸론에 대한 반론

R1이 엔비디아에게 아무리 끔찍해 보이더라도, 엔비디아가 "운명적"이라는 주장에는 반론이 몇 가지 있습니다.

 

첫째, 일부 사람들은 중국 스타트업이 비용 추정에서 완전히 솔직하다는 데 회의적입니다. 머신 러닝 연구원인 네이선 램버트에 따르면, 560만 달러의 임대 GPU 시간 수치는 아마도 여러 추가 비용을 고려하지 않은 것입니다. 이러한 추가 비용에는 대규모 모델을 훈련하기 전의 상당한 사전 훈련 시간, GPU를 구매하고 데이터 센터를 구축하는 데 드는 자본 지출 (DeepSeek이 실제로 자체 데이터 센터를 구축하고 클라우드에서 임대하지 않은 경우), 높은 에너지 비용이 포함됩니다. DeepSeek의 엔지니어 급여 문제도 있는데, R1에는 139명의 기술 저자가 있었습니다. DeepSeek은 오픈 소스이기 때문에 이러한 저자가 모두 회사에서 일할 가능성은 없지만 많은 사람이 회사에서 일하고 충분한 급여를 받습니다.

 

램퍼트는 DeepSeek의 연간 운영 비용이 아마도 5억 달러에서 10억 달러 사이에 가까울 것으로 추정합니다. 이는 여전히 미국 경쟁사의 비용보다 훨씬 낮지만, R1 논문에서 제시한 600만 달러보다 훨씬 더 많습니다.

 

DeepSeek이 칩에 대한 접근에 대해 솔직하게 말하고 있는지 의심하는 사람들도 있습니다. 최근 인터뷰에서 Scale AI의 CEO인 Alexandr Wang은 CNBC에 DeepSeek이 2022년 수출 제한에 따라 중국에서 불법이기 때문에 공개하지 않은 50,000개의 H100 클러스터에 접근할 수 있다고 믿는다고 말했습니다.

 

하지만 DeepSeek이 R1 모델에 대한 기술을 공개적으로 공개했기 때문에 연구자들은 제한된 리소스로 그 성공을 모방할 수 있을 것입니다. 지금까지 R1 효율성 혁신은 실제보다 더 현실적으로 보입니다.

 

사실이라 하더라도 엔비디아는 아직 끝나지 않았을 수도 있다

DeepSeek이 인상적인 것은 분명하지만, 전 OpenAI 임원 Miles Brundage는 R1의 데뷔에 대해 너무 많은 것을 읽지 말라고 경고했습니다. Brundage는 OpenAI가 이미 o3 모델을 내놓았고 곧 o5 모델을 내놓을 것이라고 언급했습니다. DeepSeek이 새로운 기술을 사용하여 R1로 해킹할 수 있었지만, 제한된 컴퓨팅 파워로 인해 첫 번째 추론 모델에서 확장하고 발전하는 속도가 느려질 가능성이 높습니다.

 

 

Brundage는 또한 제한된 컴퓨팅 리소스가 이러한 모델이 실제 세계에서 동시에 수행될 수 있는 방식에 영향을 미칠 것이라고 언급했습니다.

 

영어: 지능을 유지하면서 가능한 가장 작은 버전일지라도(이미 정제된 버전) 여전히 여러 실제 응용 프로그램에서 동시에 사용하고 싶을 것입니다. 사이버 기능 개선, 숙제 돕기 또는 암 치료에 사용하고 싶지 않을 것입니다. 이 모든 것을 하고 싶을 것입니다. 이를 위해서는 여러 복사본을 병렬로 실행하여 최상의 솔루션을 선택하기 전에 어려운 문제를 해결하기 위한 수백 또는 수천 번의 시도를 생성해야 합니다. ... 인간-AI ​​비유를 들자면, 아인슈타인이나 존 폰 노이만을 인간의 뇌에 넣을 수 있는 가장 똑똑한 사람으로 생각해 보세요. 그래도 더 많은 사람을 원할 것입니다. 더 많은 복사본을 원할 것입니다. 기본적으로 추론 컴퓨팅 또는 테스트 시간 컴퓨팅은 똑똑한 것을 복사하는 것입니다. 아인슈타인의 시간 한 시간이 1분보다 낫고, AI에도 해당되지 않을 이유가 보이지 않습니다.

 

 

 

제번스의 역설

마지막으로, 투자자들은 제번스 역설을 염두에 두어야 합니다. 영국의 경제학자 윌리엄 스탠리 제번스가 1865년에 석탄 사용에 관해 만들어낸 용어로, 기술적 프로세스가 더 효율적으로 만들어질 때 발생하는 현상입니다. 제번스 역설에 따르면, 자원이 더 효율적으로 사용되면 해당 자원의 사용이 감소하는 것이 아니라 소비가 기하급수적으로 증가합니다. 그러면 증가한 수요는 일반적으로 얻은 효율성을 충분히 상쇄하여 해당 자원에 대한 전반적인 수요 증가로 이어집니다.

 

AI의 경우 고급 모델을 훈련하는 비용이 낮아지면 AI가 일상생활에서 점점 더 많이 사용될 것으로 예상됩니다. 역설에 따르면 실제로 컴퓨팅 파워에 대한 수요가 증가할 것입니다. 하지만 훈련보다는 추론에 대한 수요가 더 많을 것입니다. 이상하게도 엔비디아에 실제로 이로울 수 있습니다. 반면에 AI 추론은 엔비디아의 훈련에 비해 경쟁력이 더 있을 것으로 생각되므로 부정적일 수 있습니다. 하지만 그 부정적 요인은 경쟁이 더 심화되어 발생할 것이지 컴퓨팅 수요가 감소하여 발생할 수는 없습니다.

 

결론은 AI 컴퓨팅에 대한 수요는 앞으로 몇 년 동안 계속해서 크게 증가할 것이라는 것입니다. 결국, 1월 24일, Meta Platforms CEO Mark Zuckerberg는 Meta가 맨해튼만큼 큰 AI 데이터 센터를 건설하고 올해 자본 지출을 600억~650억 달러로 늘릴 것이라고 발표했으며, 이는 2024년 380억~400억 달러에서 증가한 수치입니다.

 

이 발표는 DeepSeek이 출시된 지 4일 후에 나왔으므로 주커버그가 그것을 알지 못했을 리가 없습니다. 하지만 그는 여전히 AI 인프라 지출이 50% 이상 크게 증가하는 것이 타당하다고 생각합니다.

 

의심할 여지 없이 DeepSeek의 등장은 AI 경쟁에 영향을 미칠 것입니다. 하지만 Nvidia와 다른 " Magnificent Seven" 회사 에 "게임 오버"가 되는 대신 , 현실은 더 미묘해질 것입니다.

 

AI 경쟁이 진전됨에 따라 투자자들은 어떤 회사가 진정한 AI "해자"를 가지고 있는지 평가해야 할 것입니다. DeepSeek R1에서 보여준 것처럼 AI 사업 모델이 빠른 속도로 놀라운 방식으로 진화하고 있기 때문입니다.

 

 

China's DeepSeek AI Model Shocks the World: Should You Sell Your Nvidia Stock?

https://www.fool.com/investing/2025/01/27/chinas-deepseek-ai-model-shocks-world-sell-nvidia

 

엔비디아 안무너진다.

https://youtu.be/0W_I7OW-RxY

 

kcontents
그리드형