DeepSeek AI란 무엇일까요? 암호화폐 업계를 뒤흔드는 오픈 모델

에 게시됨 Jun 20, 2026 작성자 Mathis Curcio

잘 알려지지 않은 중국 스타트업이 개발한 무료 앱 하나가 그 어떤 암호화폐 폭락 사태도 해내지 못했던 일을 해냈습니다. 단 하루 만에 엔비디아 의 시가총액이 5,890억 달러나 증발한 것입니다. 이는 미국 증시 역사상 기업이 하루 만에 잃은 최대 규모입니다. 그리고 그 여파는 월가에만 그치지 않았습니다. 비트코인은 7% 하락했고, 전체 암호화폐 시장에서 3,000억 달러 이상이 증발했으며, 이른바 AI 관련 토큰들이 가장 큰 폭으로 떨어졌습니다.

그 앱은 딥시크(DeepSeek)였습니다. 딥시크 R1이라는 모델은 저렴하면서도 성능이 뛰어난 오픈 소스 AI 모델로, AI 시장과 암호화폐 시장을 지탱해 온 "강력한 인공지능을 구축하려면 엄청난 양의 고가 칩이 필요하다"는 통념을 뒤흔들었습니다. 이 가이드에서는 딥시크 AI가 무엇인지, 어떻게 적은 자원으로 그토록 많은 것을 해낼 수 있는지, 챗GPT(ChatGPT)와 어떻게 비교되는지, 그리고 딥시크 AI가 AI 암호화폐 시장에 어떤 파장을 일으켰고 그 여파가 아직도 이어지고 있는 이유를 설명합니다.

DeepSeek AI는 무엇이며 누가 만들었습니까?

딥시크는 중국의 인공지능 연구소이지만, 처음부터 연구소였던 것은 아닙니다. 헤지펀드에서 시작된 회사이며, 이러한 배경이 딥시크의 사고방식을 거의 완벽하게 설명해 줍니다.

양적 헤지 펀드에서 AI 연구소로

딥시크는 2023년 7월 17일 중국 항저우에서 량원펑에 의해 설립되었습니다. 량은 이미 머신러닝을 활용한 시장 거래를 하는 양적 헤지펀드인 하이플라이어를 운영하고 있었고, 이를 위해 대규모 엔비디아 GPU 클러스터를 확보해 놓은 상태였습니다. 그는 이 칩들이 거래에 사용되지 않을 때는 언어 모델 개발에 활용했습니다. 이렇게 딥시크는 저렴한 컴퓨팅 자원과 연구팀, 그리고 투자자들의 압박 없이 최대한 큰 모델을 만들 필요 없이 시작할 수 있었습니다. 약 160명의 직원으로 구성된 소규모 조직을 유지하면서 하드웨어에서 최대한의 성능을 끌어내는 방법을 터득했습니다. 효율성은 단순한 마케팅 슬로건이 아니라 딥시크의 기업 문화 그 자체였습니다. 여기서 주목할 만한 아이러니가 있습니다. 하이플라이어가 이러한 칩들을 확보해 둔 것은 부분적으로는 미국의 수출 통제 조치에 대비하기 위한 것이었고, 이 조치로 인해 중국은 엔비디아의 최고급 GPU를 공급받지 못하게 되었습니다. 성능이 떨어지는 적은 수의 칩으로 더 많은 작업을 해야 했던 딥시크의 엔지니어들은 비용 절감에 매우 능숙해졌고, 이러한 제약이 오히려 강점으로 작용했습니다.

모델 제품군: V3, R1, V4

DeepSeek은 빠른 속도로 제품을 출시했습니다. DeepSeek Coder는 2023년 말에, V2는 2024년 5월에, 그리고 획기적인 DeepSeek V3는 2024년 12월에 출시되었습니다. 이어서 2025년 1월 20일에는 DeepSeek R1이 출시되어 혁신의 불씨를 지폈습니다. 2026년 4월에는 DeepSeek V4의 프리뷰 버전이 공개되었는데, V4-Pro와 더 가벼운 V4-Flash 버전이 포함되어 컨텍스트 윈도우를 백만 토큰에 가깝게 확장했습니다. 각 릴리스는 동일한 전략을 따랐습니다. 최첨단 기술을 따라잡고, 저렴한 가격으로 제공하며, 가중치는 무료로 제공하는 것입니다.

오픈 웨이트, API 및 deepseek.com

마지막 부분이 중요합니다. R1 버전부터 DeepSeek의 모델은 관대한 MIT 라이선스 하에 Hugging Face와 GitHub에서 오픈 웨이트 다운로드 형태로 제공되어 왔습니다. 누구든 모델을 다운로드하여 검토하고, 미세 조정하거나, 자신의 컴퓨터에서 실행할 수 있습니다. 또한 deepseek.com에서 챗봇을 무료로 사용하거나, 저렴한 비용으로 DeepSeek API를 이용할 수도 있습니다. 오픈 웨이트와 저렴한 API는 흔치 않은 조합이며, 바로 이것이 혁신의 원동력입니다.

딥시크-아이

DeepSeek R1 및 V3의 실제 작동 방식

DeepSeek의 명성은 경쟁사들에게는 다소 불편하게 느껴질 수 있는 단순한 사실에 기반합니다. 훨씬 더 크고 비싼 모델과 유사한 성능을 보이면서도 컴퓨팅 자원은 훨씬 적게 소모한다는 점입니다. 그 비결은 마법이 아니라 아키텍처에 있습니다.

전문가 혼합 모델과 효율적인 추론

DeepSeek V3는 6710억 개의 파라미터를 가지고 있지만, 이를 모두 동시에 사용하지는 않습니다. 이는 혼합형 전문가 모델이기 때문에, 주어진 토큰에 대해 약 370억 개의 파라미터, 즉 해당 작업과 관련된 소수의 "전문가" 파라미터만 활성화합니다. 연구소는 여기에 추론 과정에서 메모리를 압축하는 멀티헤드 잠재 어텐션 기법을 결합했습니다. 그 결과, 거대한 모델이 작은 모델처럼 작동하는 것을 구현했습니다. 메모리 사용량과 전력 소모가 줄어들고, 답변당 비용도 낮아졌습니다. 더 큰 모델이 항상 더 비싸다는 가정하에 수십억 달러를 투자해 온 경쟁사에게는 반갑지 않은 결과일 것입니다.

R1, 추론, 그리고 사고의 연쇄

DeepSeek R1은 두 번째 비결을 추가했습니다. 바로 생각하는 과정을 소리 내어 말하는 것입니다. OpenAI의 o1처럼, R1은 추론 모델로서 문제를 단계별로 해결해 나가며 사고의 연쇄 과정을 거쳐 답을 내놓습니다. 이것이 바로 어려운 작업에서 뛰어난 성능을 보이는 이유입니다. R1은 MATH-500 벤치마크에서 97.3%, AIME 2024에서 79.8%의 정확도를 기록했고, SWE-bench 에서는 실제 GitHub 이슈의 49.2%를 해결하여 당시 OpenAI의 최고 성능 모델들과 어깨를 나란히 했습니다.

560만 달러 규모의 교육비 청구 내역 분석

인터넷을 뜨겁게 달군 숫자가 바로 이것입니다. 딥시크(DeepSeek)의 자체 보고서에 따르면 V3의 최종 학습 과정에 소요된 GPU 비용은 약 558만 달러였습니다. GPT-4에 투입된 1억 달러라는 막대한 비용과 비교하면 초라해 보였습니다. 하지만 자세히 살펴보면, 이 수치는 최종 학습 과정 비용만을 포함하고 있으며, 연구 과정, 실패한 실험, 그리고 칩 자체에 대한 비용은 전혀 들어 있지 않습니다. 세미애널리시스(SemiAnalysis)의 분석가들은 딥시크의 실제 하드웨어 투자액이 5억 달러를 훨씬 넘을 것으로 추정했습니다. 이 기사는 정확하면서도 동시에 오해의 소지가 있었는데, 바로 그 점 때문에 큰 파장을 일으켰습니다.

DeepSeek 모델	출시된	유형	메모
딥시크 V3	2024년 12월	MoE LLM	671B 파라미터, 37B 활성, MIT
딥시크 R1	2025년 1월	추리	오픈웨이트, OpenAI o1과 경쟁
딥시크 V4	2026년 4월	교육부 가족	V4-Pro 및 V4-Flash, ~1M 컨텍스트

DeepSeek AI와 ChatGPT, Claude, Gemini 비교

그렇다면 DeepSeek이 ChatGPT보다 더 나을까요? 필요한 기능에 따라 다릅니다. 수학, 코딩, 그리고 순수 추론 능력 면에서는 OpenAI와 Anthropic의 최고 모델들과 어깨를 나란히 합니다. 하지만 완성도, 멀티모달 입력, 그리고 신뢰도 면에서는 DeepSeek이 부족합니다. DeepSeek의 주력 모델은 대부분 텍스트 전용인 반면, ChatGPT는 이미지, 음성, 비디오까지 처리합니다. OpenAI의 텍스트는 일상적인 글쓰기에 더 자연스럽게 읽힙니다. Google의 Gemini는 그 중간에 위치하며, 멀티모달 입력과 검색 기능은 뛰어나지만 오픈 액세스 측면에서는 다소 부족합니다. 그리고 많은 서구 기업들에게 결정적인 요소는 벤치마크 결과가 아니라 신뢰도입니다. 중국에서 학습 및 호스팅된 모델은 미국에서 호스팅된 모델에 비해 신뢰도에 대한 부담을 안고 있을 수 있기 때문입니다.

그다음은 가격 문제인데, 이 부분에서는 격차가 좁혀지지 않습니다. 아래 표가 이를 잘 보여주며, 개발자들이 계속해서 워크로드를 DeepSeek API로 이전하는 이유이기도 합니다.

모델	입력 / 100만 토큰	오픈 웨이트	멀티모달
딥시크 V3.2	약 0.28달러	예 (MIT)	아니요
GPT-5.2 (OpenAI)	약 1.75달러	아니요	예
클로드 (인류학)	프리미엄 등급	아니요	예

대규모 텍스트 및 코드 처리에 있어 DeepSeek는 GPT-5.2보다 입력 비용이 약 6배 저렴하며, 가중치가 공개되어 있어 API를 사용하지 않고도 로컬 환경에서 바로 실행할 수 있습니다. 따라서 DeepSeek는 매우 비용 효율적인 옵션이며, 폐쇄적인 연구실 환경에서는 그 차이를 입증하기 어렵습니다.

암호화폐 시장을 뒤흔든 딥시크의 순간

마크 앤드리슨은 이를 "AI의 스푸트니크 순간"이라고 불렀습니다. 그는 국가적 자부심을 이야기했지만, 시장은 좀 더 차가운 의미를 받아들였습니다. 어쩌면 AI에서 가장 가치 있는 것은 단순히 칩 재고가 아닐지도 모른다는 것입니다.

하루 만에 5,890억 달러가 사라졌습니다.

2025년 1월 27일, 딥시크(DeepSeek)가 출시 18일 만에 1,600만 다운로드를 기록하며 미국 앱스토어 1위에 오르자, 투자자들은 역으로 계산했습니다. 중국 연구소가 훨씬 저렴한 하드웨어로 최첨단 기술을 구현할 수 있다면, 엔비디아 칩에 대한 미래 수요는 갑자기 불안정해 보인다고 판단한 것입니다. 엔비디아 주가는 그날 약 17% 폭락하며 시가총액이 5,890억 달러 나 감소했는데, 이는 미국 증시 역사상 하루 만에 최대 규모로 떨어진 수치였습니다. 나스닥 지수 전체가 충격에 휩싸였습니다.

AI 암호화폐 토큰이 가장 크게 하락한 이유는 무엇일까요?

암호화폐 시장도 예외는 아니었습니다. 비트코인은 약 7% 하락하여 97,750달러 선까지 떨어졌고, 전체 암호화폐 시장에서 3,000억 달러 이상이 유출되었습니다. 하지만 진정한 타격은 AI 토큰에서 나타났습니다. AI 토큰 시장은 하루 만에 약 9% 하락했는데, 이는 전체 시장의 약 5% 하락폭보다 훨씬 큰 수치입니다. 특히 Render는 12.6%, Fetch.ai는 약 10% 하락했습니다. 이러한 하락세의 원인은 다소 불편합니다. 많은 AI 토큰들이 엔비디아와 같은 논리에 기반을 두고 있었기 때문입니다. 즉, AI는 연산 능력을 많이 요구하는데, 연산 능력은 부족하므로 연산 능력이나 GPU를 판매하는 모든 토큰은 가치가 높다는 것이었습니다. 하지만 DeepSeek 사태는 이러한 논리에 허점을 드러냈고, 이에 가장 크게 의존했던 토큰들이 가장 큰 타격을 입었습니다. 이러한 하락세는 오래가지 않았습니다. 분석가들은 이번 사태를 과잉 반응이라고 평가하며 비트코인이 며칠 만에 대부분의 손실을 만회했습니다. 그러나 AI 토큰 시장은 훨씬 더 오랫동안 불안정한 모습을 보였는데, 이는 시장이 단순히 일시적인 부진이 아니라 전체적인 상황을 재평가하고 있음을 시사합니다.

DeepSeek 이후 AI 암호화 토큰

여기서 반전이 있습니다. AI 토큰에 큰 충격을 준 바로 그 충격이 오히려 장기적인 관점에서 AI 토큰의 가치를 높이는 계기가 되었습니다. 최첨단 모델이 저렴하고 개방적일 수 있다면, 대형 폐쇄형 연구소의 장벽은 무너지고, 검열에 강한 개방형 AI 인프라의 가치는 더욱 높아지게 됩니다. 아카시(Akash) 와 같은 분산 컴퓨팅 네트워크, 렌더(Render)와 같은 렌더링 네트워크, 그리고 비텐서(Bittensor)와 같은 머신 인텔리전스 시장은 AI가 세 개의 미국 기업에 갇혀 있지 않은 세상을 제시합니다. 딥시크(DeepSeek)는 이러한 세상을 더욱 현실로 만들었습니다. 경쟁하는 머신러닝 모델 네트워크에 보상을 제공하는 TAO 토큰을 발행하는 비텐서는, 하나의 기업 두뇌가 아닌 개방형 인텔리전스를 위한 시장을 구축하려는 가장 확실한 시도입니다. 이러한 네트워크가 실제로 최첨단 수준의 AI를 구현할 수 있을지는 아직 입증되지 않았지만, 딥시크는 이러한 의혹의 부담을 폐쇄형 연구소로 돌렸습니다.

시장은 이를 알아챘습니다. 2025년 5월까지 그레이스케일은 20개의 토큰으로 구성된 약 210억 달러 규모의 AI 암호화폐 섹터를 공식화했는데, 이는 2023년 초 45억 달러에서 약 4.7배 증가한 수치입니다. 하지만 주의해야 할 점도 있습니다. 출시 당시 사기꾼들도 나타났습니다. 단 하루 만에 75개 이상의 가짜 "딥시크(DeepSeek)" 밈코인이 등장했고, 이를 노린 투자자들은 1억 달러 이상의 손실을 입었습니다. 딥시크는 실제로 토큰을 출시한 적이 없습니다. 이와 다르게 주장하는 것은 모두 함정입니다.

딥시크-아이

DeepSeek AI는 안전하게 사용할 수 있나요? 제재 및 개인정보 보호 관련 사항

바로 이런 점에서 신중함이 중요합니다. DeepSeek 공식 앱이나 웹사이트를 사용하면 사용자의 데이터(입력 내용 포함)가 중국 서버로 전송되어 중국 법률의 적용을 받는 개인정보 보호 정책에 따라 처리됩니다. 여러 정부 기관은 이를 문제 삼았습니다. 이탈리아는 데이터 보호를 이유로 2025년 1월 30일에 DeepSeek 접속을 차단했습니다. 미국에서도 12개 이상의 주에서 2025년 초까지 공무 기기에서 DeepSeek 사용을 금지했으며, 의회는 '정부 기기에서 DeepSeek 사용 금지 법안'을 발의했습니다. 이러한 방식은 중국의 콘텐츠 규정을 반영하여 정치적으로 민감한 주제를 회피하거나 순화하는 경향도 보입니다. DeepSeek의 방법론 또한 비판을 받아왔습니다. 2000년 초, 앤트로픽 스튜디오는 DeepSeek이 수천 개의 가짜 계정을 이용해 수백만 건의 클로드 대화 데이터를 수집해 학습에 활용했다고 비난했으며, DeepSeek은 이를 부인했습니다. 이처럼 검소한 천재 기업이라는 DeepSeek의 이야기는 논란의 여지가 있습니다.

그렇다고 해서 기술 자체가 안전하지 않다는 의미는 아닙니다. 가중치가 공개되어 있기 때문에 개인 정보 보호에 민감한 사용자나 기업은 모델을 다운로드하여 로컬에서 실행할 수 있으며, 데이터가 외부로 유출될 염려가 없습니다. 위험 요소는 호스팅된 앱에 있으며, 개방형 모델은 이러한 위험을 방지하는 탈출구 역할을 합니다.

DeepSeek AI 사용 방법: 로컬 배포

딥시크(DeepSeek)에 접근하는 방법은 세 가지입니다. 가장 쉬운 방법은 deepseek.com에서 제공하는 무료 챗봇이나 모바일 앱을 이용하는 것입니다. 개인정보 보호에 대한 고려가 없다면 간단한 질문에는 적합합니다. 두 번째는 딥시크 API를 사용하는 것입니다. 비용이 저렴하여 개발자들이 대용량 워크로드를 처리하는 데 활용할 수 있습니다. 딥시크 API 문서에서 설정 방법을 자세히 안내하고 있으며, 딥시크 코더(DeepSeek Coder)는 프로그래밍에 최적화되어 있습니다. 세 번째이자 가장 안전한 방법은 로컬 배포입니다. 허깅페이스(Hugging Face)에서 공개된 가중치를 가져오거나, 올라마(Ollama)와 같은 도구를 사용하여 자체 하드웨어에서 소규모 버전을 실행할 수 있습니다. 동일한 모델을 사용하면서도 데이터 노출을 최소화할 수 있습니다. 간단한 질문에는 무료 앱으로도 충분하지만, 개인 정보나 규제 대상 데이터를 다루는 경우에는 로컬 배포를 통해 설정하는 것이 좋습니다.

DeepSeek이 AI와 암호화폐에 미치는 영향은 무엇일까요?

딥시크의 사례가 주는 진정한 교훈은 중국이 한 라운드에서 승리했다는 사실과는 거의 관련이 없습니다. 진정한 변화는 최첨단 AI 기술이 예상보다 훨씬 빠르게 저렴해지고 개방되었다는 점입니다. 일반 사용자에게는 더 나은 도구를 더 저렴한 가격으로 이용할 수 있다는 의미입니다. 폐쇄적인 연구소들에게는 GPU를 둘러싼 경쟁 장벽이 그들의 기업 가치 평가보다 훨씬 약해졌다는 것을 의미합니다. 암호화폐 시장에는 양면성이 존재합니다. 희소성을 기반으로 구축된 AI 토큰은 타격을 입은 반면, 개방적이고 분산된 AI 인프라를 구축하는 토큰은 새로운 존재 이유를 얻게 되었습니다. 따라서 진정한 질문은 딥시크가 훌륭한 기술인지 아닌지가 아닙니다. 딥시크는 분명 훌륭한 기술입니다. 진짜 질문은 지능이 더 이상 비싸지 않게 되었을 때 누가 여전히 수익을 얻을 것인가입니다.

Mathis Curcio

Mathis Curcio is a senior content strategist and NFT specialist at Plisio. With over 5 years of experience in the Web3 space, Mathis focuses on the evolution of NFT ecosystems, digital collectibles, and decentralized ownership models. He creates accessible, insight-driven content that bridges the gap between blockchain innovation and mainstream adoption. His expertise spans NFT market trends, use cases across art and gaming, and the infrastructure powering next-generation tokenized assets.