هوش مصنوعی DeepSeek چیست؟ مدل باز، ارزهای دیجیتال را تکان میدهد
یک اپلیکیشن رایگان از یک استارتاپ کمتر شناختهشده چینی کاری را انجام داد که هیچ سقوط بازار ارزهای دیجیتال تا به حال نتوانسته بود انجام دهد. در یک روز، ۵۸۹ میلیارد دلار از ارزش انویدیا کم شد که بزرگترین ضرر یک روزه برای هر شرکتی در تاریخ بازار سهام ایالات متحده است. و این ماجرا به وال استریت ختم نشد. بیتکوین ۷ درصد سقوط کرد، بیش از ۳۰۰ میلیارد دلار از کل بازار ارزهای دیجیتال از بین رفت و توکنهای موسوم به هوش مصنوعی بیشترین سقوط را داشتند.
این برنامه DeepSeek بود. مدل پشت آن، DeepSeek R1، یک مدل هوش مصنوعی متنباز و ارزان بود که به اندازه کافی خوب بود تا این فرض را که هم صنعت هوش مصنوعی و هم بخش بزرگی از ارزهای دیجیتال را پشتیبانی میکند، به چالش بکشد: اینکه ساخت هوش مصنوعی قوی نیاز به انبوهی از تراشههای گرانقیمت دارد. این راهنما توضیح میدهد که DeepSeek AI در واقع چیست، چگونه با چنین امکانات کمی این همه کار انجام میدهد، چگونه در مقابل ChatGPT قرار میگیرد و چرا لرزهای در توکنهای رمزنگاری هوش مصنوعی ایجاد کرد که هنوز هم احساس میشود.
هوش مصنوعی DeepSeek چیست و چه کسی آن را ساخته است؟
دیپسیک یک آزمایشگاه هوش مصنوعی چینی است، اما در ابتدا چنین نبود. این شرکت از یک صندوق پوشش ریسک رشد کرد و همین پیشینه تقریباً همه چیز را در مورد نحوه تفکر آن توضیح میدهد.
از یک صندوق پوشش ریسک کمی تا یک آزمایشگاه هوش مصنوعی
دیپسیک در ۱۷ جولای ۲۰۲۳ در هانگژو، چین، توسط لیانگ ونفنگ تأسیس شد. لیانگ پیش از این، های-فلایر، یک صندوق پوشش ریسک کمی که با استفاده از یادگیری ماشینی به تجارت در بازارها میپرداخت، را اداره میکرد و برای این منظور، تعداد زیادی پردازنده گرافیکی انویدیا را انبار کرده بود. وقتی این تراشهها مشغول تجارت نبودند، او آنها را به سمت مدلهای زبانی هدایت میکرد. بنابراین دیپسیک حیات خود را با محاسبات ارزان، تیمی از محققان و بدون فشار سرمایهگذار برای دنبال کردن بزرگترین مدل ممکن آغاز کرد. این شرکت با تنها حدود ۱۶۰ کارمند، همچنان چابک ماند و یاد گرفت که از سختافزار، نتایج را استخراج کند. بهرهوری یک خطمشی بازاریابی نبود. این کل فرهنگ بود. نکته طنزآمیزی وجود دارد که شایان ذکر است. های-فلایر این تراشهها را تا حدودی قبل از کنترلهای صادراتی ایالات متحده که بعداً چین را از بهترین پردازندههای گرافیکی انویدیا محروم کرد، انبار کرده بود. مهندسان دیپسیک که مجبور بودند با تراشههای ضعیفتر و کمتر، کار بیشتری انجام دهند، در صرفهجویی بسیار خوب عمل کردند و این محدودیت به مزیت تبدیل شد.
خانواده مدل: V3، R1 و V4
DeepSeek به سرعت عرضه میشود. DeepSeek Coder در اواخر سال ۲۰۲۳، V2 در ماه مه ۲۰۲۴ و DeepSeek V3 که به سرعت در حال پیشرفت بود، در دسامبر ۲۰۲۴ از راه رسیدند. سپس DeepSeek R1 در ۲۰ ژانویه ۲۰۲۵ از راه رسید، مدل استدلالی که جرقه را روشن کرد. تا آوریل ۲۰۲۶، آزمایشگاه DeepSeek V4 را با یک V4-Pro و یک V4-Flash سبکتر پیشنمایش کرده بود و پنجرههای زمینه را به سمت یک میلیون توکن سوق میداد. هر نسخه از همان دستورالعمل پیروی میکرد: تطبیق مرز، شارژ کسری و دادن وزنها.
وزنهای باز، API و deepseek.com
بخش آخر اهمیت دارد. از زمان R1، مدلهای DeepSeek تحت مجوز MIT به عنوان دانلودهای با وزن آزاد در Hugging Face و GitHub منتشر شدهاند. هر کسی میتواند آنها را دریافت کند، بررسی کند، تنظیم دقیق کند یا روی دستگاه خود اجرا کند. همچنین میتوانید از چتبات رایگان در deepseek.com استفاده کنید یا با هزینهای ناچیز به API DeepSeek متصل شوید. وزنهای آزاد به علاوه یک API ارزان، ترکیبی نادر است و موتور محرک این تحول است.

نحوه عملکرد DeepSeek R1 و V3
شهرت DeepSeek بر یک حقیقت ساده و عجیب برای رقبایش استوار است. این سیستم با مدلهای بسیار بزرگتر و بسیار گرانتر برابری میکند، در حالی که محاسبات بسیار کمتری مصرف میکند. نکتهی کلیدی معماری آن است - نه جادو.
ترکیبی از متخصصان و استنتاج کارآمد
DeepSeek V3 دارای ۶۷۱ میلیارد پارامتر است، اما از همه آنها به طور همزمان استفاده نمیکند. این یک مدل ترکیبی از متخصصان است، بنابراین برای هر توکن مشخص، فقط حدود ۳۷ میلیارد پارامتر را فعال میکند، که تعداد انگشتشماری از "متخصصان" مربوط به وظیفه هستند. آزمایشگاه این مدل را با توجه نهفته چند سره، روشی که حافظه را در طول استنتاج فشرده میکند، جفت کرد. نتیجه، یک مدل غولپیکر است که مانند یک مدل کوچک اجرا میشود. حافظه کمتر، قدرت کمتر، هزینه کمتر برای هر پاسخ. برای رقیبی که میلیاردها دلار خرج کرده و فرض میکند که بزرگتر بودن همیشه به معنای گرانتر بودن است، این یک اثبات مفهوم نامطلوب است.
R1، استدلال و زنجیره فکری
DeepSeek R1 یک ترفند دوم هم اضافه کرد: با صدای بلند فکر میکند. مانند مدل o1 شرکت OpenAI، این مدل نیز یک مدل استدلالی است که قبل از پاسخ دادن، گام به گام با استفاده از زنجیره تفکر، مسائل را حل میکند. به همین دلیل است که در کارهای سخت امتیاز بسیار خوبی کسب میکند. R1 در معیار MATH-500 به 97.3 درصد و در AIME 2024 به 79.8 درصد رسید و 49.2 درصد از مسائل واقعی GitHub را در SWE-bench حل کرد و در آن زمان، شانه به شانه بهترینهای OpenAI قرار گرفت.
ادعای هزینه آموزش ۵.۶ میلیون دلاری، افشا شد
این عددی است که اینترنت را تکان داد. مقاله خود DeepSeek اعلام کرد که اجرای نهایی آموزش برای V3 حدود ۵.۵۸ میلیون دلار در زمان GPU هزینه داشته است. در مقایسه با ۱۰۰ میلیون دلاری که به طور گسترده برای GPT-4 ذکر شده است، این رقم تحقیرآمیز به نظر میرسید. اما به جزئیات توجه کنید. این رقم فقط اجرای نهایی را شامل میشود، نه تحقیقات، آزمایشهای ناموفق یا خود تراشهها. تحلیلگران SemiAnalysis تخمین زدند که هزینه واقعی سختافزار DeepSeek بسیار بالاتر از ۵۰۰ میلیون دلار بوده است. این تیتر همزمان دقیق و گمراهکننده بود، و دقیقاً به همین دلیل است که تا این حد پیشرفت کرده است.
| مدل جستجوی عمیق | منتشر شد | نوع | یادداشتها |
|---|---|---|---|
| دیپ سیک نسخه ۳ | دسامبر ۲۰۲۴ | وزارت آموزش و پرورش LLM | پارامترهای ۶۷۱B، ۳۷B فعال، MIT |
| جستجوی عمیق R1 | ژانویه ۲۰۲۵ | استدلال | وزن آزاد، رقیب OpenAI o1 |
| دیپ سیک نسخه ۴ | آوریل ۲۰۲۶ | خانواده وزارت آموزش و پرورش | V4-Pro و V4-Flash، تقریباً ۱ میلیون متن |
هوش مصنوعی DeepSeek در مقایسه با ChatGPT، Claude و Gemini
بنابراین آیا DeepSeek از ChatGPT بهتر است؟ بستگی به نیاز شما دارد. در ریاضیات، کدنویسی و استدلال خام، با مدلهای برتر OpenAI و Anthropic رقابت میکند. جایی که کم میآورد، ورودی چندوجهی و اعتماد است. مدلهای پرچمدار DeepSeek عمدتاً فقط متن هستند، در حالی که ChatGPT تصاویر، صدا و ویدیو را مدیریت میکند. نثر OpenAI هنوز برای نوشتن روزمره روانتر است. Gemini گوگل در این بین قرار دارد، در چندوجهی و جستجو قوی و در دسترسی آزاد ضعیفتر است. و برای بسیاری از کسبوکارهای غربی، عامل تعیینکننده اصلاً معیار نیست، بلکه اعتماد است: مدلی که در چین آموزش دیده و میزبانی شده است، بار و بندی را به دوش میکشد که مدل میزبانی شده در ایالات متحده ندارد.
سپس قیمت وجود دارد، جایی که شکاف نزدیک نیست. جدول زیر داستان را روایت میکند و به همین دلیل است که توسعهدهندگان همچنان بارهای کاری خود را به API DeepSeek منتقل میکنند.
| مدل | ورودی / ۱ میلیون توکن | وزنههای آزاد | چندوجهی |
|---|---|---|---|
| جستجوی عمیق نسخه ۳.۲ | حدود ۰.۲۸ دلار | بله (دانشگاه ام آی تی) | خیر |
| GPT-5.2 (اوپنایآی) | ۱.۷۵ دلار | خیر | بله |
| کلود (انسانگرا) | سطح ممتاز | خیر | بله |
برای متن و کد در مقیاس بزرگ، DeepSeek تقریباً شش برابر ارزانتر از GPT-5.2 ورودی میگیرد و از آنجا که وزنها باز هستند، میتوانید API را به طور کامل نادیده بگیرید و آن را از طریق استقرار محلی اجرا کنید. این امر DeepSeek را به گزینهای فوقالعاده مقرون به صرفه تبدیل میکند و پاسخ به آن برای یک آزمایشگاه بسته دشوار است.
لحظهای که DeepSeek دنیای کریپتو را تکان داد
مارک اندریسن آن را «لحظه اسپوتنیک هوش مصنوعی» نامید. او درباره غرور ملی صحبت میکرد، اما بازارها حرفهای سردتری شنیدند - شاید ارزشمندترین چیز در هوش مصنوعی، اصلاً انبوهی از تراشهها نباشد.
۵۸۹ میلیارد دلار در یک روز از دست رفت
وقتی DeepSeek در ۲۷ ژانویه ۲۰۲۵ با ۱۶ میلیون دانلود در ۱۸ روز اول خود، در صدر فروشگاه اپ استور ایالات متحده قرار گرفت، معاملهگران محاسبات را برعکس انجام دادند. اگر یک آزمایشگاه چینی میتوانست با کسری از سختافزار به مرز [سرعت دانلود] برسد، تقاضای آینده برای تراشههای انویدیا ناگهان متزلزل به نظر میرسید. انویدیا در آن روز حدود ۱۷ درصد سقوط کرد و ۵۸۹ میلیارد دلار از ارزش بازار خود را از دست داد، بزرگترین سقوط یک روزه در تاریخ ایالات متحده. کل نزدک [شاخص بورس نزدک] دچار سرما شد.
چرا توکنهای رمزنگاری هوش مصنوعی بیشترین کاهش را داشتند؟
ارزهای دیجیتال نیز از این وضعیت در امان نماندند. بیتکوین تقریباً ۷ درصد کاهش یافت و به حدود ۹۷۷۵۰ دلار رسید و بیش از ۳۰۰ میلیارد دلار از کل بازار ارزهای دیجیتال خارج شد. اما فاجعه واقعی در توکنهای هوش مصنوعی بود. این دسته در آن روز حدود ۹ درصد کاهش یافت، در حالی که بازار گسترده تقریباً ۵ درصد کاهش یافته بود، به طوری که Render 12.6 درصد و Fetch.ai حدود ۱۰ درصد کاهش یافتند. دلیل آن ناخوشایند است. بسیاری از ارزش توکنهای هوش مصنوعی بر اساس همان داستان Nvidia بود: هوش مصنوعی تشنه محاسبات است، محاسبات کمیاب است، بنابراین هر چیزی که محاسبات یا GPU بفروشد، ارزشمند است. DeepSeek در این داستان خللی ایجاد کرد و توکنهایی که بیشترین تکیه را به آن داشتند، بیشترین ضرر را متحمل شدند. خود این افت قیمت دوام نیاورد؛ در عرض چند روز بیتکوین بیشتر ضررهای خود را جبران کرد، زیرا تحلیلگران این وحشت را واکنش بیش از حد نامیدند. اما بخش توکنهای هوش مصنوعی مدت زمان بیشتری متزلزل ماند، نشانهای از اینکه بازار در حال تغییر قیمت کل روایت بود، نه فقط گذراندن یک بعد از ظهر بد.
توکنهای رمزنگاری هوش مصنوعی پس از DeepSeek
نکته اینجاست. همان شوکی که توکنهای هوش مصنوعی را از پا درآورد، بحث بلندمدتتری را نیز برایشان به ارمغان آورد. اگر مدلهای پیشرو بتوانند ارزان و باز باشند، آنگاه خندقهای آزمایشگاههای بزرگ بسته کوچک میشوند و زیرساختهای باز و مقاوم در برابر سانسور هوش مصنوعی شروع به ارزشمندتر شدن میکنند، نه کمتر. شبکههای محاسباتی غیرمتمرکز مانند Akash ، شبکههای رندرینگ مانند Render و بازارهای هوش ماشینی مانند Bittensor، همگی جهانی را ترسیم میکنند که در آن هوش مصنوعی در محدوده سه شرکت آمریکایی محصور نشده است. DeepSeek باعث شد که این جهان نزدیکتر به نظر برسد. Bittensor، که توکن TAO آن به شبکهای از مدلهای یادگیری ماشینی رقیب پاداش میدهد، واضحترین شرطبندی روی این ایده است: بازاری برای هوش باز به جای یک مغز شرکتی. اینکه آیا این شبکهها واقعاً میتوانند هوش مصنوعی در سطح پیشرو ارائه دهند، هنوز اثبات نشده است، اما DeepSeek بار تردید را به دوش آزمایشگاههای بسته انداخت.
بازار متوجه شد. تا ماه مه ۲۰۲۵، گریاسکیل یک بخش اختصاصی هوش مصنوعی کریپتو را با پوشش ۲۰ توکن به ارزش مجموع حدود ۲۱ میلیارد دلار رسماً راهاندازی کرده بود که تقریباً ۴.۷ برابر بیشتر از ۴.۵ میلیارد دلار در اوایل سال ۲۰۲۳ است. فقط مراقب باشید. این عرضه، کلاهبرداران را نیز به خود جلب کرد: در یک روز، بیش از ۷۵ میمکوین جعلی «دیپسیک» ظاهر شد و معاملهگرانی که آنها را تعقیب میکردند بیش از ۱۰۰ میلیون دلار ضرر کردند. دیپسیک هرگز توکنی راهاندازی نکرد. هر ادعایی غیر از این، یک تله است.

آیا استفاده از هوش مصنوعی DeepSeek بیخطر است؟ ممنوعیتها و حریم خصوصی
اینجاست که احتیاط لازم است. از برنامه یا وبسایت رسمی DeepSeek استفاده کنید و دادههای شما، از جمله درخواستهایتان، به سرورهایی در چین منتقل میشوند و تحت یک سیاست حفظ حریم خصوصی تحت قانون چین مدیریت میشوند. چندین دولت تصمیم گرفتند که این یک مشکل است. ایتالیا در 30 ژانویه 2025 به دلیل حفاظت از دادهها، DeepSeek را مسدود کرد. بیش از دوازده ایالت ایالات متحده آن را از دستگاههای رسمی تا اوایل سال 2025 ممنوع کردند و کنگره قانون عدم استفاده از DeepSeek در دستگاههای دولتی را معرفی کرد. این مدل همچنین منعکس کننده قوانین محتوای چینی است و موضوعات حساس سیاسی را طفره میرود یا آنها را بهداشتی میکند. روشهای DeepSeek نیز مورد انتقاد قرار گرفته است. در اوایل 2026، Anthropic آزمایشگاه را به استفاده از هزاران حساب جعلی برای جمعآوری میلیونها مکالمه کلود برای آموزش متهم کرد، اتهامی که DeepSeek آن را رد میکند. داستان نبوغ مقتصدانه یک جنبه مورد مناقشه دارد.
هیچکدام از این موارد، خودِ فناوری را برای اجرا ناامن نمیکند. از آنجا که وزنها باز هستند، یک کاربر یا شرکتِ آگاه به حریم خصوصی میتواند مدل را دانلود کرده و آن را بهصورت محلی اجرا کند، بدون اینکه هیچ دادهای از ساختمان خارج شود. برنامهی میزبانیشده، ریسک است. مدل باز، دریچهی فرار است.
نحوه استفاده از هوش مصنوعی DeepSeek: استقرار محلی
شما سه راه دارید. سادهترین راه، چتبات رایگان در deepseek.com یا اپلیکیشن موبایل است که برای سوالات معمولی در صورتی که بحث حریم خصوصی برایتان مهم نباشد، مناسب است. راه دوم، رابط برنامهنویسی کاربردی DeepSeek است که به اندازه کافی ارزان است و توسعهدهندگان میتوانند حجم کاری سنگین را از طریق آن انجام دهند؛ مستندات رابط برنامهنویسی کاربردی DeepSeek شما را در مراحل راهاندازی راهنمایی میکند و DeepSeek Coder برای برنامهنویسی تنظیم شده است. راه سوم و امنترین راه برای کارهای حساس، استقرار محلی است: وزنههای باز را از Hugging Face بردارید یا یک نسخه کوچکتر را از طریق ابزاری مانند Ollama روی سختافزار خودتان اجرا کنید. همان مدل، بدون هیچ گونه افشای دادهها. برای سوالات معمولی، اپلیکیشن رایگان کافی است؛ برای هر کسی که با دادههای خصوصی یا تنظیمشده سروکار دارد، مسیر محلی ارزش راهاندازی اضافی را دارد.
معنای DeepSeek برای هوش مصنوعی و رمزنگاری
درس ماندگار DeepSeek ارتباط چندانی با پیروزی چین در این دور از رقابت ندارد. تغییر واقعی این است که هوش مصنوعی پیشرو، ارزانتر و سریعتر از هر کسی که قیمتگذاری کند، در دسترس قرار گرفت. برای کاربران عادی، این به معنای ابزارهای بهتر با هزینه کمتر است. برای آزمایشگاههای بسته، به این معنی است که خندق GPU نازکتر از آن چیزی است که ارزیابیهای آنها فرض میکند. و برای ارزهای دیجیتال، این دو طرف را تحت تأثیر قرار میدهد: توکنهای هوش مصنوعی که بر اساس داستان کمبود ساخته شدهاند، ضربه خوردند، در حالی که آنهایی که زیرساختهای هوش مصنوعی باز و غیرمتمرکز را میسازند، دلیل جدیدی برای وجود داشتن پیدا کردند. بنابراین سوال واقعی این نیست که آیا DeepSeek خوب است یا خیر. واضح است که هست. سوال این است که وقتی هوش دیگر گران نباشد، چه کسی هنوز حقوق میگیرد.