هوش مصنوعی DeepSeek چیست؟ مدل باز، ارزهای دیجیتال را تکان می‌دهد

هوش مصنوعی DeepSeek چیست؟ مدل باز، ارزهای دیجیتال را تکان می‌دهد

یک اپلیکیشن رایگان از یک استارتاپ کمتر شناخته‌شده چینی کاری را انجام داد که هیچ سقوط بازار ارزهای دیجیتال تا به حال نتوانسته بود انجام دهد. در یک روز، ۵۸۹ میلیارد دلار از ارزش انویدیا کم شد که بزرگترین ضرر یک روزه برای هر شرکتی در تاریخ بازار سهام ایالات متحده است. و این ماجرا به وال استریت ختم نشد. بیت‌کوین ۷ درصد سقوط کرد، بیش از ۳۰۰ میلیارد دلار از کل بازار ارزهای دیجیتال از بین رفت و توکن‌های موسوم به هوش مصنوعی بیشترین سقوط را داشتند.

این برنامه DeepSeek بود. مدل پشت آن، DeepSeek R1، یک مدل هوش مصنوعی متن‌باز و ارزان بود که به اندازه کافی خوب بود تا این فرض را که هم صنعت هوش مصنوعی و هم بخش بزرگی از ارزهای دیجیتال را پشتیبانی می‌کند، به چالش بکشد: اینکه ساخت هوش مصنوعی قوی نیاز به انبوهی از تراشه‌های گران‌قیمت دارد. این راهنما توضیح می‌دهد که DeepSeek AI در واقع چیست، چگونه با چنین امکانات کمی این همه کار انجام می‌دهد، چگونه در مقابل ChatGPT قرار می‌گیرد و چرا لرزه‌ای در توکن‌های رمزنگاری هوش مصنوعی ایجاد کرد که هنوز هم احساس می‌شود.

هوش مصنوعی DeepSeek چیست و چه کسی آن را ساخته است؟

دیپ‌سیک یک آزمایشگاه هوش مصنوعی چینی است، اما در ابتدا چنین نبود. این شرکت از یک صندوق پوشش ریسک رشد کرد و همین پیشینه تقریباً همه چیز را در مورد نحوه تفکر آن توضیح می‌دهد.

از یک صندوق پوشش ریسک کمی تا یک آزمایشگاه هوش مصنوعی

دیپ‌سیک در ۱۷ جولای ۲۰۲۳ در هانگژو، چین، توسط لیانگ ونفنگ تأسیس شد. لیانگ پیش از این، های-فلایر، یک صندوق پوشش ریسک کمی که با استفاده از یادگیری ماشینی به تجارت در بازارها می‌پرداخت، را اداره می‌کرد و برای این منظور، تعداد زیادی پردازنده گرافیکی انویدیا را انبار کرده بود. وقتی این تراشه‌ها مشغول تجارت نبودند، او آنها را به سمت مدل‌های زبانی هدایت می‌کرد. بنابراین دیپ‌سیک حیات خود را با محاسبات ارزان، تیمی از محققان و بدون فشار سرمایه‌گذار برای دنبال کردن بزرگترین مدل ممکن آغاز کرد. این شرکت با تنها حدود ۱۶۰ کارمند، همچنان چابک ماند و یاد گرفت که از سخت‌افزار، نتایج را استخراج کند. بهره‌وری یک خط‌مشی بازاریابی نبود. این کل فرهنگ بود. نکته طنزآمیزی وجود دارد که شایان ذکر است. های-فلایر این تراشه‌ها را تا حدودی قبل از کنترل‌های صادراتی ایالات متحده که بعداً چین را از بهترین پردازنده‌های گرافیکی انویدیا محروم کرد، انبار کرده بود. مهندسان دیپ‌سیک که مجبور بودند با تراشه‌های ضعیف‌تر و کمتر، کار بیشتری انجام دهند، در صرفه‌جویی بسیار خوب عمل کردند و این محدودیت به مزیت تبدیل شد.

خانواده مدل: V3، R1 و V4

DeepSeek به سرعت عرضه می‌شود. DeepSeek Coder در اواخر سال ۲۰۲۳، V2 در ماه مه ۲۰۲۴ و DeepSeek V3 که به سرعت در حال پیشرفت بود، در دسامبر ۲۰۲۴ از راه رسیدند. سپس DeepSeek R1 در ۲۰ ژانویه ۲۰۲۵ از راه رسید، مدل استدلالی که جرقه را روشن کرد. تا آوریل ۲۰۲۶، آزمایشگاه DeepSeek V4 را با یک V4-Pro و یک V4-Flash سبک‌تر پیش‌نمایش کرده بود و پنجره‌های زمینه را به سمت یک میلیون توکن سوق می‌داد. هر نسخه از همان دستورالعمل پیروی می‌کرد: تطبیق مرز، شارژ کسری و دادن وزن‌ها.

وزن‌های باز، API و deepseek.com

بخش آخر اهمیت دارد. از زمان R1، مدل‌های DeepSeek تحت مجوز MIT به عنوان دانلودهای با وزن آزاد در Hugging Face و GitHub منتشر شده‌اند. هر کسی می‌تواند آنها را دریافت کند، بررسی کند، تنظیم دقیق کند یا روی دستگاه خود اجرا کند. همچنین می‌توانید از چت‌بات رایگان در deepseek.com استفاده کنید یا با هزینه‌ای ناچیز به API DeepSeek متصل شوید. وزن‌های آزاد به علاوه یک API ارزان، ترکیبی نادر است و موتور محرک این تحول است.

جستجوی عمیق-هوش مصنوعی

نحوه عملکرد DeepSeek R1 و V3

شهرت DeepSeek بر یک حقیقت ساده و عجیب برای رقبایش استوار است. این سیستم با مدل‌های بسیار بزرگتر و بسیار گران‌تر برابری می‌کند، در حالی که محاسبات بسیار کمتری مصرف می‌کند. نکته‌ی کلیدی معماری آن است - نه جادو.

ترکیبی از متخصصان و استنتاج کارآمد

DeepSeek V3 دارای ۶۷۱ میلیارد پارامتر است، اما از همه آنها به طور همزمان استفاده نمی‌کند. این یک مدل ترکیبی از متخصصان است، بنابراین برای هر توکن مشخص، فقط حدود ۳۷ میلیارد پارامتر را فعال می‌کند، که تعداد انگشت‌شماری از "متخصصان" مربوط به وظیفه هستند. آزمایشگاه این مدل را با توجه نهفته چند سره، روشی که حافظه را در طول استنتاج فشرده می‌کند، جفت کرد. نتیجه، یک مدل غول‌پیکر است که مانند یک مدل کوچک اجرا می‌شود. حافظه کمتر، قدرت کمتر، هزینه کمتر برای هر پاسخ. برای رقیبی که میلیاردها دلار خرج کرده و فرض می‌کند که بزرگتر بودن همیشه به معنای گران‌تر بودن است، این یک اثبات مفهوم نامطلوب است.

R1، استدلال و زنجیره فکری

DeepSeek R1 یک ترفند دوم هم اضافه کرد: با صدای بلند فکر می‌کند. مانند مدل o1 شرکت OpenAI، این مدل نیز یک مدل استدلالی است که قبل از پاسخ دادن، گام به گام با استفاده از زنجیره تفکر، مسائل را حل می‌کند. به همین دلیل است که در کارهای سخت امتیاز بسیار خوبی کسب می‌کند. R1 در معیار MATH-500 به 97.3 درصد و در AIME 2024 به 79.8 درصد رسید و 49.2 درصد از مسائل واقعی GitHub را در SWE-bench حل کرد و در آن زمان، شانه به شانه بهترین‌های OpenAI قرار گرفت.

ادعای هزینه آموزش ۵.۶ میلیون دلاری، افشا شد

این عددی است که اینترنت را تکان داد. مقاله خود DeepSeek اعلام کرد که اجرای نهایی آموزش برای V3 حدود ۵.۵۸ میلیون دلار در زمان GPU هزینه داشته است. در مقایسه با ۱۰۰ میلیون دلاری که به طور گسترده برای GPT-4 ذکر شده است، این رقم تحقیرآمیز به نظر می‌رسید. اما به جزئیات توجه کنید. این رقم فقط اجرای نهایی را شامل می‌شود، نه تحقیقات، آزمایش‌های ناموفق یا خود تراشه‌ها. تحلیلگران SemiAnalysis تخمین زدند که هزینه واقعی سخت‌افزار DeepSeek بسیار بالاتر از ۵۰۰ میلیون دلار بوده است. این تیتر همزمان دقیق و گمراه‌کننده بود، و دقیقاً به همین دلیل است که تا این حد پیشرفت کرده است.

مدل جستجوی عمیق منتشر شد نوع یادداشت‌ها
دیپ سیک نسخه ۳ دسامبر ۲۰۲۴ وزارت آموزش و پرورش LLM پارامترهای ۶۷۱B، ۳۷B فعال، MIT
جستجوی عمیق R1 ژانویه ۲۰۲۵ استدلال وزن آزاد، رقیب OpenAI o1
دیپ سیک نسخه ۴ آوریل ۲۰۲۶ خانواده وزارت آموزش و پرورش V4-Pro و V4-Flash، تقریباً ۱ میلیون متن

هوش مصنوعی DeepSeek در مقایسه با ChatGPT، Claude و Gemini

بنابراین آیا DeepSeek از ChatGPT بهتر است؟ بستگی به نیاز شما دارد. در ریاضیات، کدنویسی و استدلال خام، با مدل‌های برتر OpenAI و Anthropic رقابت می‌کند. جایی که کم می‌آورد، ورودی چندوجهی و اعتماد است. مدل‌های پرچمدار DeepSeek عمدتاً فقط متن هستند، در حالی که ChatGPT تصاویر، صدا و ویدیو را مدیریت می‌کند. نثر OpenAI هنوز برای نوشتن روزمره روان‌تر است. Gemini گوگل در این بین قرار دارد، در چندوجهی و جستجو قوی و در دسترسی آزاد ضعیف‌تر است. و برای بسیاری از کسب‌وکارهای غربی، عامل تعیین‌کننده اصلاً معیار نیست، بلکه اعتماد است: مدلی که در چین آموزش دیده و میزبانی شده است، بار و بندی را به دوش می‌کشد که مدل میزبانی شده در ایالات متحده ندارد.

سپس قیمت وجود دارد، جایی که شکاف نزدیک نیست. جدول زیر داستان را روایت می‌کند و به همین دلیل است که توسعه‌دهندگان همچنان بارهای کاری خود را به API DeepSeek منتقل می‌کنند.

مدل ورودی / ۱ میلیون توکن وزنه‌های آزاد چندوجهی
جستجوی عمیق نسخه ۳.۲ حدود ۰.۲۸ دلار بله (دانشگاه ام آی تی) خیر
GPT-5.2 (اوپن‌ای‌آی) ۱.۷۵ دلار خیر بله
کلود (انسان‌گرا) سطح ممتاز خیر بله

برای متن و کد در مقیاس بزرگ، DeepSeek تقریباً شش برابر ارزان‌تر از GPT-5.2 ورودی می‌گیرد و از آنجا که وزن‌ها باز هستند، می‌توانید API را به طور کامل نادیده بگیرید و آن را از طریق استقرار محلی اجرا کنید. این امر DeepSeek را به گزینه‌ای فوق‌العاده مقرون به صرفه تبدیل می‌کند و پاسخ به آن برای یک آزمایشگاه بسته دشوار است.

لحظه‌ای که DeepSeek دنیای کریپتو را تکان داد

مارک اندریسن آن را «لحظه اسپوتنیک هوش مصنوعی» نامید. او درباره غرور ملی صحبت می‌کرد، اما بازارها حرف‌های سردتری شنیدند - شاید ارزشمندترین چیز در هوش مصنوعی، اصلاً انبوهی از تراشه‌ها نباشد.

۵۸۹ میلیارد دلار در یک روز از دست رفت

وقتی DeepSeek در ۲۷ ژانویه ۲۰۲۵ با ۱۶ میلیون دانلود در ۱۸ روز اول خود، در صدر فروشگاه اپ استور ایالات متحده قرار گرفت، معامله‌گران محاسبات را برعکس انجام دادند. اگر یک آزمایشگاه چینی می‌توانست با کسری از سخت‌افزار به مرز [سرعت دانلود] برسد، تقاضای آینده برای تراشه‌های انویدیا ناگهان متزلزل به نظر می‌رسید. انویدیا در آن روز حدود ۱۷ درصد سقوط کرد و ۵۸۹ میلیارد دلار از ارزش بازار خود را از دست داد، بزرگترین سقوط یک روزه در تاریخ ایالات متحده. کل نزدک [شاخص بورس نزدک] دچار سرما شد.

چرا توکن‌های رمزنگاری هوش مصنوعی بیشترین کاهش را داشتند؟

ارزهای دیجیتال نیز از این وضعیت در امان نماندند. بیت‌کوین تقریباً ۷ درصد کاهش یافت و به حدود ۹۷۷۵۰ دلار رسید و بیش از ۳۰۰ میلیارد دلار از کل بازار ارزهای دیجیتال خارج شد. اما فاجعه واقعی در توکن‌های هوش مصنوعی بود. این دسته در آن روز حدود ۹ درصد کاهش یافت، در حالی که بازار گسترده تقریباً ۵ درصد کاهش یافته بود، به طوری که Render 12.6 درصد و Fetch.ai حدود ۱۰ درصد کاهش یافتند. دلیل آن ناخوشایند است. بسیاری از ارزش توکن‌های هوش مصنوعی بر اساس همان داستان Nvidia بود: هوش مصنوعی تشنه محاسبات است، محاسبات کمیاب است، بنابراین هر چیزی که محاسبات یا GPU بفروشد، ارزشمند است. DeepSeek در این داستان خللی ایجاد کرد و توکن‌هایی که بیشترین تکیه را به آن داشتند، بیشترین ضرر را متحمل شدند. خود این افت قیمت دوام نیاورد؛ در عرض چند روز بیت‌کوین بیشتر ضررهای خود را جبران کرد، زیرا تحلیلگران این وحشت را واکنش بیش از حد نامیدند. اما بخش توکن‌های هوش مصنوعی مدت زمان بیشتری متزلزل ماند، نشانه‌ای از اینکه بازار در حال تغییر قیمت کل روایت بود، نه فقط گذراندن یک بعد از ظهر بد.

توکن‌های رمزنگاری هوش مصنوعی پس از DeepSeek

نکته اینجاست. همان شوکی که توکن‌های هوش مصنوعی را از پا درآورد، بحث بلندمدت‌تری را نیز برایشان به ارمغان آورد. اگر مدل‌های پیشرو بتوانند ارزان و باز باشند، آنگاه خندق‌های آزمایشگاه‌های بزرگ بسته کوچک می‌شوند و زیرساخت‌های باز و مقاوم در برابر سانسور هوش مصنوعی شروع به ارزشمندتر شدن می‌کنند، نه کمتر. شبکه‌های محاسباتی غیرمتمرکز مانند Akash ، شبکه‌های رندرینگ مانند Render و بازارهای هوش ماشینی مانند Bittensor، همگی جهانی را ترسیم می‌کنند که در آن هوش مصنوعی در محدوده سه شرکت آمریکایی محصور نشده است. DeepSeek باعث شد که این جهان نزدیک‌تر به نظر برسد. Bittensor، که توکن TAO آن به شبکه‌ای از مدل‌های یادگیری ماشینی رقیب پاداش می‌دهد، واضح‌ترین شرط‌بندی روی این ایده است: بازاری برای هوش باز به جای یک مغز شرکتی. اینکه آیا این شبکه‌ها واقعاً می‌توانند هوش مصنوعی در سطح پیشرو ارائه دهند، هنوز اثبات نشده است، اما DeepSeek بار تردید را به دوش آزمایشگاه‌های بسته انداخت.

بازار متوجه شد. تا ماه مه ۲۰۲۵، گری‌اسکیل یک بخش اختصاصی هوش مصنوعی کریپتو را با پوشش ۲۰ توکن به ارزش مجموع حدود ۲۱ میلیارد دلار رسماً راه‌اندازی کرده بود که تقریباً ۴.۷ برابر بیشتر از ۴.۵ میلیارد دلار در اوایل سال ۲۰۲۳ است. فقط مراقب باشید. این عرضه، کلاهبرداران را نیز به خود جلب کرد: در یک روز، بیش از ۷۵ میم‌کوین جعلی «دیپ‌سیک» ظاهر شد و معامله‌گرانی که آنها را تعقیب می‌کردند بیش از ۱۰۰ میلیون دلار ضرر کردند. دیپ‌سیک هرگز توکنی راه‌اندازی نکرد. هر ادعایی غیر از این، یک تله است.

جستجوی عمیق-هوش مصنوعی

آیا استفاده از هوش مصنوعی DeepSeek بی‌خطر است؟ ممنوعیت‌ها و حریم خصوصی

اینجاست که احتیاط لازم است. از برنامه یا وب‌سایت رسمی DeepSeek استفاده کنید و داده‌های شما، از جمله درخواست‌هایتان، به سرورهایی در چین منتقل می‌شوند و تحت یک سیاست حفظ حریم خصوصی تحت قانون چین مدیریت می‌شوند. چندین دولت تصمیم گرفتند که این یک مشکل است. ایتالیا در 30 ژانویه 2025 به دلیل حفاظت از داده‌ها، DeepSeek را مسدود کرد. بیش از دوازده ایالت ایالات متحده آن را از دستگاه‌های رسمی تا اوایل سال 2025 ممنوع کردند و کنگره قانون عدم استفاده از DeepSeek در دستگاه‌های دولتی را معرفی کرد. این مدل همچنین منعکس کننده قوانین محتوای چینی است و موضوعات حساس سیاسی را طفره می‌رود یا آنها را بهداشتی می‌کند. روش‌های DeepSeek نیز مورد انتقاد قرار گرفته است. در اوایل 2026، Anthropic آزمایشگاه را به استفاده از هزاران حساب جعلی برای جمع‌آوری میلیون‌ها مکالمه کلود برای آموزش متهم کرد، اتهامی که DeepSeek آن را رد می‌کند. داستان نبوغ مقتصدانه یک جنبه مورد مناقشه دارد.

هیچ‌کدام از این موارد، خودِ فناوری را برای اجرا ناامن نمی‌کند. از آنجا که وزن‌ها باز هستند، یک کاربر یا شرکتِ آگاه به حریم خصوصی می‌تواند مدل را دانلود کرده و آن را به‌صورت محلی اجرا کند، بدون اینکه هیچ داده‌ای از ساختمان خارج شود. برنامه‌ی میزبانی‌شده، ریسک است. مدل باز، دریچه‌ی فرار است.

نحوه استفاده از هوش مصنوعی DeepSeek: استقرار محلی

شما سه راه دارید. ساده‌ترین راه، چت‌بات رایگان در deepseek.com یا اپلیکیشن موبایل است که برای سوالات معمولی در صورتی که بحث حریم خصوصی برایتان مهم نباشد، مناسب است. راه دوم، رابط برنامه‌نویسی کاربردی DeepSeek است که به اندازه کافی ارزان است و توسعه‌دهندگان می‌توانند حجم کاری سنگین را از طریق آن انجام دهند؛ مستندات رابط برنامه‌نویسی کاربردی DeepSeek شما را در مراحل راه‌اندازی راهنمایی می‌کند و DeepSeek Coder برای برنامه‌نویسی تنظیم شده است. راه سوم و امن‌ترین راه برای کارهای حساس، استقرار محلی است: وزنه‌های باز را از Hugging Face بردارید یا یک نسخه کوچک‌تر را از طریق ابزاری مانند Ollama روی سخت‌افزار خودتان اجرا کنید. همان مدل، بدون هیچ گونه افشای داده‌ها. برای سوالات معمولی، اپلیکیشن رایگان کافی است؛ برای هر کسی که با داده‌های خصوصی یا تنظیم‌شده سروکار دارد، مسیر محلی ارزش راه‌اندازی اضافی را دارد.

معنای DeepSeek برای هوش مصنوعی و رمزنگاری

درس ماندگار DeepSeek ارتباط چندانی با پیروزی چین در این دور از رقابت ندارد. تغییر واقعی این است که هوش مصنوعی پیشرو، ارزان‌تر و سریع‌تر از هر کسی که قیمت‌گذاری کند، در دسترس قرار گرفت. برای کاربران عادی، این به معنای ابزارهای بهتر با هزینه کمتر است. برای آزمایشگاه‌های بسته، به این معنی است که خندق GPU نازک‌تر از آن چیزی است که ارزیابی‌های آنها فرض می‌کند. و برای ارزهای دیجیتال، این دو طرف را تحت تأثیر قرار می‌دهد: توکن‌های هوش مصنوعی که بر اساس داستان کمبود ساخته شده‌اند، ضربه خوردند، در حالی که آنهایی که زیرساخت‌های هوش مصنوعی باز و غیرمتمرکز را می‌سازند، دلیل جدیدی برای وجود داشتن پیدا کردند. بنابراین سوال واقعی این نیست که آیا DeepSeek خوب است یا خیر. واضح است که هست. سوال این است که وقتی هوش دیگر گران نباشد، چه کسی هنوز حقوق می‌گیرد.

هر سوالی دارید؟

DeepSeek یک آزمایشگاه هوش مصنوعی چینی است که در سال ۲۰۲۳ توسط لیانگ ونفنگ و با حمایت صندوق پوشش ریسک High-Flyer تأسیس شد. این آزمایشگاه مدل‌های زبانی بزرگ و با وزن باز، از جمله سری V3 و مدل استدلال R1، می‌سازد که با کسری از هزینه با هوش مصنوعی برتر غربی مطابقت دارند و دانلود آنها رایگان است.

بله، تقریباً. چت‌بات موجود در deepseek.com و اپلیکیشن موبایل رایگان هستند. دانلود مدل‌ها تحت لیسانس MIT و اجرای آنها توسط خودتان نیز رایگان است. فقط رابط برنامه‌نویسی کاربردی DeepSeek هزینه دارد و حتی همین هم بسیار ارزان‌تر از رقبایی مانند OpenAI است.

این فناوری بی‌نقص است، اما برنامه میزبانی‌شده، داده‌های شما را طبق قانون چین به سرورهایی در چین ارسال می‌کند. برای کارهای حساس، این یک نگرانی واقعی در مورد حریم خصوصی است، به همین دلیل است که چندین دولت آن را در دستگاه‌های رسمی ممنوع کرده‌اند. اجرای مدل باز به صورت محلی، از افشای داده‌ها به طور کامل جلوگیری می‌کند.

این ممنوعیت‌ها حریم خصوصی داده‌ها و امنیت ملی را هدف قرار می‌دهند، نه کیفیت مدل را. ایتالیا در ژانویه ۲۰۲۵ آن را مسدود کرد، بیش از دوازده ایالت آمریکا آن را در دستگاه‌های دولتی محدود کردند و کنگره پیشنهاد داد که استفاده از آن در تلفن‌های فدرال ممنوع شود، همه اینها به خطر انتقال داده‌های کاربران به چین اشاره داشتند.

در ریاضیات، کدنویسی و استدلال، DeepSeek با ChatGPT رقابت می‌کند و تقریباً شش برابر ارزان‌تر از ورودی API است. ChatGPT در ویژگی‌های چندوجهی، نوشتار روان و اعتماد برنده است. مزیت DeepSeek در آزاد بودن آن است، بنابراین می‌توانید خودتان آن را اجرا کنید، چیزی که ChatGPT اجازه نمی‌دهد.

این باعث فروش شدید شد. در ۲۷ ژانویه ۲۰۲۵، بیت‌کوین حدود ۷ درصد سقوط کرد و بیش از ۳۰۰ میلیارد دلار از بازار ارزهای دیجیتال خارج شد، زیرا DeepSeek سهام هوش مصنوعی را تکان داد. توکن‌های ارز دیجیتال هوش مصنوعی حدود ۹ درصد کاهش یافتند، که شدیدتر از بازار گسترده بود، زیرا این خبر این ایده را که ارزش هوش مصنوعی از محاسبات کمیاب و گران‌قیمت ناشی می‌شود، به چالش کشید.

Ready to Get Started?

Create an account and start accepting payments – no contracts or KYC required. Or, contact us to design a custom package for your business.

Make first step

Always know what you pay

Integrated per-transaction pricing with no hidden fees

Start your integration

Set up Plisio swiftly in just 10 minutes.