Що таке DeepSeek AI? Відкрита модель, яка струшує криптовалюту

Що таке DeepSeek AI? Відкрита модель, яка струшує криптовалюту

Один безкоштовний додаток від маловідомого китайського стартапу зробив те, чого ще не вдавалося жодному краху криптовалют. За один день він знищив Nvidia на 589 мільярдів доларів, що стало найбільшою одноденною втратою для будь-якої компанії в історії фондового ринку США. І це не зупинилося на Уолл-стріт. Біткойн впав на 7 відсотків, понад 300 мільярдів доларів випарувалося з загального крипторинку, а так звані токени штучного інтелекту впали найбільше.

Додаток називався DeepSeek. Модель, що лежала в його основі, DeepSeek R1, була відкритою, дешевою моделлю штучного інтелекту, достатньо хорошою, щоб спростувати припущення, яке стримує як торгівлю штучним інтелектом, так і частину криптовалюти: що для створення потужного штучного інтелекту потрібні гори дорогих чіпів. У цьому посібнику пояснюється, що насправді являє собою DeepSeek AI, як він робить так багато з такими невеликими ресурсами, як він порівнюється з ChatGPT і чому це викликало тремтіння серед криптотокенів штучного інтелекту , яке відчувається досі.

Що таке DeepSeek AI і хто його створив

DeepSeek — це китайська лабораторія штучного інтелекту, але вона не починалася як така. Вона виросла з хедж-фонду, і ця передісторія пояснює майже все про те, як вона мислить.

Від квантового хедж-фонду до лабораторії штучного інтелекту

Компанію DeepSeek було засновано 17 липня 2023 року в Ханчжоу, Китай, Ляном Веньфенгом. Лян вже керував High-Flyer, кількісним хедж-фондом, який торгував на ринках за допомогою машинного навчання та накопичив великий кластер графічних процесорів Nvidia для цієї мети. Коли ці чіпи не були зайняті торгівлею, він спрямовував їх на мовні моделі. Тож DeepSeek розпочав своє життя з дешевих обчислень, команди дослідників та відсутності тиску інвесторів, які прагнули створити найбільшу можливу модель. Він залишався економним, маючи лише близько 160 співробітників, і навчився вичавлювати результати з апаратного забезпечення. Ефективність була не маркетинговою лінією. Це була вся культура. Варто зазначити іронію. High-Flyer накопичив ці чіпи частково до того, як США запровадили експортний контроль, який пізніше відрізав Китай від найкращих графічних процесорів Nvidia. Змушені робити більше з меншою кількістю слабших чіпів, інженери DeepSeek дуже добре навчилися економності, і це обмеження стало перевагою.

Сімейство моделей: V3, R1 та V4

DeepSeek постачається швидко. DeepSeek Coder з'явився наприкінці 2023 року, V2 — у травні 2024 року, а проривний DeepSeek V3 — у грудні 2024 року. Потім 20 січня 2025 року з'явився DeepSeek R1 — модель міркувань, яка запалила запал. До квітня 2026 року лабораторія попередньо представила DeepSeek V4 з V4-Pro та легшим V4-Flash, що дозволило збільшити кількість контекстних вікон до мільйона токенів. Кожен реліз дотримувався одного й того ж плану: зіставлення з межею, стягнення частки та передача ваг.

Відкриті ваги, API та deepseek.com

Остання частина має значення. Починаючи з R1, моделі DeepSeek постачаються за ліцензією MIT як відкриті завантаження на Hugging Face та GitHub. Будь-хто може завантажити їх, перевірити, налаштувати або запустити на власному комп'ютері. Ви також можете просто скористатися чат-ботом безкоштовно на deepseek.com або підключитися до API DeepSeek за копійки. Відкриті ваги плюс дешевий API – це рідкісне поєднання, і саме воно є двигуном революції.

глибокий пошук-AI

Як насправді працюють DeepSeek R1 та V3

Репутація DeepSeek ґрунтується на простому, але незручному для його конкурентів факті. Він не поступається набагато більшим і дорожчим моделям, споживаючи при цьому набагато менше обчислювальних ресурсів. Хитрощі в архітектурі, а не в магії.

Змішані експерти та ефективний висновок

DeepSeek V3 має 671 мільярд параметрів, але не використовує їх усі одночасно. Це модель зі змішаними експертами, тому для будь-якого заданого токена активується лише близько 37 мільярдів параметрів – жменька «експертів», що відповідають завданню. Лабораторія поєднала це з багатоголовою латентною увагою – методом, який стискає пам'ять під час логічного висновку. Результатом є гігантська модель, яка працює як маленька. Менше пам'яті, менше потужності, нижча вартість однієї відповіді. Для конкурента, який витратив мільярди, припускаючи, що більше завжди означає дорожче, це небажаний доказ концепції.

R1, міркування та ланцюжок думок

DeepSeek R1 додав ще один трюк: він думає вголос. Як і o1 від OpenAI, це модель міркування, яка крок за кроком розв'язує проблеми, використовуючи ланцюжок думок, перш ніж дати відповідь. Саме тому він так добре справляється зі складними завданнями. R1 досяг 97,3% у бенчмарку MATH-500 та 79,8% у AIME 2024, а також вирішив 49,2% реальних проблем GitHub у SWE-bench , що ставить його пліч-о-пліч з найкращими результатами OpenAI на той час.

Заява про витрати на навчання у розмірі 5,6 мільйона доларів, розпакована

Ось цифра, яка сколихнула інтернет. У статті DeepSeek зазначалося, що фінальний навчальний прогін для V3 коштував близько 5,58 мільйона доларів у часі GPU. Порівняно зі 100 мільйонами доларів, які широко згадуються для GPT-4, це виглядало як приниження. Але прочитайте дрібний шрифт. Ця цифра охоплює лише фінальний прогін, а не дослідження, невдалі експерименти чи самі чіпи. Аналітики SemiAnalysis оцінили, що реальні витрати DeepSeek на обладнання значно перевищували 500 мільйонів доларів. Заголовок був одночасно точним і оманливим, саме тому він розійшовся так далеко.

Модель DeepSeek Випущено Тип Нотатки
DeepSeek V3 Грудень 2024 року Міністерство освіти, магістр права 671B параметрів, 37B активних, MIT
DeepSeek R1 Січень 2025 року Міркування Відкрита вага, конкуруючий з OpenAI o1
DeepSeek V4 Квітень 2026 р. Родина Міністерства освіти V4-Pro та V4-Flash, ~1 млн контексту

DeepSeek AI проти ChatGPT, Claude та Gemini

Тож чи DeepSeek кращий за ChatGPT? Залежить від ваших потреб. Щодо математики, кодування та первинних міркувань, він поступається найкращим моделям OpenAI та Anthropic. У чому він поступається, так це в поліровці, мультимодальному введенні та довірі. Флагманські моделі DeepSeek здебільшого працюють лише з текстом, тоді як ChatGPT обробляє зображення, голос та відео. Текст OpenAI все ще читається плавніше для повсякденного письма. Gemini від Google знаходиться посередині, сильний у мультимодальному введенні та пошуку, але слабший у відкритому доступі. І для багатьох західних компаній вирішальним фактором є зовсім не еталон, а довіра: модель, навчена та розміщена в Китаї, має певний багаж, а модель, розміщена в США, – ні.

Також є ціна, де розрив не такий вже й малий. Таблиця нижче розповідає історію, і саме вона є причиною, чому розробники продовжують переносити робочі навантаження на API DeepSeek.

Модель Вхід / 1 млн токенів Відкриті ваги Мультимодальний
DeepSeek версії 3.2 ~$0.28 Так (MIT) Ні
GPT-5.2 (OpenAI) ~1,75 дол. США Ні Так
Клод (Антропік) Преміум-рівень Ні Так

Для тексту та коду у великих масштабах DeepSeek приблизно в шість разів дешевший за вхідні дані, ніж GPT-5.2, а оскільки ваги відкриті, ви можете повністю пропустити API та запустити його через локальне розгортання. Це робить DeepSeek надзвичайно економічно ефективним варіантом, на який важко відповісти закритій лабораторії.

Момент DeepSeek, який сколихнув криптовалюту

Марк Андріссен назвав це «моментом супутника для штучного інтелекту». Він говорив про національну гордість, але ринки почули щось холодніше — можливо, найцінніша річ у штучному інтелекті — це все ж таки не запаси чіпів.

589 мільярдів доларів зникло за день

Коли 27 січня 2025 року DeepSeek очолив американський App Store з 16 мільйонами завантажень за перші 18 днів, трейдери зробили зворотні розрахунки. Якщо китайська лабораторія змогла досягти межі можливостей лише з часткою апаратного забезпечення, майбутній попит на чіпи Nvidia раптово виглядав хиткішим. Того дня акції Nvidia впали приблизно на 17 відсотків, а ринкова вартість склала 589 мільярдів доларів , що стало найбільшим одноденним падінням в історії США. Весь Nasdaq підхопив холод.

Чому криптовалютні токени зі штучним інтелектом впали найбільше

Криптовалюта не уникла цього. Біткойн впав приблизно на 7 відсотків до приблизно 97 750 доларів, а понад 300 мільярдів доларів залишили крипторинок загалом. Але справжня бійня сталася в токенах штучного інтелекту. Ця категорія впала приблизно на 9 відсотків за день, порівняно з приблизно 5 відсотками для широкого ринку, при цьому Render знизився на 12,6 відсотка, а Fetch.ai – приблизно на 10 відсотків. Причина незручна. Значна частина вартості токенів штучного інтелекту базувалася на тій самій історії, що й у Nvidia: штучний інтелект потребує обчислень, обчислень мало, тому все, що продає обчислення або графічні процесори, є цінним. DeepSeek пробив діру в цій історії, і токени, які найбільше покладалися на нього, найбільше втратили наслідки. Саме падіння тривало недовго; протягом кількох днів Біткойн відіграв більшу частину своїх втрат, оскільки аналітики назвали паніку надмірною реакцією. Але сектор токенів штучного інтелекту залишався хитким набагато довше, що свідчить про те, що ринок переоцінює всю історію, а не просто переживає невдалий день.

Криптотокени зі штучним інтелектом після DeepSeek

Ось у чому поворот. Той самий шок, який вдарив по токенах ШІ, також дав їм довгостроковий аргумент. Якщо передові моделі можуть бути дешевими та відкритими, тоді рови великих закритих лабораторій зменшуються, а відкрита, стійка до цензури інфраструктура ШІ починає виглядати ціннішою, а не менш. Децентралізовані обчислювальні мережі, такі як Akash , мережі рендерингу, такі як Render, та ринки машинного інтелекту, такі як Bittensor, створюють світ, де ШІ не замкнений усередині трьох американських компаній. DeepSeek зробив цей світ ближчим. Bittensor, чий токен TAO винагороджує мережу конкуруючих моделей машинного навчання, є найчіткішою ставкою на цю ідею: ринок відкритого інтелекту, а не один корпоративний мозок. Чи можуть ці мережі насправді створювати ШІ передового рівня, досі не доведено, але DeepSeek переклав тягар сумнівів на закриті лабораторії.

Ринок це помітив. До травня 2025 року Grayscale формалізував спеціалізований криптосектор зі штучним інтелектом, який охоплював 20 токенів загальною вартістю близько 21 мільярда доларів , що приблизно в 4,7 раза більше, ніж 4,5 мільярда доларів на початку 2023 року. Тільки будьте обережні. Запуск також привернув увагу шахраїв: за один день з'явилося понад 75 підроблених мемкоїнів "DeepSeek", і трейдери, які ганялися за ними, втратили понад 100 мільйонів доларів . DeepSeek ніколи не запускав токен. Будь-які твердження протилежного – це пастка.

глибокий пошук-AI

Чи безпечно використовувати DeepSeek AI? Заборони та конфіденційність

Ось тут і виправдовує себе обережність. Використовуйте офіційний додаток або веб-сайт DeepSeek, і ваші дані, включаючи ваші підказки, передаються на сервери в Китаї та обробляються відповідно до політики конфіденційності, що регулюється китайським законодавством. Кілька урядів вирішили, що це проблема. Італія заблокувала DeepSeek 30 січня 2025 року через захист даних. Понад десяток штатів США заборонили його використання на офіційних пристроях до початку 2025 року, а Конгрес запровадив Закон про заборону DeepSeek на урядових пристроях. Модель також відображає китайські правила щодо контенту, уникаючи або очищуючи політично чутливі теми. Методи DeepSeek також викликали критику. На початку 2026 Anthropic звинуватила лабораторію у використанні тисяч шахрайських облікових записів для збору мільйонів розмов Клода для навчання, що DeepSeek заперечує. Історія про геніального економника має спірну сторону.

Ніщо з цього не робить саму технологію небезпечною для використання. Оскільки ваги відкриті, користувач або компанія, яка піклується про конфіденційність, може завантажити модель та запустити її локально, без виходу даних з будівлі. Розміщений додаток є ризиком. Відкрита модель — це рятувальний люк.

Як використовувати DeepSeek AI: локальне розгортання

У вас є три способи входу. Найпростіший – це безкоштовний чат-бот на deepseek.com або мобільний додаток, що підходить для звичайних питань, якщо вас не турбує компроміс щодо конфіденційності. Другий – це DeepSeek API, достатньо дешевий, щоб розробники могли направляти через нього великі робочі навантаження; документація DeepSeek API проведе вас через налаштування, а DeepSeek Coder налаштований для програмування. Третій, і найбезпечніший для конфіденційної роботи, – це локальне розгортання: візьміть відкриті ваги з Hugging Face або запустіть меншу версію за допомогою інструменту, такого як Ollama, на власному обладнанні. Та сама модель, жодного розкриття даних. Для звичайних питань достатньо безкоштовного додатку; для тих, хто працює з приватними або регульованими даними, локальний маршрут вартий додаткового налаштування.

Що DeepSeek означає для ШІ та криптовалют

Тривалий урок DeepSeek мало пов'язаний з перемогою Китаю в раунді. Справжній зсув полягає в тому, що передовий штучний інтелект став дешевим і відкритим швидше, ніж будь-хто враховував ціни. Для звичайних користувачів це означає кращі інструменти за нижчою ціною. Для закритих лабораторій це означає, що простір навколо графічних процесорів тонший, ніж припускають їхні оцінки. А для криптовалют це має двосторонній характер: токени штучного інтелекту, побудовані на історії дефіциту, зазнали удару, тоді як ті, що будують відкриту, децентралізовану інфраструктуру штучного інтелекту, отримали нову причину для існування. Тож справжнє питання не в тому, чи хороший DeepSeek. Він явно хороший. Питання в тому, кому все ще платять, коли інтелект перестає бути дорогим.

Які-небудь питання?

DeepSeek — це китайська лабораторія штучного інтелекту, заснована у 2023 році Ляном Веньфенгом за підтримки хедж-фонду High-Flyer. Вона створює моделі великих мов програмування з відкритою вагою, включаючи серію V3 та модель міркувань R1, які відповідають найкращим західним розробкам штучного інтелекту за значно меншою ціною та безкоштовні для завантаження.

Так, здебільшого. Чат-бот на deepseek.com та мобільний додаток можна використовувати безкоштовно. Моделі також можна безкоштовно завантажити за ліцензією MIT та запустити самостійно. Тільки DeepSeek API коштує грошей, та й то набагато дешевше, ніж у конкурентів, таких як OpenAI.

Технологія надійна, але розміщений додаток надсилає ваші дані на сервери в Китаї згідно з китайським законодавством. Для конфіденційної роботи це справжнє занепокоєння щодо конфіденційності, тому кілька урядів заборонили її на офіційних пристроях. Запуск відкритої моделі локально повністю уникає розкриття даних.

Заборони стосуються конфіденційності даних та національної безпеки, а не якості моделі. Італія заблокувала її в січні 2025 року, понад десяток штатів США обмежили її використання на урядових пристроях, а Конгрес запропонував заборонити її використання на федеральних телефонах, посилаючись на ризик перетікання даних користувачів до Китаю.

У математиці, кодуванні та логічному мисленні DeepSeek конкурує з ChatGPT і приблизно в шість разів дешевший за вхідні дані API. ChatGPT перемагає завдяки мультимодальним функціям, відшліфованому написанню та довірі. Перевагою DeepSeek є його відкритість, тому ви можете запускати його самостійно, чого ChatGPT не дозволяє.

Це спровокувало різкий розпродаж. 27 січня 2025 року біткойн впав приблизно на 7 відсотків, і понад 300 мільярдів доларів покинули крипторинок, оскільки DeepSeek похитнув акції компаній, що займаються штучним інтелектом. Криптотокени зі штучним інтелектом впали приблизно на 9 відсотків, що сильніше, ніж ринок загалом, оскільки новина поставила під сумнів ідею про те, що цінність штучного інтелекту походить від обмежених і дорогих обчислень.

Ready to Get Started?

Create an account and start accepting payments – no contracts or KYC required. Or, contact us to design a custom package for your business.

Make first step

Always know what you pay

Integrated per-transaction pricing with no hidden fees

Start your integration

Set up Plisio swiftly in just 10 minutes.