什么是 DeepSeek AI?颠覆加密货币的开放模式
一款来自一家名不见经传的中国初创公司的免费应用,做到了加密货币崩盘从未做到的事:一天之内,它就让英伟达市值蒸发了5890亿美元,创下了美国股市历史上单日公司市值损失的最高纪录。而这波冲击并未止步于华尔街。比特币下跌了7%,整个加密货币市场市值蒸发超过3000亿美元,其中所谓的AI代币跌幅最大。
这款应用名为 DeepSeek。其背后的模型 DeepSeek R1 是一款开源且价格低廉的 AI 模型,足以撼动支撑 AI 交易和部分加密货币的固有观念:构建强大的 AI 需要大量昂贵的芯片。本指南将解释 DeepSeek AI 的本质,它如何以极少的资源实现如此强大的功能,它与 ChatGPT 相比如何,以及它为何在AI 加密代币领域引发了至今仍持续的震荡。
DeepSeek AI是什么?它是谁开发的?
DeepSeek是一家中国人工智能实验室,但它最初并非如此起步。它起源于一家对冲基金,而这段背景几乎解释了它的所有思维方式。
从量化对冲基金到人工智能实验室
DeepSeek由梁文峰于2023年7月17日在中国杭州创立。梁文峰此前已运营High-Flyer,一家利用机器学习进行市场交易的量化对冲基金,并为此储备了大量英伟达GPU。当这些芯片不用于交易时,梁文峰便将其用于语言模型。因此,DeepSeek起步时拥有廉价的计算资源、一支研究团队,并且没有投资者的压力去追求尽可能大的模型。公司保持精简,仅有约160名员工,并学会了如何最大限度地利用硬件资源。效率并非一句空话,而是贯穿整个公司文化的核心。值得一提的是,High-Flyer之所以储备这些芯片,部分原因是在美国后来实施出口管制,切断了中国与英伟达顶级GPU的联系之前。由于被迫使用性能更弱、数量更少的芯片来完成更多工作,DeepSeek的工程师们练就了精打细算的本领,而这种限制反而成为了优势。
车型系列:V3、R1 和 V4
DeepSeek 的发布速度非常快。DeepSeek Coder 于 2023 年底发布,V2 于 2024 年 5 月发布,而突破性的 DeepSeek V3 则于 2024 年 12 月发布。随后,DeepSeek R1 于 2025 年 1 月 20 日发布,其推理模型点燃了 DeepSeek 的发展之火。到 2026 年 4 月,DeepSeek 实验室已经预览了 DeepSeek V4,包括 V4-Pro 和更轻量级的 V4-Flash,将上下文窗口推向了百万级。每个版本都遵循着相同的策略:紧跟技术前沿,收取少量费用,并免费提供所有功能。
开放权重、API 和 deepseek.com
最后一点至关重要。自 R1 版本以来,DeepSeek 的模型一直以宽松的 MIT 许可证发布,并以开源权重的形式在 Hugging Face 和 GitHub 上提供下载。任何人都可以获取、检查、微调模型,或在自己的机器上运行它们。您还可以直接在 deepseek.com 免费使用聊天机器人,或者以极低的价格接入 DeepSeek API。开源权重加上低廉的 API 是一种难得的组合,而这正是颠覆性变革背后的驱动力。

DeepSeek R1 和 V3 的实际工作原理
DeepSeek之所以享有盛誉,是因为它基于一个令竞争对手感到尴尬却又简单明了的事实:它能以远低于竞争对手的计算资源,实现与体积更大、价格更高的型号相媲美的性能。秘诀在于架构,而非魔法。
专家混合模型和高效推理
DeepSeek V3 拥有 6710 亿个参数,但它并非一次性全部使用。它是一个混合专家模型,因此对于任何给定的词元,它只会激活大约 370 亿个参数,即与该任务相关的少数“专家”。该实验室将其与多头潜在注意力机制相结合,这种方法可以在推理过程中压缩内存。最终成果是一个运行速度极快的大型模型。更少的内存、更低的功耗、更低的单次求解成本。对于一个花费数十亿美元并一直认为模型越大价格越高的竞争对手来说,这无疑是一个令人沮丧的概念验证。
R1、推理和思路链
DeepSeek R1 增加了一项新功能:它会“边想边说”。与 OpenAI 的 o1 类似,它是一种推理模型,会逐步运用“思维链”解决问题,然后再给出答案。正因如此,它在难题上表现出色。R1 在 MATH-500 基准测试中取得了 97.3% 的正确率,在 AIME 2024 测试中取得了 79.8% 的正确率,并在SWE-bench测试中解决了 49.2% 的 GitHub 真实问题,使其与当时 OpenAI 的顶尖模型并驾齐驱。
560万美元培训费用索赔详情
这个数字震惊了网络。DeepSeek 自己的论文称,V3 的最终训练运行耗费了约 558 万美元的 GPU 时间。与广为流传的 GPT-4 1 亿美元的耗资相比,这似乎令人汗颜。但仔细阅读论文的细则。这个数字仅涵盖最终运行,并不包括研究、失败的实验以及芯片本身的成本。SemiAnalysis 的分析师估计,DeepSeek 的实际硬件支出远超 5 亿美元。这个标题既准确又具有误导性,而这正是它传播如此广泛的原因。
| DeepSeek模型 | 已发布 | 类型 | 笔记 |
|---|---|---|---|
| DeepSeek V3 | 2024年12月 | 教育部LLM | 671B 个参数,37B 个活动参数,MIT |
| DeepSeek R1 | 2025年1月 | 推理 | 开源软件,可与 OpenAI o1 相媲美 |
| DeepSeek V4 | 2026年4月 | 教育部家族 | V4-Pro 和 V4-Flash,~100 万像素上下文 |
DeepSeek AI 与 ChatGPT、Claude 和 Gemini 的对比
那么DeepSeek比ChatGPT更好吗?这取决于你的需求。在数学、编程和推理能力方面,它与OpenAI和Anthropic的顶级模型不相上下。它的不足之处在于代码润色、多模态输入和信任度。DeepSeek的旗舰模型大多仅支持文本,而ChatGPT可以处理图像、语音和视频。OpenAI的文本在日常写作中仍然更加流畅。谷歌的Gemini则介于两者之间,在多模态和搜索方面表现出色,但在开放获取方面略显不足。而对于许多西方企业来说,决定性因素并非基准测试,而是信任:在中国训练和托管的模型会背负一些美国托管的模型所没有的包袱。
其次是价格,这方面的差距并不小。下表说明了这一点,这也是开发者不断将工作负载迁移到 DeepSeek API 的原因。
| 模型 | 输入/100万个代币 | 公开组重量级 | 多模态 |
|---|---|---|---|
| DeepSeek V3.2 | 约0.28美元 | 是的(麻省理工学院) | 不 |
| GPT-5.2(OpenAI) | 约1.75美元 | 不 | 是的 |
| 克劳德(人本主义) | 高级会员 | 不 | 是的 |
对于大规模文本和代码处理,DeepSeek 的输入成本大约只有 GPT-5.2 的六分之一,而且由于权重是开源的,您可以完全跳过 API,直接在本地部署运行。这使得 DeepSeek 成为一种极具成本效益的选择,但对于封闭实验室来说,这却是一个难以应对的问题。
DeepSeek事件震动了加密货币行业。
马克·安德森称之为“人工智能的斯普特尼克时刻”。他指的是民族自豪感,但市场听到的却是更为冷酷的消息——或许人工智能领域最有价值的东西终究不是芯片库存。
一天之内消失了5890亿美元
2025年1月27日,DeepSeek在App Store上架18天内下载量达到1600万次,荣登榜首。交易员们随即反向推算:如果一家中国实验室仅用极少的硬件就能达到技术前沿,那么英伟达芯片的未来需求前景顿时黯淡下来。当天,英伟达股价暴跌约17%, 市值蒸发5890亿美元,创下美国股市单日最大跌幅。整个纳斯达克指数也受到波及。
人工智能加密代币为何跌幅最大
加密货币市场也未能幸免。比特币下跌约7%,至97,750美元左右,加密货币市场总市值蒸发超过3000亿美元。但真正的重创发生在人工智能代币领域。该类别当日下跌约9% ,而整体市场跌幅约为5%,其中Render下跌12.6%,Fetch.ai下跌约10%。原因令人不安。许多人工智能代币的价值都建立在与英伟达相同的理念之上:人工智能需要大量的计算资源,而计算资源稀缺,因此任何出售计算资源或GPU的公司都弥足珍贵。DeepSeek的出现打破了这一理念,而那些最依赖DeepSeek的代币也遭受了最大的损失。下跌本身并没有持续太久;几天之内,比特币就收复了大部分失地,分析师们也认为之前的恐慌反应过度。但人工智能代币板块的波动持续了更长时间,这表明市场正在重新评估整个人工智能的发展前景,而不仅仅是经历了一个糟糕的下午。
DeepSeek之后的AI加密代币
事情出现了转折。重创人工智能代币的冲击也为它们提供了一个更长远的论据。如果前沿模型能够以低成本且开放的方式提供,那么大型封闭实验室的护城河就会缩小,开放且抗审查的人工智能基础设施的价值就会凸显,而不是降低。像Akash这样的去中心化计算网络、像 Render 这样的渲染网络以及像 Bittensor 这样的机器学习市场,都在描绘一个人工智能不再被三家美国公司垄断的世界。DeepSeek 让这个世界离我们更近了一步。Bittensor 的 TAO 代币奖励着一个由相互竞争的机器学习模型组成的网络,它是对这一理念最清晰的诠释:一个开放智能市场,而非单一企业大脑。这些网络是否真的能够提供前沿级别的人工智能仍有待验证,但 DeepSeek 已经将质疑的矛头指向了那些封闭的实验室。
市场注意到了这一点。到2025年5月,Grayscale正式成立了专门的AI加密货币板块,涵盖20种代币,总价值约210亿美元,较2023年初的45亿美元增长了约4.7倍。但务必小心。此次发行也引来了骗子:一天之内,出现了超过75种假冒的“DeepSeek”代币,追逐这些代币的交易者损失超过1亿美元。DeepSeek从未发行过任何代币。任何声称发行过代币的说法都是陷阱。

DeepSeek AI 使用安全吗?禁令和隐私问题
谨慎在此显得尤为重要。使用官方的DeepSeek应用程序或网站,您的数据(包括您的提示信息)将传输到位于中国的服务器,并受中国法律管辖的隐私政策约束。一些政府认为这是一个问题。意大利于2025年1月30日以数据保护为由封禁了DeepSeek。十几个美国州禁止在官方设备上使用DeepSeek,禁令持续到2025年初,国会也提出了《禁止在政府设备上使用DeepSeek法案》。该模式也反映了中国的内容规则,回避或淡化了政治敏感话题。DeepSeek的方法也饱受争议。在20世纪90年代初,Anthropic指控该实验室使用数千个欺诈账户收集数百万条Claude对话用于训练,DeepSeek否认了这一指控。这个“节俭天才”的故事也存在争议。
这并不意味着这项技术本身运行起来不安全。由于权重是公开的,注重隐私的用户或公司可以下载模型并在本地运行,数据不会离开公司内部。风险在于托管的应用程序,而开放的模型才是安全保障。
如何使用 DeepSeek AI:本地部署
您可以通过三种方式进入系统。最简单的方式是使用 deepseek.com 上的免费聊天机器人或移动应用,如果您不介意隐私方面的权衡,那么对于一些日常咨询来说非常合适。第二种方式是使用 DeepSeek API,它的成本很低,开发者可以通过它处理繁重的工作负载;DeepSeek API 文档会指导您完成设置,而 DeepSeek Coder 则专为编程而设计。第三种方式,也是处理敏感数据最安全的方式,是本地部署:您可以从 Hugging Face 获取开源权重,或者在您自己的硬件上运行一个精简版的模型,例如使用 Ollama 之类的工具。模型相同,但不会泄露任何数据。对于日常咨询,免费应用就足够了;但对于任何处理私人或受监管数据的人来说,本地部署方案值得您额外花费一些时间和精力进行设置。
DeepSeek对人工智能和加密货币意味着什么
DeepSeek带来的深远启示与中国赢得一轮胜利关系不大。真正的转变在于,前沿人工智能变得廉价且开放的速度远超预期。对于普通用户而言,这意味着能以更低的成本获得更好的工具。对于封闭的实验室而言,这意味着GPU护城河比其估值所反映的要薄弱。而对于加密货币而言,这则具有双重影响:基于稀缺性概念构建的AI代币遭受重创,而那些构建开放、去中心化AI基础设施的代币则获得了新的存在理由。因此,真正的问题不在于DeepSeek是否优秀。它显然是优秀的。问题在于,当人工智能不再昂贵时,谁还能从中获利。