DeepSeek AI là gì? Mô hình mở đang làm rung chuyển thế giới tiền điện tử.

Đăng trên Jun 20, 2026 Viết bởi Mathis Curcio

Một ứng dụng miễn phí từ một công ty khởi nghiệp ít người biết đến của Trung Quốc đã làm được điều mà chưa từng có vụ sụp đổ tiền điện tử nào làm được. Chỉ trong một ngày, nó đã xóa sổ 589 tỷ đô la khỏi Nvidia , mức thua lỗ một ngày lớn nhất đối với bất kỳ công ty nào trong lịch sử thị trường chứng khoán Mỹ. Và điều đó không chỉ dừng lại ở Phố Wall. Bitcoin giảm 7%, hơn 300 tỷ đô la bốc hơi khỏi toàn bộ thị trường tiền điện tử, và các token được gọi là "token trí tuệ nhân tạo" chịu ảnh hưởng nặng nề nhất.

Ứng dụng đó là DeepSeek. Mô hình đằng sau nó, DeepSeek R1, là một mô hình AI mã nguồn mở, giá rẻ, đủ tốt để làm lung lay giả định đang nâng đỡ cả ngành giao dịch AI và một phần lớn tiền điện tử: rằng việc xây dựng trí tuệ nhân tạo mạnh mẽ đòi hỏi vô số chip đắt tiền. Hướng dẫn này giải thích DeepSeek AI thực sự là gì, làm thế nào nó có thể làm được nhiều việc với chi phí thấp như vậy, so sánh nó với ChatGPT ra sao, và tại sao nó lại tạo ra một chấn động mạnh mẽ trong giới token tiền điện tử AI mà đến nay vẫn còn ảnh hưởng.

DeepSeek AI là gì và ai đã tạo ra nó?

DeepSeek là một phòng thí nghiệm trí tuệ nhân tạo của Trung Quốc, nhưng ban đầu nó không phải là một phòng thí nghiệm như vậy. Nó phát triển từ một quỹ đầu cơ, và câu chuyện đó giải thích gần như mọi thứ về cách thức hoạt động của nó.

Từ một quỹ đầu cơ định lượng đến một phòng thí nghiệm trí tuệ nhân tạo

DeepSeek được thành lập vào ngày 17 tháng 7 năm 2023 tại Hàng Châu, Trung Quốc, bởi Liang Wenfeng. Trước đó, Liang đã điều hành High-Flyer, một quỹ đầu cơ định lượng giao dịch trên thị trường bằng máy học và đã tích trữ một lượng lớn GPU Nvidia cho mục đích đó. Khi những con chip này không bận rộn với việc giao dịch, ông hướng chúng vào các mô hình ngôn ngữ. Vì vậy, DeepSeek bắt đầu hoạt động với chi phí tính toán thấp, một nhóm các nhà nghiên cứu và không chịu áp lực từ các nhà đầu tư phải theo đuổi mô hình lớn nhất có thể. Công ty duy trì quy mô nhỏ gọn, chỉ với khoảng 160 nhân viên, và đã học cách tối ưu hóa hiệu quả từ phần cứng. Hiệu quả không phải là một khẩu hiệu tiếp thị. Đó là toàn bộ văn hóa của công ty. Có một điều trớ trêu đáng chú ý. High-Flyer đã tích trữ những con chip đó một phần trước khi các biện pháp kiểm soát xuất khẩu của Mỹ được áp dụng, điều mà sau này đã cắt đứt Trung Quốc khỏi các GPU tốt nhất của Nvidia. Buộc phải làm nhiều hơn với số lượng chip ít hơn và yếu hơn, các kỹ sư của DeepSeek đã trở nên rất giỏi trong việc tiết kiệm, và sự hạn chế đó đã trở thành lợi thế.

Dòng sản phẩm: V3, R1 và V4

DeepSeek ra mắt rất nhanh. DeepSeek Coder ra mắt vào cuối năm 2023, V2 vào tháng 5 năm 2024, và DeepSeek V3 đột phá vào tháng 12 năm 2024. Sau đó là DeepSeek R1 vào ngày 20 tháng 1 năm 2025, mô hình suy luận đã châm ngòi cho sự thành công. Đến tháng 4 năm 2026, phòng thí nghiệm đã giới thiệu trước DeepSeek V4, với V4-Pro và V4-Flash nhẹ hơn, đẩy số lượng cửa sổ ngữ cảnh lên gần một triệu token. Mỗi bản phát hành đều tuân theo cùng một chiến lược: bắt kịp xu hướng, tính phí một phần nhỏ, và cung cấp miễn phí các trọng số.

Công khai trọng số, API và deepseek.com

Phần cuối cùng đó rất quan trọng. Kể từ phiên bản R1, các mô hình của DeepSeek đã được phát hành theo giấy phép MIT khá dễ dãi dưới dạng các bản tải xuống có trọng số mở trên Hugging Face và GitHub. Bất cứ ai cũng có thể tải xuống, kiểm tra, tinh chỉnh hoặc chạy chúng trên máy tính của mình. Bạn cũng có thể sử dụng chatbot miễn phí tại deepseek.com hoặc kết nối với API của DeepSeek với chi phí rất thấp. Trọng số mở cộng với API giá rẻ là một sự kết hợp hiếm có, và đó chính là động lực tạo nên sự đột phá.

tìm kiếm sâu

Cách thức hoạt động thực tế của DeepSeek R1 và V3

Danh tiếng của DeepSeek dựa trên một sự thật đơn giản, nhưng khó tin đối với các đối thủ. Nó có thể sánh ngang với những mẫu máy lớn hơn, đắt tiền hơn nhiều trong khi tiêu thụ ít tài nguyên tính toán hơn. Bí quyết nằm ở kiến trúc – chứ không phải phép thuật.

Sự kết hợp của các chuyên gia và suy luận hiệu quả

DeepSeek V3 có 671 tỷ tham số, nhưng nó không sử dụng tất cả cùng một lúc. Nó là một mô hình kết hợp nhiều chuyên gia, vì vậy với bất kỳ token nào, nó chỉ kích hoạt khoảng 37 tỷ tham số, một số ít "chuyên gia" có liên quan đến nhiệm vụ. Phòng thí nghiệm đã kết hợp điều đó với cơ chế chú ý tiềm ẩn đa đầu (multi-head latent attention), một phương pháp nén bộ nhớ trong quá trình suy luận. Kết quả là một mô hình khổng lồ nhưng hoạt động như một mô hình nhỏ. Ít bộ nhớ hơn, ít năng lượng hơn, chi phí mỗi câu trả lời thấp hơn. Đối với một đối thủ đã chi hàng tỷ đô la với giả định rằng lớn hơn luôn đồng nghĩa với đắt hơn, đây là một bằng chứng không mấy khả quan về mặt khái niệm.

R1, lập luận và chuỗi suy luận

DeepSeek R1 đã bổ sung thêm một thủ thuật thứ hai: nó suy nghĩ bằng lời nói. Giống như OpenAI o1, nó là một mô hình suy luận giải quyết vấn đề từng bước một bằng cách sử dụng chuỗi suy nghĩ trước khi đưa ra câu trả lời. Đó là lý do tại sao nó đạt điểm cao như vậy trong các nhiệm vụ khó khăn. R1 đạt 97,3% trên chuẩn MATH-500 và 79,8% trên AIME 2024, và giải quyết được 49,2% các vấn đề thực tế trên GitHub trên SWE-bench , sánh ngang với những sản phẩm tốt nhất của OpenAI vào thời điểm đó.

Chi tiết về khoản chi phí đào tạo 5,6 triệu đô la Mỹ.

Đây là con số đã gây chấn động internet. Bài báo của chính DeepSeek cho biết quá trình huấn luyện cuối cùng cho V3 tiêu tốn khoảng 5,58 triệu đô la Mỹ cho thời gian xử lý GPU. So với con số 100 triệu đô la Mỹ được nhắc đến rộng rãi cho GPT-4, con số này có vẻ như là một sự sỉ nhục. Nhưng hãy đọc kỹ phần chú thích. Con số đó chỉ bao gồm chi phí cho lần chạy cuối cùng, chứ không bao gồm chi phí nghiên cứu, các thí nghiệm thất bại hay chính các con chip. Các nhà phân tích tại SemiAnalysis ước tính chi phí phần cứng thực tế của DeepSeek cao hơn 500 triệu đô la Mỹ. Tiêu đề vừa chính xác vừa gây hiểu lầm, và đó chính là lý do tại sao nó lan truyền rộng rãi đến vậy.

Mô hình DeepSeek	Phát hành	Kiểu	Ghi chú
DeepSeek V3	Tháng 12 năm 2024	MoE LLM	671B tham số, 37B hoạt động, MIT
DeepSeek R1	Tháng 1 năm 2025	Lý luận	Open-weight, rivaled OpenAI o1
DeepSeek V4	Tháng 4 năm 2026	Gia đình MoE	V4-Pro và V4-Flash, ~1 triệu ngữ cảnh

So sánh DeepSeek AI với ChatGPT, Claude và Gemini.

Vậy DeepSeek có tốt hơn ChatGPT không? Điều đó phụ thuộc vào nhu cầu của bạn. Về toán học, lập trình và khả năng suy luận thô, nó sánh ngang với các mô hình hàng đầu từ OpenAI và Anthropic. Điểm yếu của nó là khả năng xử lý văn bản, đầu vào đa phương thức và độ tin cậy. Các mô hình hàng đầu của DeepSeek chủ yếu chỉ xử lý văn bản, trong khi ChatGPT xử lý hình ảnh, giọng nói và video. Văn bản của OpenAI vẫn mượt mà hơn cho việc viết hàng ngày. Gemini của Google nằm ở giữa, mạnh về đa phương thức và tìm kiếm, nhưng yếu hơn về khả năng truy cập mở. Và đối với nhiều doanh nghiệp phương Tây, yếu tố quyết định không phải là điểm chuẩn mà là độ tin cậy: một mô hình được đào tạo và lưu trữ ở Trung Quốc mang theo những rủi ro mà một mô hình được lưu trữ ở Mỹ không có.

Tiếp theo là vấn đề giá cả, nơi mà sự chênh lệch không hề nhỏ. Bảng dưới đây cho thấy rõ điều đó, và đó là lý do tại sao các nhà phát triển tiếp tục chuyển khối lượng công việc sang API của DeepSeek.

Người mẫu	Đầu vào / 1 triệu token	Tạ mở	Đa phương thức
DeepSeek V3.2	~0,28 đô la	Có (MIT)	KHÔNG
GPT-5.2 (OpenAI)	~1,75 đô la	KHÔNG	Đúng
Claude (Nhân chủng học)	Hạng cao cấp	KHÔNG	Đúng

Đối với văn bản và mã nguồn ở quy mô lớn, DeepSeek có chi phí đầu vào rẻ hơn khoảng sáu lần so với GPT-5.2, và vì các trọng số được công khai nên bạn có thể bỏ qua hoàn toàn API và chạy nó thông qua triển khai cục bộ. Điều đó làm cho DeepSeek trở thành một lựa chọn cực kỳ tiết kiệm chi phí, và là một câu hỏi khó đối với một phòng thí nghiệm khép kín.

Khoảnh khắc DeepSeek làm rung chuyển thế giới tiền điện tử

Marc Andreessen gọi đó là "khoảnh khắc Sputnik của AI". Ông ấy đang nói về niềm tự hào dân tộc, nhưng thị trường lại hiểu theo nghĩa lạnh lùng hơn — có lẽ điều quý giá nhất trong AI rốt cuộc không phải là một kho chip.

589 tỷ đô la biến mất trong một ngày

Khi DeepSeek đứng đầu bảng xếp hạng App Store của Mỹ vào ngày 27 tháng 1 năm 2025, với 16 triệu lượt tải xuống trong 18 ngày đầu tiên, các nhà giao dịch đã tính toán ngược lại. Nếu một phòng thí nghiệm của Trung Quốc có thể đạt được thành tựu tiên tiến với phần cứng chỉ bằng một phần nhỏ so với họ, thì nhu cầu trong tương lai đối với chip của Nvidia đột nhiên trở nên bấp bênh hơn. Cổ phiếu Nvidia đã giảm khoảng 17% trong ngày hôm đó và mất 589 tỷ đô la giá trị thị trường , mức giảm mạnh nhất trong một ngày trong lịch sử Mỹ. Toàn bộ chỉ số Nasdaq cũng bị ảnh hưởng.

Vì sao các token tiền điện tử AI giảm giá mạnh nhất

Thị trường tiền điện tử cũng không tránh khỏi ảnh hưởng. Bitcoin giảm khoảng 7% xuống còn khoảng 97.750 đô la, và hơn 300 tỷ đô la đã rời khỏi toàn bộ thị trường tiền điện tử. Nhưng sự tàn phá thực sự lại nằm ở các token AI. Danh mục này giảm khoảng 9% trong ngày, so với mức giảm khoảng 5% của thị trường chung, với Render giảm 12,6% và Fetch.ai giảm khoảng 10%. Lý do khá khó chịu. Giá trị của nhiều token AI dựa trên cùng một câu chuyện như của Nvidia: AI cần nhiều sức mạnh tính toán, sức mạnh tính toán lại khan hiếm, vì vậy bất cứ thứ gì bán sức mạnh tính toán hoặc GPU đều rất quý giá. DeepSeek đã vạch trần điểm yếu đó, và các token phụ thuộc nhiều nhất vào nó đã chịu tổn thất nặng nề nhất. Bản thân sự sụt giảm không kéo dài; chỉ trong vài ngày, Bitcoin đã phục hồi phần lớn khoản lỗ khi các nhà phân tích cho rằng sự hoảng loạn là phản ứng thái quá. Nhưng lĩnh vực token AI vẫn chao đảo lâu hơn nhiều, một dấu hiệu cho thấy thị trường đang định giá lại toàn bộ câu chuyện, chứ không chỉ đơn thuần là một buổi chiều tồi tệ.

Các token tiền điện tử AI sau DeepSeek

Đây là điểm mấu chốt. Cú sốc tương tự đã giáng mạnh vào các token AI cũng mang lại cho chúng một luận điểm dài hạn hơn. Nếu các mô hình tiên tiến có thể rẻ và mở, thì rào cản của các phòng thí nghiệm lớn khép kín sẽ thu hẹp lại, và cơ sở hạ tầng AI mở, chống kiểm duyệt bắt đầu trở nên có giá trị hơn, chứ không phải ít hơn. Các mạng điện toán phi tập trung như Akash , mạng kết xuất như Render, và thị trường trí tuệ máy móc như Bittensor đều hướng đến một thế giới nơi AI không bị khóa chặt trong ba công ty Mỹ. DeepSeek đã khiến thế giới đó trở nên gần gũi hơn. Bittensor, với token TAO thưởng cho một mạng lưới các mô hình học máy cạnh tranh, là sự đặt cược rõ ràng nhất vào ý tưởng này: một thị trường cho trí tuệ mở thay vì một bộ não doanh nghiệp duy nhất. Liệu các mạng lưới này có thực sự cung cấp được AI cấp độ tiên tiến hay không vẫn chưa được chứng minh, nhưng DeepSeek đã chuyển gánh nặng nghi ngờ sang các phòng thí nghiệm khép kín.

Thị trường đã nhận thấy điều đó. Đến tháng 5 năm 2025, Grayscale đã chính thức thành lập một lĩnh vực tiền điện tử AI chuyên biệt, bao gồm 20 token với tổng giá trị khoảng 21 tỷ đô la , tăng khoảng 4,7 lần so với 4,5 tỷ đô la vào đầu năm 2023. Tuy nhiên, cần phải cẩn thận. Việc ra mắt cũng thu hút những kẻ lừa đảo: chỉ trong một ngày, hơn 75 memecoin "DeepSeek" giả mạo đã xuất hiện, và các nhà giao dịch đuổi theo chúng đã mất hơn 100 triệu đô la . DeepSeek chưa bao giờ ra mắt bất kỳ token nào. Bất cứ điều gì tuyên bố ngược lại đều là một cái bẫy.

tìm kiếm sâu

DeepSeek AI có an toàn để sử dụng không? Các lệnh cấm và quyền riêng tư

Đây là lúc sự thận trọng phát huy tác dụng. Khi sử dụng ứng dụng hoặc trang web chính thức của DeepSeek, dữ liệu của bạn, bao gồm cả các câu hỏi bạn đặt ra, sẽ được gửi đến các máy chủ ở Trung Quốc và được xử lý theo chính sách bảo mật tuân thủ luật pháp Trung Quốc. Một số chính phủ đã cho rằng đây là một vấn đề. Ý đã chặn DeepSeek vào ngày 30 tháng 1 năm 2025 vì lý do bảo vệ dữ liệu. Hơn một chục tiểu bang của Mỹ đã cấm sử dụng DeepSeek trên các thiết bị chính thức cho đến đầu năm 2025, và Quốc hội đã ban hành Đạo luật Cấm DeepSeek trên Thiết bị Chính phủ. Mô hình này cũng phản ánh các quy tắc về nội dung của Trung Quốc, né tránh hoặc làm sạch các chủ đề nhạy cảm về chính trị. Phương pháp của DeepSeek cũng vấp phải sự chỉ trích. Đầu năm 2020, Anthropic cáo buộc phòng thí nghiệm này sử dụng hàng ngàn tài khoản giả mạo để thu thập hàng triệu cuộc hội thoại của Claude cho mục đích huấn luyện, một cáo buộc mà DeepSeek bác bỏ. Câu chuyện về thiên tài tiết kiệm này có một mặt gây tranh cãi.

Điều đó không có nghĩa là bản thân công nghệ này không an toàn để sử dụng. Vì các thông số trọng lượng được công khai, người dùng hoặc công ty quan tâm đến quyền riêng tư có thể tải xuống mô hình và chạy nó cục bộ, mà không có dữ liệu nào rời khỏi hệ thống. Ứng dụng được lưu trữ trên máy chủ mới là rủi ro. Mô hình mở chính là lối thoát.

Hướng dẫn sử dụng DeepSeek AI: triển khai cục bộ

Bạn có ba cách để truy cập. Cách dễ nhất là sử dụng chatbot miễn phí tại deepseek.com hoặc ứng dụng di động, phù hợp cho các câu hỏi thông thường nếu việc đánh đổi quyền riêng tư không làm bạn phiền lòng. Cách thứ hai là sử dụng API của DeepSeek, đủ rẻ để các nhà phát triển có thể chuyển các khối lượng công việc nặng thông qua đó; tài liệu API của DeepSeek sẽ hướng dẫn bạn cách thiết lập, và DeepSeek Coder được tối ưu hóa cho lập trình. Cách thứ ba, và an toàn nhất cho các công việc nhạy cảm, là triển khai cục bộ: lấy các trọng số mở từ Hugging Face hoặc chạy một phiên bản nhỏ hơn thông qua một công cụ như Ollama trên phần cứng của riêng bạn. Cùng một mô hình, nhưng không có nguy cơ lộ dữ liệu. Đối với các câu hỏi thông thường, ứng dụng miễn phí là đủ; đối với bất kỳ ai xử lý dữ liệu riêng tư hoặc được quy định, phương pháp triển khai cục bộ đáng để bạn bỏ thêm công sức thiết lập.

DeepSeek có ý nghĩa gì đối với trí tuệ nhân tạo và tiền điện tử?

Bài học lâu dài từ DeepSeek không liên quan nhiều đến việc Trung Quốc thắng một vòng đấu thầu. Sự thay đổi thực sự là trí tuệ nhân tạo (AI) tiên tiến đã trở nên rẻ và mở cửa nhanh hơn bất kỳ ai dự đoán. Đối với người dùng thông thường, điều đó có nghĩa là các công cụ tốt hơn với chi phí thấp hơn. Đối với các phòng thí nghiệm khép kín, điều đó có nghĩa là rào cản về GPU mỏng hơn so với định giá của họ. Và đối với tiền điện tử, nó có tác động hai chiều: các token AI được xây dựng dựa trên câu chuyện khan hiếm đã bị ảnh hưởng, trong khi những token xây dựng cơ sở hạ tầng AI phi tập trung, mở cửa lại có lý do tồn tại mới. Vì vậy, câu hỏi thực sự không phải là DeepSeek có tốt hay không. Rõ ràng là nó tốt. Câu hỏi là ai sẽ vẫn được trả tiền khi trí tuệ nhân tạo không còn đắt đỏ nữa.

Mathis Curcio

Mathis Curcio is a senior content strategist and NFT specialist at Plisio. With over 5 years of experience in the Web3 space, Mathis focuses on the evolution of NFT ecosystems, digital collectibles, and decentralized ownership models. He creates accessible, insight-driven content that bridges the gap between blockchain innovation and mainstream adoption. His expertise spans NFT market trends, use cases across art and gaming, and the infrastructure powering next-generation tokenized assets.