Tác nhân người dùng ngẫu nhiên: Tại sao nên xoay vòng và khi nào thì nó phản tác dụng

Tác nhân người dùng ngẫu nhiên: Tại sao nên xoay vòng và khi nào thì nó phản tác dụng

Hầu hết những người thiết lập user agent ngẫu nhiên đều muốn ẩn danh. Họ cài đặt một bộ chuyển đổi, chọn "xoay vòng sau mỗi năm phút" và cho rằng họ vừa khiến việc theo dõi bản thân trở nên khó khăn hơn. Đôi khi điều đó đúng. Nhưng thường thì ngược lại. User agent là dòng văn bản ngắn mà trình duyệt của bạn gửi đến mọi trang web để tự giới thiệu, và một user agent được chọn ngẫu nhiên có thể nổi bật hơn nhiều so với user agent thật nhàm chán. Máy chủ có lý do chính đáng để đọc kỹ dòng văn bản đó: các bot tự động hiện chiếm phần lớn lưu lượng truy cập web, vì vậy user agent là điều đầu tiên mà một trang web kiểm tra để đoán xem bạn là người hay là một chương trình máy tính.

Hướng dẫn này sẽ giải thích user agent thực sự tiết lộ điều gì, "ngẫu nhiên" thực sự có nghĩa là gì, khi nào việc xoay vòng user agent thực sự hữu ích và những trường hợp nó âm thầm gây bất lợi cho bạn.

Chuỗi User Agent cho trang web biết điều gì.

User agent là một tiêu đề HTTP, một chuỗi ký tự duy nhất mà trình duyệt của bạn đính kèm vào mỗi yêu cầu. Nó trông giống như một lời giới thiệu vụng về. Một chuỗi điển hình của Chrome trông như thế này: `Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36`. Ẩn sâu trong mớ hỗn độn đó là một lượng thông tin đáng ngạc nhiên về thiết bị của bạn.

Máy chủ đọc chuỗi ký tự đó để quyết định gửi lại thông tin gì. Trình duyệt trên thiết bị di động sẽ nhận được giao diện dành cho thiết bị di động của trang web; trình duyệt cũ hơn có thể nhận được phiên bản đơn giản hơn của trang web. Đó là nhiệm vụ hợp pháp. Chuỗi ký tự đó cũng cho trang web biết bạn đang sử dụng trình duyệt nào, phiên bản nào và hệ điều hành nào, và đó chính là phần quan trọng đối với việc theo dõi.

Mã thông báo Ví dụ giá trị Điều nó tiết lộ
Sản phẩm Mozilla/5.0 Mã thông báo tương thích cũ, trên hầu hết mọi trình duyệt
Nền tảng Windows NT 10.0; Win64; x64 Hệ điều hành và kiến trúc của bạn
Động cơ AppleWebKit/537.36 Công cụ kết xuất
Trình duyệt Chrome/124.0.0.0 Tên và phiên bản trình duyệt
Gợi ý thiết bị iPhone; CPU iPhone OS 17_4 Trên thiết bị di động, lớp thiết bị

Tất cả những điều này không giúp bạn nhận diện được tên tuổi. Nhưng khi kết hợp với mọi thông tin khác mà một trang có thể chứa, nó trở thành một dòng nữa trong một lời thú tội dài.

User Agent ngẫu nhiên là gì và cơ chế xoay vòng hoạt động như thế nào?

Một user agent ngẫu nhiên không phải là một chuỗi ký tự vô nghĩa. "Ngẫu nhiên" ở đây có nghĩa là luân phiên chọn một tập hợp các chuỗi user agent thực tế, phổ biến thay vì gửi cùng một chuỗi mỗi lần. Tập hợp này rất quan trọng: một công cụ tốt sẽ chọn từ các chuỗi hiện tại, được sử dụng rộng rãi để mỗi lần chọn đều giống với một khách truy cập thông thường, chứ không phải một trình duyệt được tạo ra không tồn tại.

Có ba nhịp điệu phổ biến cho việc xoay vòng chuỗi. Xoay vòng theo yêu cầu thay đổi chuỗi trên mỗi lần gọi, phù hợp với trình thu thập dữ liệu liên tục truy cập API. Xoay vòng theo phiên giữ nguyên một chuỗi trong suốt phiên duyệt web, giống với người dùng thực không chuyển đổi trình duyệt giữa chừng. Xoay vòng theo khoảng thời gian, mô hình mà hầu hết các tiện ích chuyển đổi trình duyệt sử dụng, tự động chọn một chuỗi mới sau mỗi vài phút hoặc khi khởi động trình duyệt.

Nhịp điệu bạn muốn sử dụng hoàn toàn phụ thuộc vào mục tiêu. Một công cụ thu thập dữ liệu muốn trông giống như hàng nghìn người dùng khác nhau. Một người quan tâm đến quyền riêng tư muốn trông giống như một người dùng bình thường. Đó không phải là cùng một mục tiêu, và sự xoay vòng giúp ích cho mục tiêu này có thể làm lộ điểm yếu của mục tiêu kia. Sự căng thẳng đó xuyên suốt phần còn lại của hướng dẫn này.

tác nhân người dùng ngẫu nhiên

Tiện ích mở rộng và trình chuyển đổi trình duyệt Random User Agent

Đối với hầu hết mọi người, user agent ngẫu nhiên xuất hiện dưới dạng tiện ích mở rộng của trình duyệt. Bạn cài đặt nó, và từ đó trở đi, nó sẽ giả mạo tiêu đề user agent thay mặt bạn, thay thế bằng một chuỗi khác nhau với mỗi yêu cầu hoặc theo một lịch trình nhất định.

Tiện ích mở rộng chuyển đổi giữa Chrome và Firefox

Tiện ích nổi tiếng nhất có tên đơn giản là Random User-Agent. Nó là mã nguồn mở, nhẹ và hoạt động trên Chrome, Firefox, Edge và Opera. Riêng phiên bản Chrome đã có hơn 100.000 người dùng và xếp hạng 4,6 sao, cho thấy nhu cầu lớn đối với thay đổi nhỏ này. Bạn cài đặt nó từ Chrome Web Store, và tiện ích mở rộng sẽ thay thế user agent thực của bạn bằng một user agent được chọn ngẫu nhiên từ kho user agent của nó, tự động cập nhật theo lịch trình bạn thiết lập.

Có một công cụ phổ biến thứ hai, User-Agent Switcher and Manager, thiên về điều khiển thủ công: bạn chọn một chuỗi cụ thể cho mỗi trang web từ cửa sổ bật lên trên thanh công cụ, hữu ích để kiểm tra cách trang web hoạt động trên các thiết bị khác nhau.

Chức năng thực sự của các cài đặt là gì?

Phần cài đặt là nơi các tiện ích mở rộng này phát huy tác dụng, và cũng là nơi người dùng thường đánh giá sai chúng. Một trình chuyển đổi trình duyệt điển hình cho phép bạn thiết lập khoảng thời gian tự động thay đổi, lưu giữ danh sách ngoại lệ để các trang web đáng tin cậy luôn thấy trình duyệt thực của bạn, và cung cấp danh sách tác nhân người dùng tùy chỉnh. Nhiều trình chuyển đổi cũng cung cấp cài đặt bảo vệ JavaScript, cố gắng làm cho các tập lệnh trên trang nhìn thấy cùng một trình duyệt giả mạo mà tiêu đề khai báo, thay vì bắt lỗi trình duyệt thực bên dưới.

Về vấn đề bảo mật, các tiện ích mở rộng uy tín đều minh bạch. Chính sách bảo mật của Random User-Agent nêu rõ rằng họ chưa bao giờ và sẽ không bao giờ thu thập dữ liệu cá nhân hoặc lịch sử duyệt web. Vấn đề không nằm ở sự trung thực của tiện ích mở rộng — mà là việc thay đổi chuỗi user agent không làm thay đổi hàng tá tín hiệu khác mà một trang web đọc được, và đó là nơi bắt đầu rắc rối.

Xoay vòng User Agent để thu thập dữ liệu web

Trong lĩnh vực thu thập dữ liệu tự động (scraping) , việc sử dụng user agent ngẫu nhiên thực sự là công cụ hữu hiệu. Khi bạn thu thập hàng nghìn trang dữ liệu, user agent không còn là vấn đề về quyền riêng tư mà trở thành vấn đề sống còn.

Vì sao một tác nhân người dùng duy nhất lại khiến bạn bị chặn

Máy chủ ưu tiên nhận dạng user agent trước tiên vì đây là tín hiệu rẻ nhất để kiểm tra. Nếu có hàng nghìn yêu cầu đến trong một phút đều mang cùng một chuỗi ký tự, thì mẫu hình sẽ rất rõ ràng và việc chặn sẽ diễn ra nhanh chóng. Áp lực ngày càng gia tăng: lưu lượng truy cập tự động đã chiếm phần lớn các yêu cầu web vào năm 2025, và riêng việc thu thập dữ liệu bằng AI đã tăng gấp mười lăm lần trong năm đó. Trong số đó, các hệ thống chống bot độc hại mà họ muốn ngăn chặn nhất chiếm gần 37% tổng lưu lượng truy cập, theo báo cáo về bot độc hại của Imperva , đó là lý do tại sao việc kiểm tra user agent đơn giản hiện đang được áp dụng ở hầu hết mọi trang web quan trọng. Các trang web đã phản ứng bằng cách thắt chặt chính xác các bước kiểm tra mà một user agent tĩnh đơn lẻ không vượt qua được. Thị trường công cụ phản ánh tầm quan trọng của vấn đề, với thị trường phần mềm thu thập dữ liệu web trị giá hơn một tỷ đô la vào năm 2025.

Phù hợp với phần còn lại của yêu cầu

Xoay vòng user agent là giải pháp tiêu chuẩn, và tất cả các công cụ phổ biến đều hỗ trợ nó. Thư viện Python fake-useragent cung cấp các chuỗi user agent mới; middleware Scrapy, Selenium và Puppeteer đều có thể thay đổi user agent cho mỗi yêu cầu hoặc mỗi phiên. Nhưng đây là phần khiến người mới bắt đầu bối rối: user agent chỉ là một trong nhiều header. Nếu bạn xoay vòng user agent để giả mạo Chrome trên Windows trong khi các header khác, quá trình bắt tay TLS và môi trường JavaScript của bạn vẫn hiển thị "automation script", thì bạn đã không hòa nhập được. Bạn chỉ đang tự tạo ra một vòng tròn bao quanh mình. Xoay vòng chỉ hoạt động khi toàn bộ yêu cầu phù hợp với thông tin mà user agent cung cấp.

Khi một tác nhân người dùng ngẫu nhiên xâm phạm quyền riêng tư của bạn

Điều cốt lõi tưởng chừng như trái ngược với trực giác là: liệu việc ngẫu nhiên hóa user agent có thể khiến việc theo dõi danh tính trực tuyến của bạn dễ dàng hơn chứ không phải khó hơn? Thường thì là có.

Toán học entropy

Các nhà nghiên cứu về quyền riêng tư đo lường khả năng nhận dạng bằng bit entropy, trong đó càng nhiều bit thì giá trị càng hiếm và càng dễ nhận dạng. Theo Tổ chức Biên giới Điện tử ( EFF), riêng user agent đã chứa trung bình khoảng 10,5 bit, có nghĩa là chỉ khoảng 1 trong 1.500 trình duyệt có cùng một chuỗi ký tự. Đó đã là một lượng thông tin nhận dạng rất lớn chỉ trong một tiêu đề. Nghiên cứu rộng hơn của EFF cho thấy 84% trình duyệt có dấu vân tay hoàn toàn độc nhất khi kết hợp user agent với một số tín hiệu có thể đọc được khác. User agent không phải là toàn bộ dấu vân tay, nhưng nó chiếm một phần lớn trong đó.

Cái bẫy của sự nhất quán

Giờ hãy thêm yếu tố ngẫu nhiên vào đó. Một trang web không chỉ đọc phần tiêu đề; JavaScript trên trang còn đọc thông tin hiển thị trên canvas, dữ liệu WebGL, phông chữ, múi giờ và kích thước màn hình của bạn. Những thông tin này không thay đổi khi tiêu đề thay đổi. Vì vậy, nếu tác nhân người dùng của bạn đột nhiên hiển thị là iPhone Safari trong khi mọi tín hiệu khác vẫn cho thấy đó là Windows desktop, thì bạn không hề che giấu được mà đã tạo ra một sự mâu thuẫn mà không thiết bị thực nào có thể tạo ra. Hệ thống phát hiện rất thích điều đó. Một nghiên cứu năm 2024 về lưu lượng truy cập bot né tránh cho thấy việc kiểm tra sự không nhất quán của dấu vân tay đã giảm gần một nửa số lần bot né tránh thành công. Một tác nhân người dùng liên tục thay đổi trên một thiết bị mà các đặc điểm khác không bao giờ thay đổi không phải là ngụy trang; nó giống như một ánh đèn nhấp nháy. Đó là lý do tại sao Trình duyệt Tor làm điều hoàn toàn ngược lại với việc ngẫu nhiên hóa: nó gửi một tác nhân người dùng giống hệt nhau cho mọi người dùng, để không ai nổi bật.

Tiếp cận Ẩn chuỗi UA Phù hợp với các tín hiệu khác Hòa mình vào đám đông
UA thực cố định đơn lẻ KHÔNG Đúng Phần nào đó
Gia hạn UA ngẫu nhiên Đúng KHÔNG KHÔNG
Dấu vân tay chống phát hiện hoàn toàn Đúng Đúng Vâng, theo từng hồ sơ
Tor uniform UA KHÔNG Đúng Đúng vậy, đó là thiết kế.

Chrome và Tor đang chấm dứt trò chơi User Agent như thế nào?

Bản thân các nền tảng đã quyết định từ nhiều năm trước rằng user agent là một định danh không tốt, và họ đã tiếp cận vấn đề này từ hai hướng trái ngược nhau.

Google đã thực hiện một dự án kéo dài nhiều năm có tên là Giảm thiểu User-Agent , hoàn thành từ Chrome 113 năm 2023. Chrome hiện đã cố định các phần chi tiết của chuỗi User-Agent: phiên bản phụ được báo cáo là 0.0.0 và kiểu máy Android được rút gọn thành "K" chung chung. Dữ liệu chi tiết hơn đã được chuyển sang một hệ thống mới hơn, có yêu cầu quyền truy cập, được gọi là Gợi ý máy khách User-Agent, trong đó một trang web phải yêu cầu thông tin chi tiết thay vì tự động đọc chúng. Mục tiêu rõ ràng là thu nhỏ User-Agent như một bề mặt theo dõi thụ động.

Phạm vi tiếp cận của Chrome càng làm nổi bật vấn đề này. Với khoảng 70% thị phần trình duyệt toàn cầu thuộc về 2026, chuỗi ký tự cố định của nó hiện là thứ mà một phần lớn người dùng thực sự gửi đi, vì vậy việc bắt chước nó sẽ khiến bạn hòa lẫn vào đám đông khổng lồ trong khi việc chọn ngẫu nhiên các chuỗi ký tự khác lại có tác dụng ngược lại.

Tor đã chọn con đường khác. Thay vì rút gọn chuỗi ký tự, nó chuẩn hóa chuỗi đó, cung cấp cho mọi người dùng Tor cùng một user agent để tiêu đề không tiết lộ bất cứ điều gì phân biệt người này với người khác. Cả hai cách tiếp cận đều đồng ý về bài học mà một người chuyển đổi ngẫu nhiên bỏ lỡ: bạn ẩn mình bằng cách trông giống mọi người khác — chứ không phải bằng cách trông không giống ai cả.

tác nhân người dùng ngẫu nhiên

Việc sử dụng thuật toán ngẫu nhiên có giúp tăng cường quyền riêng tư trực tuyến của bạn không?

Câu trả lời ngắn gọn: thường thì không. Đối với việc duyệt web hàng ngày, việc thay đổi user agent ngẫu nhiên hiếm khi giúp tăng cường quyền riêng tư trực tuyến của bạn, và thậm chí có thể gây hại một phần. Nó chỉ làm cho một tín hiệu bị nhiễu trong khi phần còn lại của dấu vân tay kỹ thuật số của bạn vẫn hoàn toàn ổn định. Muốn ít trình theo dõi hơn? Một trình duyệt được thiết kế chuyên dụng, như Tor hoặc Firefox được tăng cường bảo mật, sẽ làm được nhiều hơn là chỉ thay đổi header.

Việc quét dữ liệu đảo ngược hoàn toàn cách tính toán. Ở đó, việc xoay vòng không phải là tùy chọn, mà là toàn bộ yếu tố quyết định, nhưng chỉ khi là một phần của yêu cầu mà các tiêu đề, thời gian và môi trường trình duyệt đều kể một câu chuyện duy nhất. Cùng một công cụ, nhưng kết quả lại trái ngược. Tất cả phụ thuộc vào mục đích thực sự bạn đang cố gắng đạt được.

Những điều mà một tác nhân người dùng ngẫu nhiên có thể và không thể làm

Một user agent ngẫu nhiên là công cụ sắc bén cho việc này nhưng lại cùn cho việc khác. Nó xoay vòng dòng duy nhất mà máy chủ kiểm tra đầu tiên, điều này chính xác là những gì việc thu thập dữ liệu quy mô lớn cần và chính xác là những gì quyền riêng tư thông thường không cần. Sai lầm là coi một tiêu đề như một lớp ngụy trang — trong khi nó chỉ là một dòng trong một câu lệnh dài hơn nhiều mà trình duyệt của bạn thực hiện trên mỗi trang. Nếu bạn muốn ẩn mình, hãy hòa nhập: khớp với mọi tín hiệu hoặc tham gia vào một đám đông trông giống nhau. Nếu bạn muốn thu thập dữ liệu, hãy xoay vòng tự do, nhưng hãy đảm bảo phần còn lại của yêu cầu cũng kể cùng một câu chuyện. Vì vậy, trước khi cài đặt trình chuyển đổi tiếp theo, hãy tự hỏi câu hỏi thực sự: bạn muốn trông giống mọi người, hay không giống ai cả?

Bất kỳ câu hỏi?

Điều đó phụ thuộc vào mục đích của bạn. Đối với việc thu thập dữ liệu web, việc thay đổi user agent là một phương pháp tiêu chuẩn và thực sự hữu ích. Tuy nhiên, đối với quyền riêng tư cá nhân, nó thường phản tác dụng. Một user agent thay đổi trên một thiết bị mà các tín hiệu khác không hề thay đổi sẽ tạo ra sự không nhất quán, và sự không nhất quán đó khiến bạn nổi bật hơn là hòa nhập.

Điều đó hoàn toàn có thể. Thông tin user agent chỉ là một trong hàng tá tín hiệu mà một trang web đọc được. Việc chỉ thay đổi ngẫu nhiên thông tin đó, trong khi bố cục, phông chữ, múi giờ và kích thước màn hình vẫn giữ nguyên, sẽ tạo ra một sự mâu thuẫn mà các trình duyệt thực tế không bao giờ gặp phải, và các hệ thống phát hiện sử dụng chính sự không khớp đó để gắn cờ bạn.

Không nhiều lắm. Việc hòa nhập đòi hỏi toàn bộ dấu vân tay phải trông bình thường, chứ không chỉ riêng tác nhân người dùng. Nếu canvas, WebGL và phông chữ của bạn đã độc nhất, thì một chuỗi tác nhân người dùng phổ biến sẽ không giúp ích được nhiều, vì các trình theo dõi kết hợp tất cả các tín hiệu lại với nhau thay vì chỉ tin tưởng vào tiêu đề.

Một tập hợp các chuỗi ký tự thực, hiện tại, được xoay vòng theo từng phiên hoặc từng yêu cầu và được ghép nối với các tiêu đề phù hợp cùng môi trường trình duyệt thực. Thư viện cụ thể không quan trọng như mọi người nghĩ. fake-useragent, Selenium, Puppeteer, tất cả đều hoạt động, miễn là mọi phần của yêu cầu đều khớp với user agent bạn cung cấp.

Thông thường là có. JavaScript có thể đọc trực tiếp công cụ hiển thị, các tính năng được hỗ trợ và đặc điểm phần cứng của bạn, thường làm lộ trình duyệt thực sự ngay cả khi tiêu đề user agent nói ngược lại. Các trình chuyển đổi chỉ dựa trên tiêu đề mà không có sự bảo vệ của JavaScript đặc biệt dễ bị phát hiện.

Việc thay đổi user agent của chính bạn là hợp pháp và an toàn; bạn chỉ đang chỉnh sửa một tiêu đề mà trình duyệt gửi đi. Vấn đề pháp lý phát sinh từ việc bạn làm gì với nó. Việc thu thập dữ liệu từ một trang web vi phạm điều khoản dịch vụ hoặc luật pháp địa phương là một vấn đề riêng biệt so với hành động giả mạo chuỗi ký tự vô hại.

Ready to Get Started?

Create an account and start accepting payments – no contracts or KYC required. Or, contact us to design a custom package for your business.

Make first step

Always know what you pay

Integrated per-transaction pricing with no hidden fees

Start your integration

Set up Plisio swiftly in just 10 minutes.