Цифрово анонімізовано в 2026: що це означає і як бути

Опубліковано на May 14, 2026 Написано Simon Chartan

Фраза «цифрово анонімізовано» зараз дуже актуальна. Netflix використав її цього року на вступній сторінці документального фільму про справжні злочини. У фільмі обличчя та голоси свідків замінили персонажами зі штучним інтелектом. (Британське написання «digitally anonymized» зустрічається в тому ж контексті для копії, орієнтованої на Велику Британію.) Академічні дослідники використовували ту саму фразу у 2019 році для набору даних про 1,5 мільйона американців. Потім вони повторно ідентифікували 99,98% з них лише за 15 простими атрибутами. Обидва твердження технічно правдиві. Вони також описують радикально різні речі — майже протилежні речі, залежно від того, як ви їх читаєте. Тож, коли хтось каже вам, що обличчя, запис або весь набір даних було цифрово анонімізовано, єдине корисне наступне питання — що вони насправді мають на увазі і проти кого ця анонімізація має витримати.

Що насправді означає «цифрово анонімізовано»

За цим ярликом ховаються дві різні ідеї. Перша — це поверхнева деідентифікація: розмите обличчя, фальшиве ім'я, модулятор голосу, аватар штучного інтелекту. Це приховує когось від глядача, який не намагається копати далі. Друга — статистична анонімізація: набір записів змінюється таким чином, що навіть досвідчений повторний ідентифікатор з публічними даними не може пов'язати рядок з особою. Перша — це жест конфіденційності даних. Друга — це власне конфіденційність даних. Пункт 26 GDPR чітко відображає різницю. Дані є анонімними лише тоді, коли жодні «засоби, які обґрунтовано ймовірно будуть використані», не можуть їх повторно ідентифікувати. HIPAA кодує ту саму ідею як смужку Safe Harbor з 18 ідентифікаторами або експертне рішення про те, що ризик повторної ідентифікації є «дуже малим». Керівництво ICO UK, оновлене у березні 2025 року, називає це тестом на мотивованого зловмисника. Більшість речей, що продаються як «цифрово анонімізовані», проходять перший тест і не проходять другий.

Як на практиці відбувається цифрова анонімізація людей

Індивідуальна цифрова анонімність — це не один перемикач. Це стек. Кожен рівень фіксує один ідентифікатор і залишає інші без змін. Більшість читачів хочуть три чи чотири інструменти, а не один продукт із назвою «анонімайзер».

Мережевий рівень. Ваша IP-адреса – це найдешевший ідентифікатор для витоку та найлегше приховати. Tor залишається найсильнішим варіантом на мережевому рівні, маючи приблизно 2,5 мільйона користувачів щодня та інфраструктуру з близько 8000 волонтерських ретрансляторів станом на середину 2025 року, згідно з Tor Metrics. Комерційний VPN – це легша альтернатива; близько 32% дорослих у США використовували його у 2025 році, порівняно з 46% роком раніше, згідно з Security.org, а глобальні VPN-додатки налічують приблизно 147 мільйонів користувачів. Tor обробляє моделі загроз на рівні штатів. VPN обробляє вашого інтернет-провайдера, роботодавця та Wi-Fi у кав’ярні. Ці два вирішують різні проблеми.

Шар браузера. Виберіть браузер, налаштування якого за замовчуванням передбачають агресивну мережу: Brave, LibreWolf, Mullvad Browser або Tor Browser для найпереконливіших випадків. Захист від відбитків пальців та блокування реклами тут важливіші, ніж приватне вікно, яке приховує лише локальну історію від когось, хто користується вашим ноутбуком.

Рівень ідентифікації. Електронна пошта – це найкорисніший ідентифікатор, який може зібрати трекер, оскільки він об’єднує профілі брокерів даних у різних сервісах. Виправлення полягає у створенні псевдонімів для кожного сервісу через SimpleLogin (придбаний Proton у квітні 2022 року, який на той момент мав понад 100 000 користувачів та 2 мільйони псевдонімів) або addy.io. Додайте ім’я користувача для кожного сервісу та віртуальний номер телефону для SMS-перевірки, і найпростіше міжсайтове приєднання стане неактивним.

Платіжний рівень. Біткойн більше не є інструментом конфіденційності. Chainalysis стверджує, що може відстежувати практично весь торговий рівень; частка злочинців у обсягах блокчейну впала з приблизно 70% до приблизно 20% саме тому, що слідчі регулярно деанонімізують блокчейни. Monero — єдина велика криптовалюта, про яку Chainalysis публічно заявляє, що не може відстежувати у великих масштабах. Технічною причиною є стек кільцевих підписів CLSAG (кільця з 16 учасників: один справжній підписант, 15 пасток), приховані адреси та приховування суми RingCT. Ціна — ліквідність. Binance глобально делістингувала XMR у вересні 2024 року, а Kraken вивів її з Європейської економічної зони до 31 грудня 2024 року, завершивши хвилю делістингу з 60 бірж у 2024 році та близько 73 до середини 2025 року. Незважаючи на стиснення, до кінця 2025 року ринкова капіталізація Monero становила близько 7,6 мільярда доларів, а щоденна кількість транзакцій становила близько 28 000, а ціна у травні 2026 року становила близько 411 доларів. Торговці, які хочуть приймати криптовалюту, не змушуючи покупців проходити KYC, можуть використовувати некастодіальні шлюзи. Наприклад, Plisio підтримує понад 50 монет з комісією 0,5%, порівняно зі знижкою продавців у 2-3%, типовою для карткових рейок.

Гігієна пристрою та облікового запису. Немає облікових записів, у яких ви ввійшли, у сеансі конфіденційності. Окремі профілі для окремих ідентифікаторів. Стек працює лише за умови, що ви не скасуєте його, увійшовши в той самий обліковий запис Gmail на всіх пристроях.

Шар	Що воно приховує	Найкращий у своєму класі інструмент	Номер 2025-2026 років
Мережа	Видимість IP-адреси, маршруту та інтернет-провайдера	Tor / Mullvad VPN / Proton VPN	Tor ~2,5 млн користувачів щодня, 147 млн VPN-додатків по всьому світу
Браузер	Відбитки пальців, трекери, телеметрія	Brave / LibreWolf / Браузер Mullvad	Хоробрий 100 млн активних користувачів (вересень 2025 р.)
Ідентичність	Приєднання до електронної пошти, повторне використання телефону	ПростийВхід / addy.io	SimpleLogin понад 100 тис. користувачів, понад 2 млн псевдонімів
Оплата	Відбиток пальця для витрат, KYC	Monero / Plisio без права зберігання	Щоденний оборот Monero ~28 тис., ліміт $7,6 млрд
Обліковий запис	Міжсервісне зв'язування	Ідентифікаційні дані для кожної служби, без єдиного входу	—

Чому «анонімізовані» набори даних постійно переідентифікуються

Академічні досягнення невтішні. Звільнення від імен майже ніколи не буває достатнім.

Рік	Набір даних / подія	Результат повторної ідентифікації
1997 рік	Звільнення лікарні GIC у штаті Массачусетс	Латанья Суїні визначає послужний список губернатора Вільяма Велда, використовуючи публічні списки виборців
2000 рік	Перепис населення США 1990 року	Суїні показує, що 87% американців унікальні за {ZIP, DOB, sex}
2006 рік	Журнали пошуку AOL (20 млн запитів / 650 тис. користувачів)	NYT ідентифікує користувача 4417749 як Тельму Арнольд протягом 5 днів; технічний директор йде у відставку.
2008 рік	Приз Netflix (480 189 підписників)	Нараянан і Шматіков: 99% записів можна ідентифікувати за допомогою 8 оцінок + 14-денних дат
2013 рік	1,5 млн абонентів мобільного зв'язку	де Монжуа: 4 просторово-часові точки однозначно ідентифікують 95% користувачів
2014 рік	Набір даних таксі Нью-Йорка	Номери медальйонів, хешовані за допомогою MD5, перевернуто менш ніж за 2 хвилини; реконструйовано поїздки знаменитостей
2016 рік	Прес-реліз австралійського Medicare та PBS	Повторна ідентифікація 3 чинних депутатів та гравця AFL протягом 5 тижнів; набір даних вилучено
2018 рік	Глобальна теплова карта Strava	~13 трильйонів точок GPS виявили периметри військових баз в Іраку, Сирії та Афганістані
2019 рік	Роше, Хендрік, де Монжуайе	99,98% американців правильно повторно ідентифікуються за 15 демографічними ознаками
2026 рік	Netflix «Розслідування Люсі Летбі»	Обличчя та голоси ШІ, застосовані до свідків; лише візуальна анонімізація

Схема повторюється. Видавець видаляє очевидні ідентифікатори, стверджує, що набір даних анонімізований, а дослідник з публічним допоміжним джерелом (списки виборців, IMDB, фотографії папараці, довідники роботодавців) знову об'єднує ці два дані, і справжні особи стають очевидними протягом кількох тижнів.

Справа AOL у серпні 2006 року стала першим широко висвітленим випадком повторної ідентифікації в реальному світі, а історії пошуку виявилися квазі-ідентифікаторами самі по собі. Запитів Тельми Арнольд про «онімілі пальці», «60 самотніх чоловіків» та її рідне місто Лілберн, штат Джорджія, було достатньо, щоб два репортери New York Times знайшли її на ґанку. Троє співробітників AOL, включаючи технічного директора, залишилися без роботи протягом кількох тижнів.

Премія Netflix Prize, започаткована в жовтні 2006 року, опублікувала близько 100 мільйонів оцінок від 480 189 підписників для 17 770 фільмів. Нараянан і Шматіков опублікували свою статтю про деанонімізацію на IEEE S&P 2008. Маючи лише дві оцінки та триденний період перегляду, вони змогли однозначно ідентифікувати 68% підписників. Маючи вісім оцінок та чотирнадцятиденний період перегляду, ця цифра зросла до 99%. Netflix скасував заплановане продовження у 2010 році після позову Доу проти Netflix та розслідування FTC.

Документальний фільм про Люсі Летбі, випущений як документальний фільм Netflix у лютому 2026 року, є версією того ж уроку для споживача. Вступна картка з назвою говорить: «Деякі учасники були цифрово замасковані для збереження анонімності. Їхні імена, зовнішність та голоси були змінені». Метод анонімізації тут є генеративний ШІ, а не розмиття чи силует, частково мотивований свідками, яким потрібно було виконати судові накази, що обмежували їхню публічну видимість. Реакція аудиторії розділилася між скаргою на використання ШІ в дивній долині та захистом, що аватар ШІ зберігає людські емоції краще, ніж чорна скринька. Обидва не враховують глибшу суть. Використання ШІ для візуальної анонімізації ніяк не впливає на поведінкові відбитки в самих свідченнях: фразування, дати, названі посадові ролі. Мотивований зловмисник, якому надаються анонімізовані дані та короткий список кандидатів, все ще має з чим працювати. ШІ змінив вигляд результату. Він не змінив математику повторної ідентифікації.

Диференціальна конфіденційність та єдина чесна анонімізація

Фреймворк, який витримав атаки де Монжуа, — це диференціальна конфіденційність. Дворк, МакШеррі, Ніссім та Сміт визначили її у 2006 році у своїй статті «Калібрування шуму до чутливості в аналізі приватних даних». Ідея полягає не в тому, щоб позбутися ідентифікаторів. Ідея полягає в тому, щоб додати ретельно налаштований шум до результатів запиту, щоб присутність або відсутність будь-якої особи в даних була статистично заперечуваною.

Він постачається з кількісним бюджетом конфіденційності, епсілон (ε). Нижчий епсілон означає більше шуму та сильнішу конфіденційність. Підготовкою до диференціальної конфіденційності була послідовність слабших фреймворків. k-анонімність, запропонована Суїні у 2002 році, вимагає, щоб кожен запис виглядав так само, як принаймні k-1 інших на квазіідентифікаторах. l-різноманітність (Machanavajjhala et al. 2007) додала обмеження на різноманітність чутливих атрибутів. t-близькість (Li et al. 2007) посилила розподіл. Всі три є евристичними. Тільки диференціальна конфіденційність дає математичну гарантію найгіршого випадку проти довільних допоміжних даних.

Результати розгортання неоднозначні. Apple оголосила про локальну диференціальну конфіденційність на WWDC 2016, але аудит зворотного проектування показав, що її налаштування епсилон коливаються від 2 до 8, що дослідники конфіденційності вважають слабким. Бюро перепису населення США застосувало диференціальну конфіденційність до релізу 2020 року за допомогою свого алгоритму TopDown з глобальним ε близько 19,61. Це число викликало власну критику за те, що воно занадто слабке, але перепис населення 2020 року був першим національним релізом, який взагалі мав будь-яку формальну гарантію конфіденційності. Якщо у заяві про «цифрову анонімізацію» не вказано епсилон — або принаймні ak чи at — це майже напевно старіший тип із 18 ідентифікаторними смужками, а не формальний.

Люсі Летбі, аватари зі штучним інтелектом та цифрова анонімізація

Документальний фільм про Люсі Летбі є найбільш обговорюваним прикладом «цифрової анонімізації обличчя» на початку 2026 року не без причини. Документальний фільм розповідає про британську медсестру-неонатолога, засуджену за сім вбивств, і викликає дедалі більше питань щодо можливої судової помилки. Рішення Netflix замінити обличчя та голоси свідків аватарами, згенерованими штучним інтелектом, має вагу не лише у справі. Реакція аудиторії розділилася. Один табір назвав аватари відволікаючими, «схожими на мультфільми», моторошними. Інший захищав цю техніку, оскільки вона зберігає людські емоції, які силует або лише голосова обробка приглушили б.

Що в дебатах здебільшого пропущено, так це модель загрози. Обличчя, створене штучним інтелектом, — це UX-накладання. Воно не захищає джерело від компетентного мотивованого зловмисника, який уже має список кандидатів (інші співробітники того ж відділення тієї ж лікарні за ті ж дати) та стенограму, що містить дати, професійні ролі та фрази. Справа Люсі Летбі з публічно названою установою та публічною хронологією має і те, й інше. Чим вужчий пул джерел, тим менше ви можете отримати завдяки накладенню штучного інтелекту. Це не аргумент проти цього методу. Це аргумент на користь чіткого визначення того, що він анонімізує, а що ні.

Цифрово анонімізовано

Що вимагає закон від «цифрово анонімізованих» заяв

Три регулятори встановлюють нижню межу на більшості ринків. GDPR ЄС, правила HIPAA США щодо медичних даних та рекомендації британського ICO 2025 року. Пункт 26 GDPR встановлює тест «обґрунтовано ймовірних засобів». HIPAA пропонує або смужку «Безпечної гавані» з 18 визначених ідентифікаторів, або експертний висновок про те, що залишковий ризик повторної ідентифікації є «дуже малим». ICO UK підтвердила тест на мотивованого порушника у березні 2025 року.

Найбільший юридичний зсув за минулий рік відбувся завдяки Суду Європейського Союзу. У справі C-413/23, EDPS проти SRB, винесеній 4 вересня 2025 року, Суд ЄС прийняв відносну теорію персональних даних. Один і той самий запис може бути псевдонімним в руках однієї сторони та анонімним в руках іншої, залежно від того, що кожна сторона може обґрунтовано знати. Це значущий поворот. До 2025 року за замовчуванням, яке просували де Монжуй та інші, багаті дані завжди є персональними даними, оскільки можливості повторної ідентифікації не мають реальних обмежень. У рішенні 2025 року йдеться про контекстуальне рішення. Обидві точки зору можуть співіснувати; практичний ефект полягає в тому, що сторони, що працюють нижче за течією, мають більше можливостей стверджувати, що їхня копія набору даних є анонімною, навіть якщо копія оригінального видавця не була такою.

Контрольний список: чи дійсно дані анонімізовані цифровим способом?

П'ять запитань, які варто поставити собі, перш ніж сприймати ярлик серйозно:

1. Які ідентифікатори було видалено? Одних лише імен недостатньо. Демографічні дані, позначки часу та рідкісні атрибути зберігаються в кожній смугі «Безпечної гавані» та залишаються ідентифікованою інформацією.

2. Які допоміжні дані є в розумних межах доступними? Списки виборців, IMDB, фотографії папараці, довідники роботодавців. Враховується все, до чого можна приєднатися.

3. Чи існує формальна гарантія? k-параметр анонімності, число t-близькості або епсилон диференціальної конфіденційності. Немає числа — немає гарантії.

4. Хто підтвердив твердження? Внутрішня команда або зовнішній аудитор на основі визначеної моделі загрози мотивованого порушника.

5. Які є засоби правового захисту у разі повторної ідентифікації? Цифрово анонімізований набір даних, який виявляється недійсним, є витоком, а не прес-релізом.

Чесне тлумачення терміну «цифрово анонімізовано» у 2026 році полягає в тому, що він охоплює дві непов'язані між собою речі одночасно. Як обіцянка UX (ми не покажемо ваше обличчя) це добре, іноді елегантно, іноді погано виконано. Як статистичне твердження (цей набір даних анонімний) це майже завжди недостатньо без формальної гарантії. Створюйте окремий стек, припускаючи, що мітка виконує лише половину роботи, яку вона передбачає. Вимагайте математики, коли мітка знаходиться на чиїхось даних.

Simon Chartan

A journalist with a strong technical background and a passion for decentralized finance. With degrees in MBA and Master of Engineering in Data Science, the author combines analytical expertise with a clear, engaging writing style. At Plisio, they cover topics such as cryptocurrency, blockchain, DeFi, and digital finance—helping readers make sense of a rapidly evolving fintech landscape.