Пандемія коронавірусу спровокувала інтерес до big data для відстеження поширення заразного захворювання і планування заходів щодо його профілактики. Державам довелося терміново зосередитися на стримуванні спалаху хвороби, не замислюючись про те, що «великі дані» можуть завдати більше шкоди, ніж користі.
Компанії та уряди по всьому світу використовують дані про місцезнаходження мільйонів користувачів інтернету і мобільних телефонів, щоб зрозуміти, як поширюється вірус і чи працюють заходи із соціального дистанціювання. На відміну від спостереження за окремими людьми, в цьому випадку аналізуються великі набори даних для того, щоб виявити закономірності переміщення людей під час пандемії.
У США рекламні компанії співпрацюють з Центрами з контролю і профілактики захворювань, а також з місцевими і федеральними органами влади, щоб з’ясувати, як змінилися переміщення людей і де вони концентруються. Google випускає звіти про мобільність спільноти, засновані на даних про місцеперебування користувачів карт Google, щоб показати, як працюють заходи щодо запобігання поширення Covid-19. Facebook в рамках нової ініціативи «Карти профілактики захворювань» надає партнерам з досліджень дані про переміщення людей для прогнозування поширення захворювань і дотримання заходів громадської охорони здоров’я.
Якими б багатообіцяючими не видалися ці заходи, компаніям і урядам слід задуматися про те, яку загрозу їх дії несуть правам звичайних, малозабезпечених та вразливих людей.
Епідемія Еболи у Західній Африці в 2014-2016 рр. — одне з таких застережень нинішнім заходам. Під час спалаху Еболи, епідеміологи, що працюють в Гарварді, отримали записи про виклики користувачів мобільних телефонів по всьому регіону, щоб передбачити поширення вірусу і допомогти органам охорони здоров’я поліпшити цільові заходи щодо профілактики захворювань. Але це дослідження грунтувалося на тому, що будь-які переміщення людей були основним напрямком передачі вірусу Ебола, хоча насправді вірус поширювався в основному під час догляду за хворими або підготовки похорону.
Дослідження переміщень людей по їх мобільним телефонам також ставить під сумнів ефективність цього методу при вивченні поширення хвороб. У Західній Африці у багатьох людей може бути по кілька телефонів для різних цілей: особистих, робочих, і вони можуть ділитися телефонами з сім’єю, друзями і навіть сусідами.
Так піднімається інше питання — big data може спотворювати реальність і мати небезпечні наслідки для охорони здоров’я.
У США низький рівень проникнення соцмереж і мобільних телефонів серед літніх людей і сільського населення може спотворити дані про те, як хвороба поширюється серед різних груп населення. На аналіз мобільних даних впливає навіть наявність висотних будівель, які можуть спотворити сигнал.
Моделі мобільності, отримані з даних операторів, мало пояснюють те, чому люди продовжують кудись їздити, незважаючи на рекомендації залишатися вдома і обмеження транспорту. Сліпі зони big data можуть вивести органи громадської охорони здоров’я на хибний шлях, відволікаючи від перевірених методів стримування епідемії, таких як повсюдне тестування. Big data може привести до драконівських обмежень, які надають занадто великий вплив на життя багатьох людей. В Ізраїлі програма відстеження місцезнаходження по мобільним даним викликала невдоволення людей тим, що їх обмежували на підставі неточних геолокаційні даних.
Можливість big data приборкати спалах коронавірусу невизначена, а ризики для порушення конфіденційності величезні. Влада і компанії з різних країн гарантують конфіденційність особистих даних, але їх нескладно деанонімізувати, поєднавши анонімні дані з загальнодоступними. Таким чином маршрути переміщення багатьох людей можуть потрапити у відкритий доступ.
В Google і Facebook стверджують, що їхні ініціативи просто розкривають сукупну інформацію про поведінку людей, а не докладні історії місцезнаходжень. Хоча агрегування даних може бути кращим рішенням для конфіденційності, воно повинно супроводжуватися іншими заходами захисту, такими як обмеження на доступ до даних, можливість видалення. Але в технологічному секторі історично не вистачає прозорості в питанні обміну даних, через що незрозуміло, наскільки суворо застосовуються гарантії захисту інформації.
Розумна довіра до технологій, заснованих на big data, в умовах нинішньої кризи може покращити наше розуміння хвороби, розширити доступ до медичної допомоги і допомогти нам залишатися на зв’язку. Але бажання застосовувати big data не завжди має бути «ліцензією» на проведення ризикованих експериментів, що ставлять під сумнів особисту недоторканність і громадянські свободи. При тому, що контроль над ними може залишитися і після кінця пандемії.
За матеріалами Wired