Как big data может навредить борьбе с пандемией
NASA

Как big data может навредить борьбе с пандемией

Пандемия коронавируса спровоцировала интерес к big data для отслеживания распространения заразного заболевания и планирования мер по его профилактике. Государствам пришлось срочно сосредоточиться на сдерживании вспышки болезни, не задумываясь о том, что «большие данные» могут принести больше вреда, чем пользы.

Компании и правительства по всему миру используют данные о местонахождении миллионов пользователей интернета и мобильных телефонов, чтобы понять, как распространяется вирус и работают ли меры по социальному дистанциированию. В отличие от наблюдения за отдельными людьми, в этом случае анализируются большие наборы данных для того, чтобы выявить закономерности перемещения людей во время пандемии.

В США рекламные компании сотрудничают с Центрами по контролю и профилактике заболеваний, а также с местными и федеральными органами власти, чтобы выяснить, как изменились перемещения людей и где они концентрируются. Google выпускает отчеты о мобильности сообщества, основанные на данных о местоположении пользователей карт Google, чтобы показать, как работают меры по предотвращению распространения Covid-19. Facebook в рамках новой инициативы «Карты профилактики заболеваний»  предоставляет партнерам по исследованиям данные о перемещениях людей для прогнозирования распространения заболеваний и соблюдения мер общественного здравоохранения.

Какими бы многообещающими не казались эти меры, компаниям и правительствам следует задуматься о том, какую угрозу их действия несут правам обычных, малообеспеченных и уязвимых людей.

Эпидемия Эболы в Западной Африке в 2014–2016 гг. — одно из таких предостережений нынешним мерам.  Во время вспышки Эболы, эпидемиологи, работающие в Гарварде, получили записи о вызовах пользователей мобильных телефонов по всему региону, чтобы предсказать распространение вируса и помочь органам здравоохранения улучшить целевые меры по профилактике заболеваний. Но это исследование основывалось на том, что любые перемещения людей были основным направлением передачи вируса Эбола, хотя на самом деле вирус распространялся в основном во время ухода за больными или подготовки похорон.

Исследования перемещений людей по их мобильным телефонам также ставит под сомнение эффективность этого метода при изучении распространения болезней. В Западной Африке у многих людей может быть по несколько телефонов для разных целей: личных, рабочих, и они могут делиться телефонами с семьей, друзьями и даже соседями.

Так поднимается другой вопрос — big data может искажать реальность и иметь опасные последствия для здравоохранения.

В США низкий уровень проникновения соцсетей и мобильных телефонов среди пожилых людей и сельского населения может исказить данные о том, как болезнь распространяется среди разных групп населения. На анализ мобильных данных влияет даже наличие высотных зданий, которые могут исказить сигнал.

Модели мобильности, полученные из данных операторов, мало объясняют то, почему люди продолжают куда-то ездить, несмотря на рекомендации оставаться дома и ограничения транспорта. Слепые зоны big data могут вывести органы общественного здравоохранения на ложный путь, отвлекая от проверенных методов сдерживания эпидемии, таких как повсеместное тестирование. Big data может привести к драконовским ограничениям, которые оказывают слишком большое влияние на жизнь многих людей. В Израиле программа отслеживания местонахождения по мобильным данным вызвала недовольство людей тем, что их ограничивали на основании неточных геолокационных данных.

Возможность big data обуздать вспышку коронавируса неопределена, а риски для нарушения конфиденциальности огромны. Власти и компании из разных стран гарантируют конфиденциальность личных данных, но их несложно деанонимизировать, совместив анонимные данные с общедоступными. Таким образом маршруты перемещения многих людей могут попасть в открытый доступ.

В Google и Facebook утверждают, что их инициативы просто раскрывают совокупную информацию о поведении людей, а не подробные истории местоположений. Хотя агрегирование данных может быть лучшим решением для конфиденциальности, оно должно сопровождаться другими мерами защиты, такими как ограничение на доступ к данным, возможность удаления. Но в технологическом секторе исторически не хватает прозрачности в вопросе обмена данных, из-за чего непонятно, насколько строго применяются гарантии защиты информации.

Разумное доверие к технологиям, основанным на big data, в условиях нынешнего кризиса может улучшить наше понимание болезни, расширить доступ к медицинской помощи и помочь нам оставаться на связи. Но желание применять big data не всегда должно быть «лицензией» на проведение рискованных экспериментов, ставящих под вопрос личную неприкосновенность и гражданские свободы. При том, что контроль над ними может остаться и после конца пандемии.

По материалам Wired