Big data is watching you. «Всё, что вы постите, может быть использовано против вас»

Павел Свердлов
В Европе «большие данные» уже давно стали темой для эдакой камерной «паранойи для тех, кто понимает». А для Беларуси ни угрозы, ни пользы от big data словно не существует.

Дочь моей хорошей знакомой — пятиклассница — в истерике звонит маме: «Дай 550 тысяч! Очень нужно». Мама, конечно же, интересуется, на что. «Заплатить штраф!», — объявляет девочка. Какой штраф? На мамин телефон падает копия сообщения, которое пришло дочери две минуты назад (скрин сообщения в колонке слева – прим. KYKY).

Вы нарушили закон! Гей-порно! Уголовный кодекс! Это мы, взрослые, знаем, что уведомления о штрафах не приходят сообщениями в соцсетях. А дети, вся жизнь которых проходит в интернете? Многие из них ни разу не держали в руках бумажного письма. Конечно, они страшно пугаются и принимают всё за чистую монету. Мысль о том, что они никак не могут быть виноваты в перечисленных злодеяниях, страх задвигает куда-то на задворки сознания. Да что дети: до того, как этот вирус был описан в сети, многие взрослые велись и перечисляли деньги — от греха подальше. Гей-порно? Ну мало ли, по пьяни...

А теперь давайте представим: в руки преступников попала база телефонных номеров, которые принадлежат детям.

Скажете, это невозможно? Да ладно: дети очень часто указывают в соцсетях свои номера телефонов. В том, чтобы написать скрипт, который их собирает, нет ничего нереального. А дальше — напуганный ребёнок пойдёт к терминалу и перечислит на номер, по которому обещают спасение, столько, сколько есть в карманах. Или перезвонит по указанному телефону, соединение с которым стоит нереальных денег.

«Никогда не замечали, что реклама, которую показывает вам Facebook, рифмуется с вашими мыслями?»

В детстве нас учили не разговаривать с незнакомцами. Но незнакомцы с тех пор стали намного изобретательнее. Им больше не нужно, чтобы с ними разговаривали. Достаточно просто наследить в сети. Моя подруга из Epam, которая живёт и работает в Германии, говорит по этому поводу: «Всё, что вы запостите, может быть использовано против вас». Только вот, собирая досье на вас, никто не будет зачитывать вам пятую поправку.

А досье-то уже готово. Вы никогда не замечали, что реклама, которую показывает вам Facebook, рифмуется с вашими мыслями?

Кадр из фильма "Социальная сеть"

Меня это в своё время дико бесило. Только что вернулись из Юрмалы, где снимали домик через booking.com — и на тебе, на каждой странице реклама этого домика. Как бы объяснить ребятам, которые знают обо мне больше, чем я хотел бы, что я уже побывал в Юрмале и больше туда пока что не собираюсь, а об этом домике знаю гораздо больше, чем они? А никак.

Собственно, в big data нет ничего плохого. Это лишь сухие факты о каждом из нас: родился тогда-то, учился тому-то, живёт там-то, покупает то-то.

Проблема в том, что никто не знает, как они будут или могут быть использованы. Возможные варианты не всегда связаны с криминалом. Один швейцарский стартап совместно со Swisscom разрабатывал карту покупателей для сети местных супермаркетов. О том, куда люди уезжают с покупками, можно узнать по тому, в каких сотах их телефоны зарегистрированы по ночам. Результаты иногда были очень странными: например, в одном из магазинов регулярно закупались жители отдалённого кантона, в то время как местные его практически ингорировали. Ритейлер переработал свои подходы к маркетингу. Где-то добавил рекламы, а где-то поработал с властями, чтобы открыть удобные для покупателей рейсы общественного транспорта. Хуже от этого никому не стало. Разве что — конкурентам этой торговой сети.

Говорят, хороший инструмент хорош только для того, кто им владеет. В первый же день продаж миллион пользователей надел на руки Apple Watch — хитроумный прибор, который собирает данные, в том числе, и о здоровье человека. Кто, кроме самого человека, заинтересован в сведениях о его сердечном ритме и количестве шагов, которые он проходит за день? Безусловно, это страховые компании, которые теперь могут оценивать свои риски с атомной точностью.

А минские поликлиники, к примеру, переходят на электронную очередь. Насколько хорошо защищены данные о том, кто и к какому врачу записан в декабре? Надеюсь, что хорошо, и что до обработки этих сведений никогда не доберутся ушлые поставщики лекарств, гомеопатических препаратов и дорогих приборов, которые лечат всё — и ничего.

Преступление «больших цифр»

Но цели охотников за данными могут быть и не такими безобидными. Однажды директор eQualit.ie Дмитрий Витальев показал мне, как работает программа по взлому пароля от почтового ящика. Программа, кстати, простая, как пять пальцев: в одно поле вводится нужный e-mail, в другое — всё, что известно о его владельце. Имя и фамилия, год рождения, адреса, телефоны, любимые цветы и цвета, данные о родителях, супруге, детях, друзьях, клички домашних животных... После запуска процесса программа очень быстро пробует все возможные комбинации.

Тех, кто использует пароли из случайных последовательностей букв, цифр и других символов, достать такой программой практически нереально. А остальные рискуют. Отдыхаешь ты, к примеру, в Турции. А все твои контакты получают от тебя письмо: «проклятые турки» утащили из номера весь кэш, не в службу, а в дружбу, кинь сотку баксов на такой-то счёт, а я здесь обналичу... И свежее, ещё пахнущее йодом и морской солью селфи с пляжа в приложении. Кто-то не поверит. Кто-то сделает вид, что не прочитал письмо. А кто-то сделает перевод.

Кадр из клипа "Bitch Better Have My Money". Rihanna

Big data прирастают экспоненциально. То, что мы сегодня называем большими данными, лет через десять будет считаться лёгкой разминкой. Источник сведений о человеке — огромное количество подключенных к сети девайсов, составляющих так называемый «Интернет вещей». А критерий «величины» данных таков: если они легко обрабатываются на вашем лэптопе — это не большие данные!

Big data способны были бы до неузнаваемости изменить любую отрасль белорусской промышленности — кроме, пожалуй, продовольственной и ковровой.

Первая и так чутко реагирует на тренды, а вторую в наших краях не поборет ничто, кроме времени. Впрочем, хочет ли белорусская промышленность знать о потребительских трендах, которые могли бы её изменить?

Следя за каждым кликом пользователя, Большой Брат думает, что в состоянии заглянуть этому пользователю в душу. Очень часто кажется, что он и вправду знает, какие ботинки мы хотим купить и какое телешоу жаждем увидеть. Но для того, чтобы преобразовать «большие» исходные данные в полезные сведения и идеи, нужен высокоскоростной анализ. Который может привести к ошибкам, насколько бы точно он ни был выстроен, если «хорошие» данные не отделить от статистического шума. При этом нужно учесть, как на результаты анализа повлияют «плохие» данные, отсечь которые не удастся.

Паранойя для избранных

Всё это очень сложно, и анализ данных давно превратился в отдельную науку. Как обычно, чтобы извлечь из чего-то пользу, которая хотя бы кажется общественной, нужно приложить гораздо больше усилий, чем для того, чтобы напугать девочку. Поэтому нам всем следует быть осторожными и с детства приучать детей не сорить номерами телефонов. В Европе, говорит моя подруга из Epam, big data уже давно стали поводом для эдакой камерной «паранойи для тех, кто понимает». Думаешь об этом — и понимаешь, что есть свои преимущества в том, чтобы жить в стране, где промышленность регулируется сверху, а Apple Watch — одни на 10 тысяч человек. Да, это я так съязвил, а вы что подумали?

Заметили ошибку в тексте – выделите её и нажмите Ctrl+Enter