Американские учёные из Корнеллского университета разработали систему искусственного интеллекта, которая по постам и лайкам пользователей в Facebook довольно точно определяет, страдают ли они зависимостью от табака, наркотиков или алкоголя, пишет «Популярная Механика». Максимальная точность программы при вычислении курения составила 86%, употребления наркотиков — 84%, алкоголя — 81%.
Статистика гласит, что каждый десятый американец старше 12 лет страдает от той или иной зависимости, при этом исследователи нашли определенную связь между чертами личности и склонностью к каким-либо привычкам. К примеру, считается, что курящие более открыты к общению и получению нового опыта, но менее дисциплинированны и целеустремлены. Люди, употребляющие алкоголь, чаще всего являются экстравертами, да и вообще, социально активными личностями.
Что касается Facebook, то здесь учёные нашли определённые корреляции между содержанием постов, интересами пользователей и зависимостью, от которой они страдают (наслаждаются?).
Нейросеть вычислила, что любители алкоголя и табака чаще используют слова, связанные с движением, а вот наркоманы частенько применяют слова, имеющие отношение к агрессивным действиям. Публикации с лишними пробелами, многочисленными предлогами и словами «девушки», «женщины», скорее всего, принадлежат пользователям, злоупотребляющим алкоголем, в то время как слова, «ненависть», «убивать», «клиника» и «таблетки» положительно коррелируют с употреблением наркотиков.
Система умеет распознавать привычки по музыкальным и кинематографическим предпочтении. Людям, часто употребляющим спиртные напитки, нравятся фильмы «V — значит вендетта» и «Святые из Бундока», а любители психоактивных веществ слушают группы Radiohead, The Cure и Depeche Mode. Хороший вкус.
Чтобы научить нейросеть распознавать наркоманов и алкоголиков, исследователи применили алгоритм машинного обучения. Алгоритм использовал три базы данных, собранных в период с 2007 по 2012 годы специальным приложением myPersonality для психологических тестов. Первая база содержала 21 миллион записей 100 тысяч пользователей Facebook, вторая — 5 миллионов лайков 250 тысяч пользователей, а в третьей хранилась информация о наличии зависимостей у 13,5 тысяч пользователей. Для обучения нейросети эти наборы данных компилировались различным образом.