Анализ больших данных в психологии и социогуманитарных науках: перспективные направления исследований
Анализ больших данных в психологии и социогуманитарных науках: перспективные направления исследований
Аннотация
Код статьи
S020595920007306-2-1
Тип публикации
Статья
Статус публикации
Опубликовано
Авторы
Нестик Тимофей А. 
Должность: Заведующий лабораторией социальной и экономической психологии
Аффилиация: ФГБУН Институт психологии РАН
Адрес: Москва, Ул. Ярославская, д. 13
Журавлев А. Л.
Должность: научный руководитель Института психологии РАН
Аффилиация: ФГБУН Институт психологии РАН
Адрес: Российская Федерация
Выпуск
Страницы
5-17
Аннотация

Рассматриваются результаты сбора и учета больших данных, характеризующих реальное поведение людей, а также последствия влияния больших данных на общество, социальные науки и психологическое знание. Формулируется определение понятия “большие данные”. Анализируются психологические исследования с использованием больших данных: их вторичный анализ; краудсорсинговые проекты и сопоставление “цифровых следов” пользователей социальных сетей с их ответами на стандартизированные методики; исследования психологических феноменов с применением “цифровых следов” и алгоритмов машинного обучения без проведения опросов; естественные эксперименты и сбор данных c помощью носимых электронных устройств. Отдельное внимание уделяется психологическому профилированию личности по “цифровым следам”. Предложены перспективные направления исследований динамики социально-психологических феноменов на личностном, межличностном, групповом и макросоциальном уровнях с использованием автоматизированного анализа естественного языка и изображений. Намечены психологические и социальные риски, связанные с внедрением в повседневную жизнь общества технологий анализа больших объемов данных.

Ключевые слова
Большие данные, “цифровые следы” личности, визуальные данные, социальные сети, групповая динамика, макропсихологические показатели, риски.
Источник финансирования
Исследование выполнено по гранту РНФ №18-18-00439
Классификатор
Получено
24.10.2019
Дата публикации
21.11.2019
Всего подписок
70
Всего просмотров
851
Оценка читателей
0.0 (0 голосов)
Цитировать   Скачать pdf
1 АНАЛИЗ “ЦИФРОВЫХ СЛЕДОВ” ЧЕЛОВЕКА: НОВЫЕ ВОЗМОЖНОСТИ ДЛЯ СОЦИОГУМАНИТАРНЫХ НАУК
2 Формирование “интернета всего”, накопление “цифровых следов” индивидуальной и совместной жизнедеятельности в сети людей сегодня ставит перед социогуманитарными науками задачу нового описания всей социальной действительности на основе данных о реальном поведении людей [2, 12]. Не только в социальных науках, но и в гуманитарном знании – истории, археологии, культурной антропологии, лингвистике, теории литературы и искусствоведении – анализ больших данных позволяет обнаружить закономерности, ранее невидимые глазу исследователя [13].
3 Ключевые отличия больших данных от традиционных “малых данных” в психологии и социогуманитарных науках сводятся к тому, что они огромны по объему и, как правило, не могут быть обработаны на персональном компьютере; они меняются в режиме реального времени и часто требуют изменения алгоритмов обработки; они разнообразны по составу, включают государственную статистику, тексты и метаданные, одним словом, требуют агрегирования совершенно разных по структуре массивов информации, что затрудняет использование универсального алгоритма их получения и анализа.
4 Для сбора “цифровых следов” используются программы-краулеры, автоматически отыскивающие и скачивающие данные по заданным критериям, а при изучении социальных сетей – приложения, которые подключаются через интерфейс Twitter, Facebook, ВКонтакте и других сетей (API — Application Programming Interface), в том числе различные автоматизированные опросы, предоставляющие мгновенную обратную связь респондентам. В психологических исследованиях для анализа больших данных используют, в основном, статистические пакеты R и, реже, Python. Используется логистический регрессионный анализ, “деревья” решений, иерархический кластерный анализ и др. Хотя некоторые методы анализа, предполагающие разбиение всей совокупности данных на независимые выборки с последующим мета-анализом полученных результатов, допускают использование также и привычных инструментов, таких как SPSS. Для определения эмоциональной окрашенности текстов и выделения лингвистических маркеров психологических характеристик используются специальные программы, например, Linguistic Inquiry and Word Count, или Text Analysis, Crawling and Interpretation Tool, а также другие психолингвистические анализаторы [14].
5 Вместе с распространением технологий Big Data и “интернета всего” меняются скорость, масштабы и методы сбора данных в психологических исследованиях [30]. Радикально меняется относительная доступность для изучения четырех типов данных, выделенных Р. Кеттелом, а именно: L-данных (объективных фактов о жизни и поведении) и T-данных (результаты тестов) становится гораздо больше, чем Q-данных (опросников, основанных на самоотчетах респондентов) и O-данных (оценок человека другими знающими его людьми). Семантический анализ SMS, интернет-запросов и постов в сетях, а также обработка “цифровых следов”, которые человек оставляет в реальном мире, соприкасаясь с сетью электронных устройств, не говоря уже о показаниях сенсора движения в смартфоне и триангуляции его положения по системам GPS, – все это уже сегодня позволяет оценивать некоторые психологические характеристики человека более точно, чем с помощью стандартизированных психологических опросников [32]. В мире интернета вещей вся жизнь человека становится цифровой, доступной для наблюдений и диагностики – со всеми вытекающими отсюда позитивными и негативными последствиями. При этом появляется возможность не только судить о прошлом человека, но и предсказывать его поведение. В связи с тем, что фокус внимания исследователей смещается с объяснения поведения на его прогнозирование, некоторые эксперты говорят о возможности преодоления кризиса воспроизводимости результатов психологических исследований с помощью больших данных [28].
6 Следует признать, что использование больших данных в научных психологических исследованиях затруднено целым рядом барьеров.
7 Во-первых, большой объем данных создает иллюзию их полноты, тогда как на самом деле они не обеспечивают репрезентативности и регулярности охвата. Например, они могут не учитывать характеристики людей, отсутствующих в социальных сетях; при лингвистическом анализе алгоритм может не читать какой-то части текстов, тогда как мы считаем корпус полным [7].
8 Во-вторых, алгоритмы соотнесения цифровых следов с социально-демографическими и психологическими характеристиками, как правило, являются коммерческой тайной, что затрудняет не только воспроизводимость полученных результатов, но и стандартизацию процедур обработки данных. Разработка таких алгоритмов финансируется компаниями для решения узко направленных маркетинговых или управленческих задач, которые не требуют комплексной психологической диагностики, соблюдения строгих критериев надежности и научно обоснованной интерпретации. В итоге создаются выборки, учитывающие в основном демографические показатели или построенные на популярных типологиях личности, а у программистов возникает иллюзия того, что нейросеть сама найдет все необходимые маркеры, поэтому психологов привлекать к этому не следует.
9 В-третьих, платформы, обрабатывающие большие данные, периодически изменяют алгоритмы расчета, что приводит к ошибкам вмоделях прогнозирования, а также при сборе и обработке таких разнородных данных нередко имеют место смещение выборки, ошибки измерений, ложные корреляции и т.п.
10 В-четвертых, формулировка задач и интерпретация аналитиком результатов анализа больших данных не свободны от множества когнитивных искажений, некоторые из них становятся даже более вероятными, чем при работе с малыми данными. Безусловно, анализ больших данных расширяет возможности количественных методов проверки психологических гипотез. Вместе с тем, обращение психологов к Big Data повышает востребованность качественных методов анализа и теоретического обоснования полученных результатов. Не случайно перспективы использования больших данных в социогуманитарных науках связывают с необходимостью дополнять их качественными, например, этнографическими исследованиями.
11 В-пятых, большие данные не бывают абсолютно “сырыми”, они хранятся с определенной целью, включены в систему политических и экономических отношений, содержат преднамеренные и непреднамеренные пропуски. Иными словами, надежные психометрические алгоритмы не защищают исследователя от искаженных данных [28].
12 В-шестых, еще одним ограничением являются этические и юридические проблемы, связанные с использованием больших данных в психологических исследованиях. Соблюдение принципа информированного согласия в таких исследованиях не всегда возможно, а традиционное обезличивание данных не исключает возможности идентификации личности по совокупности цифровых следов, что заставляет в ряде случаев прибегать к шифрованию и уникальным ключам, чтобы ограничить использование данных. Ограничения, накладываемые этическими комитетами социальных сетей на доступ исследователей к данным, не всегда действенны. Так, например, в 2018 г. получил известность и продолжение скандал, связанный с использованием больших данных во время президентских выборов в США (2016 г.), в чем была уличена компания “Cambridge Analytica, специализирующаяся на психологическом профилировании по цифровым следам. Появление владельцев данных (интернет-гигантов, социальных сетей, банков, страховых компаний, платежных систем и т.п.), которые, возможно, знают своих пользователей лучше, чем они сами, создает целый ряд этических и социальных проблем, не говоря о фобиях слежения в интернете, которыми тоже придется заниматься психологам.
13 Наконец, еще один барьер связан с тем, что анализ больших данных – задача, посильная только междисциплинарным командам, состоящим из психологов, лингвистов, программистов и математиков. На наш взгляд, освоение больших данных психологами затруднено не только необходимостью обучения дополнительным навыкам [17], но и относительной замкнутостью исследовательского психологического сообщества.
14 ПСИХОЛОГИЧЕСКИЕ ИССЛЕДОВАНИЯ С ИСПОЛЬЗОВАНИЕМ БОЛЬШИХ ДАННЫХ
15 На наш взгляд, по дизайну исследования работы психологов с использованием больших данных можно разделить на четыре основных группы. Во-первых, исследования, опирающиеся на вторичный анализ уже собранных и структурированных данных. Во-вторых, краудсорсинговые проекты, позволяющие собрать очень большие выборки участников исследования [23], а также сопоставить “цифровые следы” пользователей социальных сетей с их ответами на стандартизированные опросники [8]. В-третьих, это исследования психологических феноменов, использующие “цифровые следы” и алгоритмы машинного обучения, которые позволяют анализировать неструктурированные текстовые и визуальные данные без проведения опросов (см., например, [18]). В-четвертых – исследования, в которых сбор данных организован как естественный эксперимент [41] или, например, c помощью очков расширенной реальности, смартфонов и планшетов.
16 Благодаря социальным сетям и инструментам краудсорсинга, таким как “Механический турок” компании “Amazon”, психологам стало легче собирать большие выборки. К давно открытым многолетним базам социологических опросов, таким как “World Values Survey”, “International Social Survey”, “European Social Survey” и “Eurobarometer” (см.:http://www.re3data.org), добавляются новые, собственно психологические (например, “Journal of Open Psychology Data”, “Cognitive Economics Project”, “International Teston Risk Attitude” и др.). Например, в “Experience Project”, – социальной сети, существовавшей с 2007 по 2016 гг., – хранится 66 миллионов жизненных историй и описаний различных эмоциональных переживаний, составленных ее участниками. “Speech Home Project” содержит 200 тыс. часов записей речи детей до 3 лет. Объем данных, накопленных когнитивными психологами и нейробиологами в рамках проекта “Human Connect to me Project”, приближается к петабайту. На сайте myPersonality.org были собраны и до недавнего времени находились в открытом доступе более 6 миллионов результатов тестов (в том числе 3.1 млн. результатов по тесту Big5) вместе с 4 млн. личных страниц в Facebook. Доступность психологических данных растет вместе с переходом психологии к модели “Открытая наука”. Все больше журналов требуют размещения в открытом доступе баз с сырыми данными, а такие как “Cortex”, “Attention Perception & Psychophysics”, “AIMS Neuroscience” и “Experimental Psychology” – даже предварительной публикации и одобрения дизайна исследования до проведения эксперимента.
17 Наибольшую известность получили исследования поведения пользователей сетевых сообществ [16] и социальных сетей [1], а также психологическое профилирование личности по цифровым следам на основе модели “Большой пятерки”, быстро взятое на вооружение в политических, маркетинговых и корпоративных проектах [3, 8].
18 Технологии анализа цифровых следов как маркеров психологических характеристик были разработаны при изучении сообщений блогеров в Twitter и опирались преимущественно на компьютерную лингвистику. Прорывом в этой области стало сопоставление личных страниц в Facebook с ответами их владельцев на стандартизированные психологические опросники, осуществленное в рамках проекта MyPersonality.org, работы Психометрического центра Кембриджского университета и проекта “World Well-Being Project” Центра позитивной психологии Университета Пенсильвании. Начав в 2007 г. с рассылки приглашения 150 друзьям в социальной сети, М. Косинский и Д. Стилвелл за четыре года методом снежного кома собрали более 6 миллионов участников исследования [30]. Уже к 2013 г. им удалось обеспечить прогностическую валидность отметок “like” для шкал пятифакторной модели личности Big Five до 0.43, а при оценке политических убеждений и социально-демографических характеристик коэффициенты составляли от 0.7 до 0.9 [29]. Проведенный в 2017 г. мета-анализ исследований, посвященных связи цифровых следов с “Большой пятеркой”, показывает, что их предсказательная сила колеблется от 0.29 для доброжелательности до 0.40 для экстраверсии, то есть не уступает стандартизированным опросникам [19]. Разработаны алгоритмы, позволяющие судить об уровне интеллекта, удовлетворенности жизнью, склонности к самораскрытию и самомониторингу, ценностных ориентациях личности и характеристиках временной перспективы.
19

Для психологического профилирования личности используются не только лингвистические маркеры и сетевой анализ, но и фотографии, размещенные на страницах Instagram и Facebook, видеозаписи, аудиозаписи речи, видеоблоги и датчики движения в смартфонах. Для получения цифровых маркеров психологических характеристик исследователи, как правило, совмещают: 1) компьютерный анализ текста при помощи систем автоматизированного распознавания речи и невербального поведения (чаще всего LIWC); 2) самоотчеты испытуемых и экспертные оценки, в том числе кодирование данных экспертами; 3) машинное обучение. Растущее количество видеокамер в городах и совершенствование алгоритмов автоматизированного распознавания психологических состояний по поведенческим индикаторам превращают анализ потокового видео в наиболее перспективное направление психометрических исследований [28].

20

Сетевой и автоматизированный анализ естественного языка позволяет изучать психологические феномены без проведения опросов. В качестве иллюстрации возможностей и ограничений такого подхода можно привести исследования распространения лжи в социальных сетях. Например, команда специалистов из Массачусетского университета проанализировала 120 000 новостей, которыми 4.5 млн. раз поделились 3 млн. пользователей Twitter в 2006–2017 гг.[44]. Сообщения были разделены на правдивые и ложные с опорой на 6 независимых фактчекинговых организаций. После выявления и устранения сообщений, сгенерированных ботами, оказалось, что ложные новости отличаются большей новизной, распространяются в 6 быстрее и в 10 раз шире, чем правда. Исследование показало, что в основе распространения дезинформации в сети лежат психологические закономерности массового сознания, а не только злой умысел “фабрик троллей”. Ложные новости были связаны с лингвистическими маркерами удивления, страха и отвращения в перепостах, а правдивые новости – с предвосхищением, досадой, радостью и доверием. При этом авторы исследования признают необходимость проведения интервью и экспериментов для интерпретации полученных данных. Еще одним примером исследования, проведенного без использования опросов, на этот раз в области клинической психологии, стало определение депрессии и склонности к суициду по цифровым следам. Исследователи отобрали три группы интернет-форумов, две из которых включали сообщества людей, проходящих лечение депрессивных расстройств, а также сообщества, для которых характерна идеализация смерти. Третья, контрольная группа была представлена нейтральными форумами, посвященными женской и мужской тематике, карьере и профессиональному развитию. Автоматизированный анализ текстов показал, что на форумах первых двух групп в 3 раза чаще используется абсолютистская лексика, то есть такие слова, как “всегда”, “никогда”, “совсем” и т.п. [18].

21 Известным примером экспериментального психологического исследования, основанного на сборе больших данных, стал проект, в котором зрительное восприятие изучалось с помощью игры в мобильном приложении. Пользователи должны были “просвечивать” сканером багаж пассажиров в аэропорту, что позволило зафиксировать более миллиарда зрительных реакций. При этом исследователям не только удалось изучить, как влияют отвлекающие внимание раздражители на восприятие редко предъявляемых стимулов, но и динамику процесса тренировки внимания [34]. Как правило, при проведении таких экспериментов исследователи не раскрывают свои цели участникам. Например, в январе 2012 г. исследователи из Корнельского университета провели эксперимент среди 689 003 пользователей сети Facebook. Для изучения эмоционального заражения они манипулировали доступностью контента пользователям: те, кому были более доступны негативные сообщения друзей, сами чаще писали негативно окрашенные тексты [31]. Поскольку интернет-пользователи не всегда в полной мере отдают себе отчет в том, что являются участниками эксперимента, использование этого метода остается дискуссионным по этическим соображениям.
22 Проведенный Институтом психологии РАН экспертный опрос, посвященный будущему психологии, свидетельствует о том, что революция больших данных долгое время оставалась практически не замеченной в российском исследовательском сообществе [4]. Тем не менее, специально проведенный анализ базы Web of Science показал, что за последние 5 лет число психологических исследований с использованием Big Data выросло в 20 раз [6]. Сегодня большие данные все более активно используются не только в кибер- и медиапсихологии, но и в психиатрии, исследованиях памяти, внимания и зрительного восприятия[26], организационной и экономической психологии [39]. Благодаря новым открытым базам данных расширяются возможности для оценки эффективности тех или иных методов лечения в психиатрии [43], совместный анализ больших данных в психогенетических исследованиях проливает свет на новые закономерности [27]. Анализ социальных сетей позволяет выявлять цифровые маркеры суицидальных состояний, шизофрении, тревожныхи депрессивных расстройств [36]. В организационной психологии на основе данных о реальном поведении членов малой группы открывается не только возможность для разработки новых методов оценки кандидатов при приеме на работу, но и для исследования того, как групповые феномены (внутригрупповое доверие, сплоченность, групповые представления и ментальные модели) влияют на совместную деятельность [25].
23 В настоящее время оценку индивидуальных психологических характеристик по цифровым следам можно, в целом, считать решенной научной задачей, что не отменяет необходимости уточнения соответствующих моделей для русскоязычного кластера интернета [9]. На наш взгляд, фундаментальный прорыв необходим и может быть достигнут в другой области – при прогнозировании динамики межличностных и групповых психологических и макропсихологических (характерных для общества) феноменов на основе цифровых следов реального поведения.
24 ПЕРСПЕКТИВНЫЕ НАПРАВЛЕНИЯ СОЦИАЛЬНО-ПСИХОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ НА ОСНОВЕ БОЛЬШИХ ДАННЫХ
25

В этой части статьи хотелось бы наметить несколько перспективных направлений исследования динамики социально-психологических процессов с использованием анализа больших данных.

26 Во-первых, накапливающиеся на протяжении жизни человека цифровые следы становятся важным источником информации о динамике социально-психологических характеристик личности. На личностном уровне социально-психологического анализа лингвистические маркеры постов в социальной сети, тематика групп, на которые подписан пользователь, а также граф его контактов могут указать на изменения в характеристиках социальной идентичности, ценностных ориентациях, а также в социальных ролях в сетевых сообществах. Например, с цифровыми следами могут быть сопоставлены выявленные на основе самоотчетов интернет-пользователей роли в сетевом сообществе, такие как “творец”, “защитник”, “тролль”, “наставник”, “посредник”, “наблюдатель”, “собеседник”, “актер”, “манипулятор”, “друг” [15]. Появляется возможность для уточнения моделей многих социально-психологических процессов: формирования ценностных ориентаций, вторичной социализации, социального сравнения и относительной депривации, формирования социального капитала личности и др.
27 Анализ цифровых следов открывает путь к решению задачи, трудно реализуемой через самоотчеты респондентов – определению связи динамики социально-психологических характеристик личности с изменениями в макропсихологических характеристиках общества (о макропсихологии [см.: 10, 5]). Такого рода работы уже появились. Например, исследование, проведенное среди 380 тыс. жителей Англии и Уэльса, показало, что в тех регионах страны, которые во время индустриальной революции пережили подъем и затем спад угольной промышленности, до сих пор сохраняются более низкие показатели сознательности и удовлетворенности жизнью, но более высокие показатели невротизма, тревоги и депрессии [37].
28 Во-вторых, относительно мало разработанной, но все более актуальной становится проблема прогнозирования динамики межличностных процессов по цифровым следам. Внимание исследователей до сих пор было сосредоточено в основном на изучении личностных характеристик интернет-пользователей. Между тем, на межличностном уровне и уровне малых групп семантический анализ текстов сообщений, мониторинг структуры социальной сети и интенсивности обмена сообщениями в мессенджерах делает возможным оценку и прогнозирование стадий развития межличностных отношений. Со временем можно ожидать появления облачных сервисов, которые будут предлагать семьям и парам, связанным романтическими отношениями, не только оценку их совместимости, но и прогноз потенциальных конфликтов, развитие эмоционального интеллекта и сензитивности к состояниям друг друга на основе мониторинга их сетевой активности. В последние годы появилось множество сайтов и мобильных приложений, обещающих своим пользователям подбор потенциальных партнеров на основе больших данных (eHarmony, Hinge, Whos Here, Skout, Tinder и др.). При этом эксперименты показывают, что сообщение пользователям об их совместимости действует как самосбывающееся пророчество вне зависимости от того, насколько они в действительности совместимы [40]. Согласно исследованию использования больших данных в сфере романтических отношений, проведенному eHarmony совместно с Лондонским имперским колледжем, в ближайшие 10 лет для оценки совместимости и изучения межличностных отношений будут все больше использоваться “умные вещи” – от носимых гаджетов до умных домов [24]. Эта динамично развивающаяся область прикладных разработок, часто сомнительных с точки зрения обоснованности исходных предположений и интерпретации данных, остается вне зоны внимания серьезных академических исследователей.
29 В-третьих, анализ цифровых следов, накопленных проектными командами и организациями в ходе совместной деятельности, открывает путь к изучению групповой динамики и влияния групповых феноменов на результаты совместной деятельности. Первые шаги в этом направлении уже делают разработчики корпоративного программного обеспечения. Так, например, Microsoft Delve строит графы связей между сотрудниками и анализирует содержание всех коммуникаций в интегрированной среде Microsoft – в том числе посредством мессенджера Yammer; сервис Trust Vault оценивает структуру социальной сети, лидерское поведение и уровень внутригруппового доверия на основе анализа переписки сотрудников; Syndio позволяет проводить опросы среди сотрудников и сопоставлять их данные с сетевой активностью, измеряя таким образом отношение к работодателю. А приложения Mood Metrix и Attitude Heat map, разработанные компанией Keen Corp в партнерстве с Omniscien Technologies, на основе психолингвистического анализа электронной почты и мессенджеров,оценивают эмоциональное состояние коллектива и вовлеченность сотрудников. Динамику эмоционального состояния можно ежедневно отслеживать на уровне всего коллектива, отдельного департамента и даже конкретной команды, состоящей минимум из 10 участников. Разработчики программы утверждают, что личная информация полностью защищена: данные анонимизируются, тексты сообщений кодируются и обрабатываются в агрегированном виде. Сопоставление цифровых следов в корпоративных мессенджерах и социальных сетях с результативностью проектных команд, экспертными оценками руководителей и данными опросов сотрудников позволяет разработать алгоритм, на основе которого можно будет не только оценивать социально-психологический климат в коллективе, но и прогнозировать успешность проектных команд.
30 Анализ текстов поможет глубже понять целый ряд групповых процессов, находящихся в фокусе внимания современной психологии малых групп и организационной психологии. Как формируется и меняется психологический контракт в малых группах и организациях? Как изменяется транзакционная память команды при частичном изменении состава участников? Каковы стадии формирования групповой идентичности, внутригруппового доверия, разделяемых членами группы ментальных моделей и ситуационной осведомленности? Какова последовательность стадий принятия организационных изменений в разных корпоративных культурах? Каковы факторы эффективности лидерского поведения в виртуальных, распределенных командах, участники которых работают удаленно? Совмещение опросов, анализа дискурса и кейс-стади с анализом больших данных позволяет прояснить закономерности групповой рефлексии и ее влияния на эффективность совместной деятельности.
31

В-четвертых, большие данные дают возможность для изучения групповых процессов, разворачивающихся одновременно в сетевом и реальном пространствах. Анализ меток геолокации в сообщениях пользователей социальных сетей открывает новые возможности для исследователей в сфере социальной психологии города, психологии криминального поведения, а также изучения межэтнической напряженности и агрессии. Появляется возможность строить географические карты, отображающие распространение нетерпимости в локальных сообществах. Становится возможным изучение динамики межгрупповых отношений с учетом региональных особенностей и микроконтекста социальной ситуации. Геометки сообщений, триангуляция звонков и точек подключения к сети носимых гаджетов, датчики движения в смартфонах – все это со временем расширит возможности не только для изучения массовых феноменов – в том числе, социальных движений, изменения поведения толпы под влиянием поступающих одновременно реальных и виртуальных сообщений разного психологического содержания, – но и для изучения воздействия различных условий проживания в городе на психологическое благополучие горожан, различные психологические типы отношения жителей к новым транспортным и архитектурным технологиям “умного города”.

32 В-пятых, чрезвычайно перспективны цифровые исследования динамики психологических процессов в больших социальных группах, в том числе изучение изменений макропсихологических характеристик отдельных регионов и общества в целом. Сопоставление данных психолингвистического анализа текстов интернет-пользователей, административной статистики и результатов репрезентативных социологических опросов за большие периоды времени позволяет разработать объяснительные и прогностические модели динамики макропсихологического состояния отдельных регионов, а также давать прогноз влияния макропсихологических показателей на социально-экономическую и политическую ситуацию. Сочетание анализа цифровых следов, дискурса и социально-психологических онлайн-опросов расширяет возможности для изучения сложных психологических феноменов массового сознания: коллективных переживаний, – в том числе мировоззренческих чувств, – социальных представлений, коллективной памяти, коллективного образа будущего. До сих пор исследователи были сосредоточены в основном на динамике относительно простых групповых феноменов в социальных сетях: эмоциональном заражении и распространении мемов (см., например, [42]), информационных каскадах в связи с теми или иными обсуждаемыми событиями (см., например, [21]), групповой поляризации и возникновения “эхо-камер” [20], распространении слухов и ложной информации [11], тогда как исследования более сложных явлений, таких как коллективная память и социальные представления, относительно редки [22]. Между тем, автоматизированный анализ текстов пользователей форумов и социальных сетей, а также публикаций в СМИ приближает нас к решению более сложных научных проблем: например, какие социально-психологические факторы влияют на динамику доверия к социальным институтам; каким образом содержание коллективной памяти влияет на социальные представления о будущем, какие групповые социально-психологические характеристики влияют на динамику вовлечения жителей региона в использование технологических инноваций и на развитие производительных сил регионов страны.
33 Особое внимание необходимо обратить не только на механизмы распространения тревожных состояний и коллективных страхов, но и на социально-психологические закономерности распространения позитивной информации, позитивной оценки коллективного прошлого, формирования позитивной гражданской идентичности и ответственности за происходящее в стране. Например, цифровые следы позволяют изучать динамику коллективных переживаний во время праздников и траура, формирование генерализованной надежды, феномены “большого оптимизма” и “защитного пессимизма”, психологические функции коллективного образа ближайшего, среднесрочного и отдаленного будущего. Одним из прикладных применений этой работы может быть прогнозирование психологического воздействия “мнемонических войн” и информационных кампаний, направленных на изменение отношения общества к своему коллективному прошлому и будущему. В результате таких междисциплинарных исследований может быть разработана модель формирования групповой жизнеспособности в цифровой среде, а также устойчивости крупных социальных групп к информационным угрозам в условиях растущей неопределенности.
34 Большие данные позволяют заглянуть не только в сегодняшнее состояние российского общества, но и проливают свет на феномены исторической психологии. Использование исторических больших данных в психологических исследованиях имеет свои недостатки и ограничения (см. критический анализ [38]). Тем не менее, их можно использовать для изучения содержания коллективной памяти и ее динамики, а также для изучения изменений коллективного образа будущего.
35 Большой интерес представляют в этой связи новые возможности для анализа визуальных сообщений. Сочетание автоматизированного распознавания изображений и экспертных оценок позволяет исследовать динамику социальных представлений и сложных коллективных эмоциональных переживаний, оценивать различия в визуальной репрезентации сложных явлений представителями разных социальных групп, жителями разных регионов. Методологические основания такого анализа для этого уже разработаны в рамках визуальной социологии, а также социальной психологии изображений [33, 35].
36 ЗАКЛЮЧЕНИЕ
37 В заключении целесообразно обратить внимание на некоторые фундаментальные психологические проблемы и риски, тесно связанные с внедрением технологий анализа больших данных в повседневную жизнь общества.
38 Так, можно ожидать изменений в процессах социального сравнения и социального влияния, так как для личности открывается возможность оценивать себя и других на основе сопоставления с данными о поведении большинства, а сами основания для сравнения становятся более произвольными, легко настраиваемыми с учетом контекста той или иной ситуации. Кроме того, большие данные в “цифровом обществе” превращаются в еще одно основание для формирования стереотипов, когда интерпретация аутгруппового поведения на основе цифровых следов оказывается искаженной сформировавшимися ранее предубеждениями или используется для их подтверждения. Большие данные превращаются в критерий оценки личностью социальных ситуаций: как бóльшая или меньшая рельефность этой информации будет сказываться на процессах социального познания? Еще одной важной психологической проблемой становится растущая “прозрачность” жизни человека в деловой и личной сферах. Доступность цифровых следов личности другим людям и организациям не только будет служить основанием для формирования новых социальных фобий, но и повлияет на нравственно-психологические компоненты межличностных отношений. Например, можно ожидать изменения критериев доверия и недоверия, формирования новых составляющих социальной зрелости и ответственности личности, когда атрибутивные процессы в межличностном и межгрупповом восприятии основываются не только на уже совершенных поступках, но и на цифровых следах намерений. Развитие технологий бесконтактной автоматизированной психологической диагностики существенно повлияет на такие характеристики личности, как готовность к самораскрытию и управление впечатлением, а также формы проявления негативных личностных качеств.
39 Динамика межличностных отношений, отраженная в цифровых следах, станет доступна для более дифференцированной взаимной оценки сторонами, что может повлечь за собой изменения в скорости протекания внутригрупповых процессов. Уже начавшийся переход крупных компаний к непрерывной оценке деятельности своих сотрудников на основе потоковой аналитики создает ряд психологических проблем в области организационного поведения. Например, встает вопрос о том, как сокращение цикла оценки деятельности сотрудника, а также расширение круга людей и групп, которые могут оценивать ее эффективность, пользуясь потоковой аналитикой, повлияет на мотивацию, приверженность и удовлетворенность работой? Как будет меняться ролевая структура и социально-психологический климат групп в условиях, когда коллектив будет получать свой групповой психологический профиль и обратную связь на свои действия в режиме реального времени, а не с месячной или недельной задержкой? Как командные ментальные модели, включающие в себя представления о работе с большими данными и “цифровых двойниках” объекта управления, будут сказываться на организации совместной деятельности и межгрупповых отношениях?
40

Большие данные и алгоритмы их обработки “фетишизируются” и уже используются как средство политического воздействия, что приводит к переоценке их реальных возможностей в решении социальных проблем. Фрустрация завышенных ожиданий может вызвать не только кризис доверия к технологии анализа больших данных, но и обрушение доверия к социальным институтам, которые их используют. Формирование рынков данных обострит проблему дефицита межгруппового доверия в отношениях между различными группами горожан, разработчиками систем искусственного интеллекта и технократическими элитами. В эпоху информационных войн с использованием машинного обучения на основе больших данных формирование институционального доверия становится все более трудной социально-психологической задачей. Благодаря большим данным представление общества о самом себе становится более динамичным, появляются новые средства как для верификации социальных представлений, так и для манипулирования ими. Особое значение в этих условиях приобретает цифровая память и социально-психологические механизмы реконструирования коллективного прошлого, отраженного в цифровых следах миллионов людей. Можно предположить, что невозможность стереть цифровые следы не только индивидуальных, но и групповых поступков, повлияет на осмысление коллективного прошлого, настоящего и будущего, а также вызовет к жизни новые формы мнемонических войн.

41 Дальнейшее развитие интернета вещей и лавинообразное вторжение алгоритмов в повседневную жизнь горожан не только дает в руки психологов новые методы исследований, но и делает невозможным изучение традиционных социально-психологических феноменов без учета того влияния, которое оказывает на них цифровая среда.

Библиография

1. Агадуллина Е.Р. Пользователи социальных сетей: современные исследования // Современная зарубежная психология. 2015. Т. 4. № 3. С. 36–46.

2. Берроуз Р., Севидж М. После кризиса? Big Data и методологические вызовы эмпирической социологии // Социологические исследования. 2016. № 3 (383). С. 28–35.

3. Войскунский А.Е. Психология и искусственный интеллект: новый этап старого взаимодействия // Психология человека как субъекта познания, общения и деятельности / Отв. ред. В. В. Знаков, А. Л. Журавлёв. М.: Изд-во “Институт психологии РАН”, 2018.С. 2094–2101.

4. Журавлев А.Л., Нестик Т.А., Юревич А.В. Прогноз развития психологической науки и практики к 2030 г. // Психологический журнал. 2016. Т. 37. № 5. С. 45–64.

5. Журавлев А.Л., Соснин В.А., Китова Д.А., Нестик Т.А., Юревич А.В. Массовое сознание и поведение: тенденции социально-психологических исследований. М.: Изд-во “Институт психологии РАН”, 2017.

6. Зуев К.Б., Нестик Т.А. Основные направления развития психологических исследований: библиометрический анализ по данным Web of Science и статистики поисковых запросов Google // Психологическое знание: Современное состояние и перспективы развития / Под ред. А.Л. Журавлева, А.В. Юревича. М.: Изд-во “Институт психологии РАН”, 2018. С. 671–697.

7. Корытникова Н.В. Online Big Data как источник аналитической информации в online-исследованиях // Социологические исследования. 2015. № 8 (376). С. 14–24.

8. Ледовая Я.А., Тихонов Р.В., Боголюбова О.Н. Социальные сети как новая среда для междисциплинарных исследований поведения человека // Вестник Санкт-Петербургского университета. Серия 16. Психология. Педагогика. 2017. Т.7(3). С. 193–210.

9. Ледовая Я.А., Тихонов Р.В., Боголюбова О.Н., Иванов В.Ю., Яминов Б.Р. Организационно-методические вопросы сбора данных в онлайн-исследовании поведения пользователей социальной сети “Фейсбук” из России и США // Вестник Санкт-Петербургского университета. Серия 16. Психология. Педагогика. 2017. Т. 7(4). С. 308–327. https://doi.org/10.21638/11701/spbu16.2017.402/ (дата обращения: 12.01.2017).

10. Макропсихология современного российского общества / Под ред. А.Л. Журавлева, А.В. Юревича. М.: Изд-во “Институт психологии РАН”, 2009.

11. Михеев Е. А., Нестик Т. А. Дезинформация в социальных сетях: состояние и перспективы психологических исследований // Фундаментальные и прикладные исследования современной психологии: результаты и перспективы развития / Отв. ред. А. Л. Журавлёв, В. А. Кольцова. М.: Изд-во “Институт психологии РАН”, 2017. С. 2021–2030.

12. Нестик Т.А. Развитие цифровых технологий и будущее психологии // Вестник Московского государственного областного университета. Серия: Психологические науки. 2017. № 3. С. 6–15.

13. Погорский Э.К. Особенности цифровых гуманитарных наук // Знание. Понимание. Умение. 2014. № 5. URL: http://www.zpu-journal.ru/e-zpu/2014/5/ Pogorskiy_Digital-Humanities/ (дата обращения: 12.01.2017).

14. Смирнов И.В. Введение в анализ естественных языков: учебно-методическое пособие. М.: Изд-во РУДН, 2014.

15. Солдатова Г.У., Рассказова Е.И., Нестик Т.А. Цифровое поколение России: компетентность и безопасность. M.: Смысл, 2017.

16. Тищенко В.И. Информатика сообществ: Противоречия становления // Социальные сети и виртуальные сетевые сообщества / Отв. pед. Л.Н. Верченов, Д.В. Ефременко, В.И. Тищенко. М., 2013. С. 11–18.

17. Толстова Ю.Н. Социология и компьютерные технологии // Социологические исследования. 2015. № 8 (376). С. 3–13.

18. Al-Mosaiwi M., Johnstone T.In an Absolute State: Elevated Use of Absolutist Words Is a Marker Specific to Anxiety, Depression, and Suicidal Ideation // Clinical Psychological Science January 5, 2018 URL: https://doi.org/10.1177/2167702617747074 (датаобращения: 1.03.2017).

19. Azucar D., Marengo D., Settanni M. Predicting the Big 5 personality traits from digital footprints on social media: A meta-analysis // Personality and Individual Differences. 2018. V. 124. P. 150–159.

20. Bessi A. Personality traits and echo chambers on Facebook // Computers in Human Behavior. 2016. V. 65. P. 319–324.

21. Burnap P., Williams M.L., Sloan L. Tweeting the terror: Modelling the social media reaction to the Woolwich terrorist attack // Social Network Analysis and Mining. 2014. V. 4(1). P. 1–14.

22. Candia C., Jara-Figueroa C., Rodriguez-Sickert C., Barabási A.-L.,Hidalgo C.A. The universal decay of collective memory and attention // Nature Human Behaviour. 2019. V.3. P. 82–91.

23. Crump M.J.C., McDonnell J.V., Gureckis T.M. Evaluating Amazon’s Mechanical Turk as a Tool for Experimental Behavioral Research // PLoS ONE. 2013. 8(3):e57410.

24. Deign J. Big data dating: romance goes digital // The Network. Cisco's Technology News Site. September 13, 2017. URL: https://newsroom.cisco.com/feature-content?articleId=1875523 (дата обращения: 1.03.2017).

25. Guzzo R.A., Fink A.A., King E., Tonidandel S., Landis R.S. Big data recommendations for industrial–organizational psychology // Industrial and Organizational Psychology. 2015. V. 8(4). P. 491–508.

26. Jones M.N. Developing cognitive theory by mining large-scale naturalistic data // Big Data in Cognitive Science. Frontiers of Cognitive Psychology / Ed. Michael N. Jones. N.Y.: Routledge, 2017. P. 1–12.

27. Karlsson Linner R., Biroli P., Kong E., […] Beauchamp J.P. Genome-wide association analyses of risk tolerance and risky behaviors in over 1 million individuals identify hundreds of loci and shared genetic influences // Nature Genetics. 2019. V. 51(2). P. 245–257.

28. Kosinski M. Computational Psychology // Advanced social psychology: the state of the science. 2nd Ed. / Eds. E.J. Finkel and R.F. Baumeister. Oxford: Oxford University Press, 2019. P. 499–523.

29. Kosinski M., Stillwell D., Graepel T. Private traits and attributes are predictable from digital records of human behavior // Proceedings of the National Academy of Sciences (PNAS). 2013. V. 110. N 15. P. 5802–5805.

30. Kosinski M., Wang Y., Lakkaraju H., Leskovec J. Mining Big Data to Extract Patterns and Predict Real-Life Outcomes // Big Data in Psychology. Special issue of Psychological Methods. 2016. V.21. N. 4. P. 493–506.

31. Kramer A.D., Guillory J.E., Hancock J.T. Experimental evidence of massive-scale emotional contagion through social networks // Proceedings of the National Academy of Sciences. 2014. V. 111(24). P. 8780–8790.

32. Lambiotte R., Kosinski M. Tracking the Digital Footprints of Personality // Proceedings of the Institute of Electrical and Electronics Engineers (IEEE). 2014. V. 102. N. 12. P. 1934–1939.

33. Manovich L. Automating Aesthetics: Artificial Intelligence and Image Culture.2017. URL: http://manovich.net/content/04-projects/101-automating-aesthetics-artificial-intelligence-and-image-culture/automating_aesthetics.pdf (дата обращения: 01.03.2017).

34. Mitroff S.R., Biggs A.T., Adamo S.H., Dowd E.W., Winkle J., Clark K. What can 1 billion trials tell us about visual search? // Journal of Experimental Psychology: Human Perception and Performance. 2015. V. 41. 1–5.

35. MolinerP. Psychologie sociale de l'image. Grenoble: Presses Universitaires de Grenoble, 2016.

36. Monteith S., Glenn T., Geddes J., Bauer M. Big data are coming to psychiatry: a general introduction // International Journal of Bipolar Disorders. 2015. V.3:21.

37. Obschonka M., Stuetzer M., Rentfrow P.J., Shaw-Taylor L., Satchell M., Silbereisen R.K., Potter J., Gosling S.D. In the Shadow of Coal: How Large-Scale Industries Contributed to Present-Day Regional Differences in Personality and Well-Being // Journal of Personality and Social Psychology. 2018.V. 115(5). P. 903–927.

38. Pettit M. Historical time in the age of Big Data: Cultural psychology, historical change, and the Google Books Ngram Viewer // History of Psychology. 2016. V. 19(2). P. 141–153.

39. Putka D.J., Oswald F.L. Implications of the Big Data movement for the advancement of IO science and practice // Big data at work: The data science revolution and organizational psychology / Eds. Tonidandel S., King E., Cortina J. M.. New York, NY: Routledge, 2015. P. 181–212.

40. Rudder C. Dataclysm: Who We Are (When We Think No One's Looking). N.Y.: Crown, 2014.

41. Salganik M.J. Bit by Bit: Social Research in the Digital Age. Princeton & Oxford: Princeton University Press, 2018.

42. Spitzberg B.H. Toward a model of meme diffusion (M 3 D) // Communication Theory. 2014. V. 24(3).P. 311–339.

43. Stewart R., Davis K. ‘Big Data’ in mental health research: current status and emerging possibilities // Social Psychiatry and Psychiatric Epidemiology. 2016. Т. 51. № 8. С. 1055–1072.

44. Vosoughi S., Roy D., Aral S. The spread of true and false news online // Science. 2018. V. 359. N. 6380. P.1146–1151.

Комментарии

Сообщения не найдены

Написать отзыв
Перевести