Полная версия

Главная arrow Социология arrow Векторы развития современной России. От формирования ценностей к изобретению традиций. Материалы XIII Международной научно-практической конференции молодых ученых. 11 –1 0 апреля 2014 года -

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>

Возможности использования Google Trends в социологических исследованиях (на примере анализа поисковых запросов относительно ВТО)

Анастасия Коробкова Национальный исследовательский университет Высшая школа экономики Факультет социологии

Данные Google Trends: особенности и примеры использования

В настоящее время наблюдается очевидная тенденция использования в исследованиях больших объемов данных, Data Mining становится своеобразным трендом. Действительно, развитие технологий заставляет искать новые способы измерения социальной реальности. Вместе с тем потенциал применения подобного рода технологий еще не вполне очевиден. В настоящей статье я хотела бы поделиться своим опытом использования Google Trends и информации данного ресурса для анализа внимания к ВТО в России и за рубежом, рассказать о выводах, которые могут быть сделаны на основе анализа поисковых запросов в сети интернет.

Ресурс Google Trends позволяет получить информацию относительно числа поисковых запросов и их динамики, примеры наиболее часто используемых запросов, содержащих искомое ключевое слово, а также статистику поиска в региональном и межстрановом разрезе. Данные такого рода интересны по многим причинам. Так, к примеру, статистика ресурса позволяет нам получать информацию о ситуации в прошлом, не прибегая к зачастую неточному методу ретроспекции. Кроме того, в данном случае мы работаем с некими объективными данными и можем говорить о реальной заинтересованности населения в тех или иных вопросах. Нередко люди не рефлексируют относительно того, какие проблемы их беспокоят, какого рода информация представляется им интересной. Следовательно, опросные данные могут не отражать реальной картины. Тогда как ресурс Google Trends позволяет делать выводы, основываясь на данных, свободных от переосмысления респондентом и искажений в сторону социально одобряемых ответов.

Впрочем, необходимо также учитывать и некоторые ограничения, с которыми связано применение данного метода. Прежде всего, портал предлагает для свободного доступа лишь нормированные данные: число запросов в каждый период времени (или в каждом регионе/стране) рассматривается по отношению к максимальному зафиксированному. Таким образом, объем таких запросов изменяется от нуля до ста, где сто — максимальное значение за период времени или среди анализируемых территориальных образований, а ноль — число запросов, не превышающее 0,5 % от зафиксированного максимума. Следовательно, формат данных не позволяет нам делать выводы относительно числа запросов определенного рода, в данном случае мы анализируем лишь тенденции, направления изменений. Впрочем, если для целей исследования необходимо понимать, какое число запросов по определенному ключевому слову было сделано, мы можем обратиться к аналогичному порталу Yandex Wordstat, предоставляющему информацию относительно запросов в ненормированном виде. Аналитики ресурса Google Trends утверждают, что нормирование данных позволяет отчасти решить проблему неуклонно растущей интернет-аудитории. Однако в ряде случаев, обращение к данным о точном числе запросов определенного рода будет оправданно.

Стремительно растущая аудитория сети интернет — далеко не единственное препятствие на пути исследований такого рода. Традиционно, когда речь заходит об интернет-исследованиях, встает вопрос об их репрезентативности, а потому следует принимать во внимание уровень интернетификации населения. Впрочем, доля людей, ежедневно выходящих в интернет, уже достаточно высока (46%), а различия между федеральными округами по уровню распространения интернета не слишком велики[1]. Таким образом, вероятно, это ограничение не столь серьезно.

Возможны сложности в интерпретации результатов, если слова поиска не имеют однозначной трактовки. В случае с ВТО такой проблемы не возникало, поскольку аббревиатура имеет единственное значение. Однако если бы мы хотели проанализировать заинтересованность общественности в судьбе некоего Иванова или же сделать выводы о колебаниях числа запросов относительно компании Apple, мы могли бы столкнуться с серьезными трудностями.

Отмечу также, что сами по себе данные о статистике интернет-запросов не слишком информативны. Потенциал для исследований состоит в сопоставлении данных такого рода с новостными событиями, характеристиками исследуемого объекта и экономическими показателями. Примеры таких сопоставлений будут рассмотрены далее.

Впервые анализ поисковых запросов был использован в исследованиях в сфере здравоохранения: предпринимались попытки, анализируя запросы, связанные с симптомами заболевания и названиями лекарств, прогнозировать эпидемии[2]. Попытки такого рода увенчались успехом: в 2008 г. был создан ресурс Google Flu Trends, прогнозирующий эпидемии гриппа на основании динамики интернет-запросов[3]. За время его существования не было зафиксировано серьезных несовпадений его прогнозов и официальной статистики. В настоящее время ресурс работает в 29 странах мира, включая Россию[4]. Впрочем, возникают некоторые сомнения в точности и актуальности выводимых для России данных в силу отсутствия дифференциации рисков эпидемии между регионами. Так, к примеру, для различных штатов США уровень риска возникновения эпидемий не одинаков, тогда как в России данный показатель одинаков для всех субъектов Федерации.

Существуют примеры использования статистики поисковых запросов в политических и маркетинговых исследованиях. Так, Кристофер Олдс анализировал влияние высказываний президента на внимание общества к разного рода экономическим вопросам, основываясь на данных Google Trends[5]. Было проведено исследование влияния расистских настроений в различных штатах США (число запросов «nigger» в Google) на число голосов, отданных на выборах за Б. Обаму[6]. Изучалась также взаимосвязь поисковых запросов в сети и продаж автомобилей[7]. В российских исследованиях данный метод еще не распространен.

  • [1] Исследование фом. Интернет в России: динамика проникновения. Осень2013. http://fom.ru/SM I-i-internet/11288
  • [2] Wilson К., Brownstein f.S. Early Detection of Disease Outbreaks Using theInternet//Canadian Medical Association Journal. 2009. No. 180. P. 829-831.
  • [3] Ginsberg /., MohebbiM.H., Patel R.S., Brammer L., Smolinski M. S.,Brilliant L. Detecting influenza epidemics using search engine query data//Nature. 2009. Vol. 457.
  • [4] Ресурс Google Flu Trends, http://www.google.org/flutrends
  • [5] Olds С. Assessing presidential agenda-setting capacity: dynamic comparisonsof presidential, mass media, and public attention to economic issues//Congress& the Presidency. 2013. P. 2SS-284.
  • [6] Seth S.-D. The Cost of Racial Animus on a Black Presidential Candidate: UsingGoogle Search Data To Find What Surveys Miss. March 24, 2013. http://static.Squarespace.com/static/51d894bee4b01caf88ccb4f3/t/51d89ab3e4b05a25fclf39d4/1373149875469/RacialAnimusAndVotingSethStephensDavidowitz.pdf
  • [7] Goel S., Hofman J.M., Lahaie S., Petmock D.M., Watts D.J. Predicting ConsumerBehavior with Web Search.//Proceedings of the National Academy of Sciences.2010. Vol. 107 (41).
 
<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>