Методы сбора данных

Анализ существующих данных. Контент-анализ

Большой объем информации, необходимой исследователю в его работе, содержится в документальных источниках. В социологии их изучение как вид деятельности или этап исследования называют анализом существующих данных, или вторичным анализом данных. В маркетинговых исследованиях часто употребляют термин «desk research» («исследование за столом»).

Анализ содержания документальных источников в ряде случаев позволяет получить информацию, достаточную для решения возникшей проблемы, или углубить анализ проблемы. Так, при формулировке проблемы и гипотез исследования социолог обращается к анализу таких документов, как научные публикации, отчеты по предшествующим исследованиям, различная статистическая и ведомственная документация. Именно анализ документов дает первоначальную информацию и позволяет точно и целенаправленно использовать другие исследовательские методы.

Наконец, на стадии анализа и интерпретации результатов часто возникает необходимость обращения к различным документам, чтобы сравнить полученные данные с уже имеющимися, уточнить границы интерпретации полученных результатов, проконтролировать их надежность.

Документ — средство закрепления различными способами на специальном материале информации о фактах, событиях, явлениях объективной действительности и мыслительной деятельности человека. Информация может фиксироваться с помощью букв, цифр, стенографических и иных знаков, рисунков, фотографий, звукозаписей и т. д. В зависимости от технических средств фиксации информации различают следующие виды документов:

  • 1) письменные, т. е. документация на бумажных носителях или электронных носителях для чтения их с помощью компьютеров: традиционные архивные документы государственных и общественных организаций; литература (книги, брошюры); пресса (газеты, журналы); личные документы (письма, дневники);
  • 2) иконографические: видео-, кино- и фотодокументы, картины, гравюры ит. п.;
  • 3) фонетические: лазерные диски, магнитные и подобные им записи, грампластинки.

Все более универсальным техническим способом хранения и распространения становится представление информации в цифровой форме на машиночитаемых носителях для компьютеров. Например, исходные данные переписей населения хранятся в машиночитаемой форме на машинных носителях; исходные данные социологических исследований хранятся в банках данных на машинных носителях; некоторые газеты распространяют тексты электронным способом — на машиночитаемых носителях, видеоинформация также представляется в цифровом виде с широкими возможностями ее компьютерной обработки и передачи по электронным каналам связи.

Наиболее универсальным глобальным средством распространения информации в последнее время стала «всемирная паутина компьютеров» Интернет.

По содержанию документы можно подразделить на следующие группы.

1. Различные виды данных государственной и ведомственной статистики — один из наиболее важных источников информации. Ядром этих данных являются результаты переписей населения и текущего статистического учета, которые проводит Федеральная служба государственной статистики (Росстат). Росстат как и аналогичные организации в других развитых странах, накапливают данные по достаточно широкому спектру экономических и социальных показателей.

Первая и единственная всеобщая перепись населения в Российской империи была проведена в 1897 г. После революции 1917 г. первая всесоюзная перепись была проведена в 1926 г. Следующая всеобщая перепись населения состоялась в 1937 г. Она была признана неудовлетворительной по качеству данных и была повторена в 1939 г. Следующая перепись состоялась лишь в 1959 г. Последующие переписи проходили с интервалом примерно в 10 лет — в 1970, 1979, 1989 и 2002 гг.

Статистические данные в социологическом анализе выполняют несколько функций: могут стать инструментом специального анализа, использоваться для характеристики исторического контекста развития изучаемого социального явления или процесса, обеспечивать концептуальные рамки, внутри которых реализуется конкретный исследовательский проект. Наличие соответствующей статистики является важнейшим компонентом некоторых процедур процесса исследования, например, построения выборки в массовых опросах населения и оценки репрезентативности получаемых данных.

Система статистических данных, накапливаемых Росстатом, включает в себя текущий учет населения (регистрация браков, рождений, смертей, перемены места жительства и многое другое). На его основе публикуются «Российский статистический ежегодник», а также многотомные издания материалов переписей и микропереписей населения. Некоторые данные в настоящее время Росстат распространяет также через Интернет.

Сходная система сбора и публикаций статистических данных сохранилась и в странах бывшего Союза.

Помимо Росстата сбором разнообразных статистических данных занимаются другие государственные организации: иммиграционная служба, органы таможни и т. д.

Важнейшим источником информации для политологических исследований является электоральная статистика. Статистические сведения о результатах политических предпочтений избирателей России стали регулярно публиковаться Центральной избирательной комиссией РФ. Например, результаты президентских выборов 1996 г. представлены в книге «Выборы Президента Российской Федерации. 1996. Электоральная статистика» (М., 1996); результаты выборов в 1995—1997 гг. на местном уровне подробно представлены в книге «Выборы глав исполнительной власти субъектов Российской Федерации. 1995—1997. Электоральная статистика» (М., 1997). Результаты выборов в Государственную Думу РФ 1999 г. опубликованы в «Вестнике Центральной избирательной комиссии РФ» (2000. № 6, 7). Помимо этих публикаций существуют электронные базы результатов голосования на выборах как федерального уровня, так и в субъектах Федерации[1].

Важной особенностью статистических данных является их агрегированный характер. Это означает, что единицей анализа, к которой они относятся, выступает некоторая группа как целостность. Например, показатель «национальный доход» относится ко всему государству, «средний душевой доход» — ко всему населению или определенной социальной группе. Агрегированный характер большей части статистики предопределяет специфику и ограничения в ее использовании. Возможна ситуация, когда свойства, зафиксированные статистикой на групповом уровне, не отражают соответствующие свойства на уровне отдельных подгрупп или индивидуальном уровне.

Исследователю часто приходится использовать статистические данные, которые накоплены, как правило, для решения иных, нежели нужно ему, проблем. В связи с этим перед ним возникает задача обоснования определенного статистического показателя как косвенной меры изучаемой характеристики социального явления или процесса. Наконец, статистика, накопленная различными ведомствами, в ряде случаев страдает отсутствием единой методологии сбора и агрегирования данных, что приводит к их несопоставимости. Встречается в определенном смысле и обратная ситуация (особенно часто при анализе международной статистики), когда преувеличиваются различия в методах сбора данных, определении показателей и т. д.

  • 2. Документы текущего делопроизводства различных организаций. Для этих документов во многих случаях определены сроки хранения. После истечения этих сроков документация, предназначенная для постоянного или длительного хранения, передается в архивы. В России существовала и существует развитая сеть архивов, включающая региональные архивы (республиканские, краевые, областные, районные), ведомственные (отраслевые) архивы, архивы предприятий, учреждений, ведомств, а также центральные государственные архивы.
  • 3. Результаты выборочных социологических исследований представляют собой новый вид статистической информации. В настоящее время в России отсутствуют какие-либо централизованные системы сбора, хранения и распространения данных социологических исследований, поэтому наиболее крупные опросные центры создали и поддерживают собственные архивы данных. Большой объем этих данных за период с 1970 по 1990 г. находится в архиве Института социологии РАН (информацию о ресурсах архива можно найти в нескольких изданиях каталога Института «Банк данных социологических исследований»), Институте социально-политических исследований РАН[2], а также архивах независимых исследовательских центров: Институте сравнительных социальных исследований (ЦЕССИ), Фонде «Общественное мнение»[3], Левада-Центре и ряде других. Часть этих архивов доступна через Интернет на сайтах этих организаций. В последние годы попытку создать единый всероссийский архив данных социологических исследований предпринимает Независимый институт социальной политики[4].

Результаты многочисленных социологических исследований, которые проведены западными социологами в России и других странах бывшего Союза начиная с конца 1980-х гг., хранятся в университетских архивах всего мира, государственных исследовательских центрах. Наиболее известными из университетских архивов являются Межуниверситетский консорциум социальных и политических наук Мичиганского университета США, Кельнский архив в Германии. Причем данные многих проектов можно получить прямо, обратившись на сайты этих центров.

4. Другим традиционным для социологов источником информации являются СМИ — газеты, радио, телевидение, Интернет и т. д. Направленность политической пропаганды, рекламные кампании и их содержание, отражение социальных, политических и экономических проблем общества — далеко не полный перечень вопросов, которых решают социологи с помощью анализа подобных документов.

Методы анализа документов. Традиционные подходы. Каждая из вышеназванных групп документов предполагает свои специфические подходы к их обработке.

Особую проблему с точки зрения их анализа представляют документы, которые продуцируются в первую очередь СМИ. Традиционный анализ, или качественный подход, представляет собой адаптацию содержания документа к исследовательской задаче, основанную на интуитивном понимании, обобщении содержания и логическом обосновании сделанных выводов. Типичным примером анализа текстовых источников может служить изучение научных публикаций и отчетов по проблеме, которое обычно проводится социологом на этапе разработки исследовательской проблемы.

Существуют некоторые приемы оценки качества документального источника. В источниковедении выделяются следующие этапы оценки качества документального источника (критика источника): выяснение условий, целей и причин создания документа, установление его авторства с точки зрения факторов, которые могли повлиять на достоверность отражения в документе действительного положения дел (например, это документ, подготовленный ведомственным исследовательским центром или действительно независимым). Иначе говоря, выясняются факторы достоверности документального источника применительно к целям исследования. Установление полноты и достоверности источника с точки зрения целей исследования — главные параметры его оценки до начала исследования.

Контент-анализ документов. Наиболее существенным ограничением, связанным с использованием традиционных методов анализа документов, например, формируемых СМИ, является возможность субъективного влияния на результаты анализа, т. е. воздействия установок исследователя, его интересов, сложившихся стереотипных представлений о предмете анализа. Это влияние может не осознаваться, а строгих критериев для его обнаружения при интуитивном анализе не существует.

Другим ограничением в традиционном анализе являются трудности, связанные с осмыслением большого количества публикаций, текста за сколько-нибудь длительные периоды времени. Данный недостаток преодолевается методиками формализованного анализа, которые основаны на статистическом учете различных объективных характеристик текста. Например, частота публикаций в газете материалов по определенной теме; число строк, отводимых редакцией отдельным темам, рубрикам, авторам; частота упоминаний проблем, терминов, имен, географических названий и т. п.

Контент-анализ — это метод изучения сообщений, создаваемых в различных сферах социальной коммуникации и зафиксированных в форме письменного текста (на бумаге) или записи на каких-либо иных физических носителях. Анализ основан на стандартизированных правилах поиска, учета и подсчета количественных показателей изучаемых характеристик текста. Потенциальными объектами исследования могут быть любые документальные источники, содержащие текст, — книги, газеты, песни, речи, выступления, письма, дневники, ответы на открытые вопросы анкет. При этом, конечно, подразумевается, что изучаемая характеристика существует и распределена в некоторой массовой совокупности — слов, фраз, параграфов, книг, журналов, авторов и др.

Задачи, решаемые методом контент-анализа, укладываются в достаточно простую и очевидную схему: «Кто сказал, что, кому, как, с какой целью и с каким результатом?».

Суть метода сводится к тому, чтобы найти и использовать для подсчета такие признаки документа (например, упоминания названий партий), которые отражали бы определенные существенные стороны его содержания. Так, тематическую направленность настоящей главы можно определить, если подсчитать частоту употребления в тексте слова «метод» и сравнить ее с аналогичной частотой для других глав.

Обычно контент-анализ, как и методы массового опроса, использует выборочный метод изучения, и лишь единицы анализа и единицы отбора в них различны. В контент-анализе единицы отбора — слова, фразы, смысловые единицы, отдельные статьи; в выборочных опросах — люди.

Принципиальным моментом в разработке методики контент-анализа является разработка правил соотнесения единиц текста с перечнем категорий анализа. Эти правила оформляются в форме кодификатора. В кодификатор включается не только список наблюдаемых индикаторов, но и данные о самом документе, который подвергается кодированию (например, название газеты, город издания, дата издания, другие характеристики газеты — число страниц, формат и т. п.).

Контент-анализ целесообразно использовать при наличии больших текстовых массивов с четкой структурой, определяемой коммуникативными намерениями авторов текста. Этот метод широко используется при изучении сообщений, транслируемых для массовой аудитории газетами, радио, телевидением и проч.

При анализе больших массивов текстов приходится решать проблему обеспечения репрезентативности результатов при отборе текстов из их генеральной совокупности. В большинстве случаев здесь применимы модели выборки, изложенные в предыдущей главе данной книги. Причем уже на стадии планирования необходимо продумать, каковы функции информации, полученной методом контент-анализа, в общей структуре эмпирических данных, полученных другими методами, которые используются в исследовании.

Современные технические средства существенно упрощают ранее представлявшийся крайне трудоемким процесс количественного анализа большого текста. Современные сканеры с эффективными программами распознавания текста позволяют достаточно быстро вводить в компьютер значительные объемы материала. Современные специализированные программы позволяют автоматизировать процесс подсчета искомых показателей. Все чаще газеты распространяют свои материалы в электронном виде, в частности через Интернет, что существенным образом упрощает количественный анализ этих текстов.

  • [1] См., например: Электронный справочник: «Выборы в РоссиийскойФедерации 1991—1998. Электоральная статистика». Федеральный центринформации, 1999.
  • [2] Социальная и социально-политическая ситуация в России: Анализ ипрогноз / Ред.-сост. В. К. Левашов, В. В. Локосов. Доклад подготовлен подрук. Г. В. Осипова. М., 1993.
  • [3] ФОМ регулярно выпускает «Социальная реальность. Журнал социологических наблюдений и сообщений».
  • [4] http://www.socpol.ru/archives/.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >