Контент-анализ (от англ, contens — содержание) — специальный достаточно строгий метод качественно-количественного анализа содержания документов в целях выявления или измерения социальных фактов и тенденций, отраженных этими документами. Особенность его состоит в том, что он изучает документы в их социальном контексте.
Контент-анализ может использоваться в качестве основного метода исследования (например, в исследовании социальной направленности газеты); параллельного, т.е. в сочетании с другими методами (например, в исследовании эффективности функционирования средств массовой информации); вспомогательного или контрольного (например, при классификации ответов на открытые вопросы анкет).
Не все документы могут выступить объектом контент-анализа. Необходимо, чтобы исследуемое содержание позволило задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также чтобы интересующие исследователя элементы содержания встречались с достаточной частотой (принцип статистической значимости). Чаще всего в качестве объектов исследований посредством контент-анализа выступают сообщения печати, радио, телевидения, массовой устной агитации и пропаганды, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет.
Существуют три основных направления применения контент-анализа:
а) выявление того, что существовало до текста и что тем или иным образом получило в нем отражение (текст как индикатор определенных сторон изучаемого объекта — окружающей действительности, автора или адресата);
б) определение того, что существует только в тексте как таковом (различные характеристики формы — язык, структура и жанр сообщения, ритм и тон речи);
в) выявление того, что будет существовать после текста, т.е. после его восприятия адресатом (оценка различных эффектов воздействия).
В разработке и практическом применении контент-анализа выделяют несколько стадий. После того, как сформулированы тема, задачи и гипотезы исследования, определяются категории анализа, т.е. наиболее общие, ключевые понятия, соответствующие исследовательским задачам. Система категорий играет роль вопросов в анкете и указывает, какие ответы должны быть найдены в тексте. В практике советских контент-аналитических исследований в свое время сложилась довольно устойчивая система категорий, среди которых можно назвать такие, как знак, цели, ценности, тема, герой, автор, жанр и др. Все более широко распространяется контент-анализ сообщений средств массовой информации, основанный на парадигматическом подходе, в соответствии с которым изучаемые признаки текстов (содержание проблемы, причины ее возникновения, проблемообразующий субъект, степень напряженности проблемы, пути ее решения и др.) рассматриваются как определенным образом организованная структура. Категории контент-анализа должны быть исчерпывающими (т.е. охватывать все части содержания, определяемые задачами данного исследования); взаимоисключающими (одни и те же части не должны принадлежать различным категориям); надежными (т.е. между кодировщиками не должно быть разногласий по поводу того, какие части содержания следует относить к той или иной категории); уместными (т.е. соответствовать поставленной задаче и исследуемому содержанию).
При выборе категорий необходимо избегать двух крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Иногда же необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми.
После того, как категории сформулированы, необходимо выбрать соответствующую единицу анализа — лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явлений. Сложные виды контент-анализа обычно оперируют не одной, а одновременно несколькими единицами анализа.
Единицы анализа, взятые изолированно, могут быть не всегда правильно истолкованы, поэтому они рассматриваются на фоне более широких лингвистических или содержательных структур, указывающих на характер членения текста, в пределах которого идентифицируется присутствие или отсутствие единиц анализа — контекстуальных единиц. Например, для единицы анализа «слово» контекстуальная единица — «предложение».
Наконец необходимо установить единицу счета — количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п), появление признаков в тексте, частота их появления (интенсивность).
Важен выбор необходимых источников, подвергаемых контент-анализу. Проблема выборки содержит в себе выбор источника, числа сообщений, даты сообщения и исследуемого содержания. Все эти параметры выборки определяются задачами и масштабами исследования. Чаще всего контент-анализ проводится на годичной выборке: если это изучение протоколов собраний, то достаточно 12 протоколов (по числу месяцев), если изучение сообщений средств массовой информации — 12-16 номеров газеты или теле- радиодней. Обычно выборка сообщений средств массовой информации составляет 200-600 текстов.
Необходимым условием контентного исследования является разработка таблицы контент-анализа — основного рабочего документа, с помощью которого оно проводится. Тип таблицы определяется этапом исследования. Так, разрабатывая категориальный аппарат, аналитик составляет таблицу, представляющую собой систему скоординированных и субординированных категорий анализа. Такая таблица внешне напоминает анкету: каждая категория (вопрос) предполагает ряд признаков (ответов), по которым квантифицируется содержание текста. Таблица-анкета может быть достаточно объемной.
Для регистрации единиц анализа составляется другая таблица — кодировальная матрица:
Признак | Текст | |||
1 | 2 | 3 | n | Σn |
А | + | |||
В | + | + | ||
С | + | + | ||
. | ||||
n | ||||
Σn |
Если объем выборки достаточно велик (свыше 100 единиц), то кодировщик, как правило, работает с тетрадью матричных листов. Если выборка сравнительно невелика (до 100 единиц), то можно проводить двумерный или даже многомерный анализ. В этом случае для каждого текста должна быть своя кодировальная матрица. Однако эта работа очень трудоемка и кропотлива, поэтому при больших объемах выборки сопоставление интересующих исследователя признаков осуществляется на компьютере.
Иногда таблица может быть необходимой и на этапе количественной обработки данных. Например, при использовании анализа случайностей, разработанного американским социальным психологом Ч. Осгудом, строится т.наз. матрица случайностей:
Реальное совпадение | Ожидаемое совпадение | |||
А | В | С | n | Σn |
А | — | 0,15 | 0,02 | |
В | 0,05 | — | 0,06 | |
С | 0,08 | 0,12 | — | |
. | — | |||
n | — | |||
Σn | — |
С помощью такой матрицы выявляются меры случайности совпадения каждой классификационной единицы со всеми остальными. Например, единица А встречается в 30% анализируемых текстов (Р = 0,3), а единица В — в 50% текстов (Р = 0,5), тогда ожидаемая частота совместного появления этих единиц будет равна: РАВ = РА • Рв=0,3 • 0,5 = 0,15. В действительности же признаки А и В совместно встретились лишь в 5% текстов АВ = 0,05. Сравнивая ожидаемые и реальные совпадения признаков, можно определить, какие фактические зависимости оказались не случайными (напр., из приведенной выше таблицы видно, что совместное появление единиц А и В — случайное, т.к. реальное совпадение меньше ожидаемого, а единиц В и С — не случайное, т.е. реальное совпадение выше ожидаемого). Цели применения данной матрицы могут быть различными: проследить случайность-неслучайность совпадения признаков для проверки гипотезы, отметить устойчивые-неустойчивые парные сочетания признаков, что может оказаться значимым для характеристики деятельности отправителя информации, и т.д.
Важным условием К.-А. является разработка инструкции кодировщику — системы правил и пояснений для того, кто будет собирать эмпирическую информацию, кодируя (регистрируя) заданные единицы анализа. В инструкции точно и однозначно излагается алгоритм действий кодировщика, даются операциональное определение категорий и единиц анализа, правила их кодирования, приводятся конкретные примеры из текстов, являющихся объектом исследования, оговаривается, как следует поступать в спорных случаях, и т.д.
Процедура подсчета при количественном контент-анализе. в общем виде аналогична стандартным приемам классификация по выделенным группировкам ранжирования и измерения ассоциаций. Существуют также специальные процедуры подсчета применительно к контент-анализу, напр., формула коэффициента Яниса (с), предназначенного для вычисления соотношения положительных и отрицательных (относительно избранной позиции) оценок, суждений, аргументов. В случае, когда число положительных оценок превышает число отрицательных, коэффициент Яниса подсчитывается по формуле
где;- число положительных оценок; п — число отрицательных оценок; г — объем содержания текста, имеющего прямое отношение к научаемой проблеме; t — общий объем анализируемого текста.
В случае, когда число положительных оценок меньше, чем отрицательных, коэффициент Яниса находится по формуле
Есть и более простые способы измерения. Удельный вес той или иной категории можно вычислить с помощью формулы
источник
Контент-анализ: сущность, задачи, процедуры
Контент-анализ (англ. content analysis; от content — содержание) — формализованный метод изучения текстовой и графической информации, заключающийся в переводе изучаемой информации в количественные показатели и ее статистической обработке. Характеризуется большой строгостью, систематичностью.
Сущность метода контент-анализа состоит в фиксации определенных единиц содержания, которое изучается, а также в квантификации полученных данных.
Объектом контент-анализа может быть содержание различных печатных изданий, радио- и телепередач, кинофильмов, рекламных сообщений, документов, публичных выступлений, материалов анкет.
Контент-анализ начал использоваться в социальных науках начиная с 30-х гг XX в. в США. Впервые этот метод был применен в журналистике и литературоведении. Основные процедуры контент-анализа были разработаны американскими социологами X. Лассуэллом и Б. Берелсоном.
Г. Лассуэлл его использовал в конце 1930-х годов для исследований в сфере политики и пропаганды. Лассуэл модернизировал контент-анализ, ввел новые категории и процедуры, особое значение придавал квантификации данных.
Развитие средств массовой коммуникации вызвало увеличение контент-аналитических исследований в этой области. Во время второй мировой войны контент-анализ применялся некоторыми государственными учреждениями США и Англии для изучения эффективности пропаганды в разных странах, а также в разведывательных целях.
Накопленный опыт контент-аналитических исследований был подытожен в книге Б. Берелсона «Контент-анализ в коммуникационных исследованиях» (начало 50-х гг). Автором был определен сам метод контент-анализа, а также разные его виды, критерии и единицы для количественного исследования. Книга Б. Берелсона до сих пор является фундаментальным описанием, дающим понимание основных положений контент-анализа.
После обобщений, сделанных Б. Берелсоном, в США появилось много исследований, в которых контент-анализ применяется в различных научных направлениях. Наиболее интересной методической новацией была методика «связанности символов» Ч. Осгуда (1959), которая позволяла выявить неслучайно связанные элементы содержания.
Западноевропейские исследователи в использовании метода контент-анализа опирались в основном на американский опыт. Тем не менее, здесь тоже появилось несколько оригинальных методик качественно-количественного анализа содержания (Ж. Клейзер, А. Моль).
В настоящее время к основным процедурам контент-анализа относятся:
1. Выявление смысловых единиц контент-анализа, которыми могут быть:
а) понятия, выраженные в отдельных терминах;
б) темы, выраженные в целых смысловых абзацах, частях текстов, статьях, радиопередачах и т. п.;
д) смысл апелляций к потенциальному адресату.
Единицы контент-анализа выделяются в зависимости от содержания, целей, задач и гипотез конкретного исследования.
2. Выделение единиц счета, которые могут совпадать либо не совпадать с единицами анализа. В 1-м случае процедура сводится к подсчету частоты упоминания выделенной смысловой единицы, во 2-м — исследователь на основе анализируемого материала и здравого смысла сам выдвигает единицы счета, которыми могут быть:
а) физическая протяженность текстов;
б) площадь текста, заполненная смысловыми единицами;
в) число строк (абзацев, знаков, колонок текста);
г) длительность трансляции по радио или ТВ;
д) метраж пленки при аудио- и видеозаписях,
е) количество рисунков с определенным содержанием, сюжетом и пр.
3. Процедура подсчета в общем виде сходна со стандартными приемами классификации по выделенным группировкам. Применяется составление специальных таблиц, применение компьютерных программ, специальных формул (напр., «формула оценки удельного веса смысловых категорий в общем объеме текста»), статистические расчеты понятности и аттрактивности текста.
Метод контент-анализа широко применяется как вспомогательное средство в психологии, социологии и др. науках при анализе ответов на открытые вопросы анкет, материалов наблюдений, результатов психологического тестирования (в частности, в проективных методиках), для анализа результатов в методе фокус-групп. Подобные методы используются также в исследованиях массовых коммуникаций, в маркетинговых и многих др. исследованиях. Контент-анализ может использоваться для исследования большей части документальных источников, однако лучше всего он работает при относительно большом количестве однопорядковых данных.
Контент-анализ в психологии
В социальной психологии контент-анализ может применяться, во-первых, как самостоятельный исследовательский прием исследования содержания сообщения; во-вторых, в комплексе с другими методами, т.е., когда одновременно исследуют не только сообщение, но и другие элементы коммуникационного процесса; в-третьих, как вспомогательный метод обработки массива данных, полученных другими методами
В социальной психологии контент-анализ в первую очередь используется для изучения человеческого общения, коммуникаций и их субъектов как представителей микро- и макрогрупп. Непосредственными материалами исследования являются документы, которые рассматриваются как «сообщение». Понятие «сообщение» является специфичным социально-психологическим, в нем акцентируется динамический характер объекта, его включенность в коммуникационную систему. (Т.е. имеется в виду зависимость сообщения от личностных и групповых особенностей коммуникатора и реципиента).
Можно выделить основные области применения контент-анализа в социально-психологических исследованиях:
изучение через содержание сообщений социально-психологических особенностей их авторов (коммуникаторов);
изучение реальных социально-психологических явлений (объекта, субстанции сообщений), которые отображены в содержании сообщений, в том числе тех явлений, которые имели место в прошлом и недоступны для исследования другими методами;
изучение через содержание сообщений социально-психологической специфики различных средств коммуникации, а также особенностей форм и приемов организации содержания, в частности пропагандистского;
изучение через содержание сообщений социально-психологических особенностей их реципиентов;
изучение через содержание сообщений социально-психологических аспектов влияния коммуникации на реципиентов как представителей разных микро- и макрогрупп, а также изучение успешности общения.
Кроме того, можно выделить виды применения контент-анализа во вспомогательных целях:
для обработки и уточнение данных, полученных другими методами в социально-психологических исследованиях;
специальное — применение для изучения научной литературы.
источник
История метода и сфера его применения. Особенности контент-аналитического исследования. Этапы проведения контент-анализа. Требования к проведению контент-анализа
Контент-анализ (от англ. contents — содержание) — метод качественно-количественного анализа содержания текстовых и графических документов с целью выявления или измерения различных фактов и тенденций, отраженных в этих документах. Он относится к разряду вербальных методов исследования, но в то же время требует применения средств математической статистики. Объектом контент-анализа может быть содержание различных печатных изданий, радио- и телепередач, кинофильмов, рекламных сообщений, документов, публичных выступлений, материалов анкет.
Методика контент-анализа нашла широкое применение в информационную эпоху, однако история метода не ограничивается эрой автоматической обработки текста. Так, первые примеры использования контент-анализа датированы XVIII веком, когда в Швеции частота появления в тексте книги определенных тем служила критерием её еретичности. Однако всерьёз говорить о применении контент-анализа как полноценной методики можно лишь начиная с 30-х годов XX века в США. Термин content-analysis впервые начали применять в конце XIX–начале XX в. американские журналисты Б. Мэттью, А. Тенни, Д. Спиид, Д.Уипкинс. У истоков становления методологии контент-анализа стоял также французский журналист Ж. Кайзер.
Основные процедуры контент-анализа были разработаны американскими социологами Г. Лассуэллом и Б. Берелсоном.
Г. Лассуэлл его использовал в конце 1930-х годов для исследований в сфере политики и пропаганды. Он модернизировал контент-анализ, ввел новые категории и процедуры, особое значение придавал квантификации данных.
Развитие средств массовой коммуникации вызвало увеличение контент-аналитических исследований в этой области. Во время второй мировой войны контент-анализ применялся некоторыми государственными учреждениями США и Англии для изучения эффективности пропаганды в разных странах, а также в разведывательных целях.
Накопленный опыт контент-аналитических исследований был подытожен в книге Б. Берелсона «Контент-анализ в коммуникационных исследованиях» (начало 50-х гг.). Автором был определен сам метод контент-анализа, а также разные его виды, критерии и единицы для количественного исследования.
Круг дисциплин, в которых применяется контент-анализ, довольно широк. Помимо социологии и политологии данная методика находит применение в антропологии, управлении персоналом, психологии, литературоведении, истории, истории философии. С помощью контент-анализа можно анализировать такие различные типы текстов, как сообщения СМИ, заявления политических деятелей, программы партий, правовые акты, рекламные и пропагандистские материалы, исторические источники, литературные произведения, материалы наблюдений, результаты психологического тестирования (в частности, в проективных методиках), результаты в методе фокус-групп. Данный метод используется также в исследованиях массовых коммуникаций, в маркетинговых и многих др. исследованиях.
Основные направления применения контент-анализа:
· выявление того, что существовало до текста и что тем или иным образом получило в нем отражение (особенности автора или адресата);
· определение того, что существует только в тексте как таковом (различные характеристики формы — язык, структура, жанр сообщения, ритм и тон речи);
· выявление того, что будет существовать после текста, т.е. после его восприятия адресатом (оценка различных эффектов воздействия).
Особенность контент-анализа состоит в том, что он изучает документы в их социальном контексте. Может использоваться как:
· основной метод исследования (например, контент-анализ текста при исследовании политической направленности газеты),
· параллельный, т.е. в сочетании с другими методами (например, в исследовании эффективности функционирования средств массовой информации),
· вспомогательный или контрольный (например, при классификации ответов на открытые вопросы анкет).
Контент-анализ позволяет обнаружить в документе то, что ускользает от поверхностного взгляда при его традиционном изучении, но что имеет важный социальный смысл. Принципиальное отличие этого метода заключено в явно выраженной строгости, формализованности, систематизированности контент-анализа. Он нацелен на выработку количественного описания смыслового и символического содержания документа, на фиксацию его объективных признаков и подсчет последних. По мнению ряда социологов (Маркоффа, Шапиро, Вейтмана и др.), контент-анализ можно было бы назвать «текстуальным кодированием», так как он предполагает получение количественной информации о содержимом документа на основе ее кодирования.
Не все документы могут стать объектом контент-анализа. Необходимо, чтобы исследуемое содержание поддавалось фиксации и операционализации, т.е. содержало недвусмысленные категории, которые можно интерпретировать однозначно (принцип формализации), а также, чтобы интересующие исследователя элементы содержания встречались с достаточной частотой (принцип статистической значимости).
Этапы проведения контент-анализа
1 Прежде всего выбирается источник анализа (телепередача, сообщение в прессе, статья, ролик и т.п.), формулируются цели и задачи исследования (что, собственно, хочется выяснить). Чаше всего контент-анализ проводится на годичной выборке: если это изучение протоколов собраний, то достаточно 12 протоколов (по числу месяцев), если изучение сообщений средств массовой информации — 12—16 номеров газеты или теле-, радиодней. Обычно выборка сообщений средств массовой информации составляет 200—600 текстов.
2 Выявление смысловых единиц контент-анализа. Прежде чем непосредственно анализировать текст документа, исследователь определяет категории анализа, т.е. ключевые понятия (смысловые единицы), имеющиеся в тексте. При этом желательно избежать крайностей. Если за категории анализа будут приняты слишком общие (абстрактные) понятия, то это предопределит поверхностность анализа текста, не позволит углубиться в его содержание. Если же категории анализа будут предельно конкретными, то их окажется слишком много, что приведет не к анализу текста, а к его сокращенному повторению (конспекту). Нужно найти золотую середину и постараться достичь того, чтобы категории анализа были:
а) уместными, т.е. соответствовали решению исследовательских задач;
б) исчерпывающими, т.е. достаточно полно отражали смысл основных понятий исследования;
в) взаимоисключающими (одно и то же содержание не должно входить в различные категории в одинаковом объеме);
г) надежными, т.е. такими, которые не вызывали бы разногласий между исследователями по поводу того, что следует относить к той или иной категории в процессе анализа документа.
3 После определения системы категорий анализа выбирается соответствующая им единица анализа текста — лингвистическая единица речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явлений. За единицу анализа может быть принято:
з) часть текста, объединенная чем-то, что соответствует смыслу категории анализа. Когда контент-анализ выступает единственным методом информации, оперируют не одной, а сразу несколькими единицами анализа
Единицы анализа, взятые изолированно, могут быть не всегда правильно истолкованы, поэтому они рассматриваются на фоне более широких лингвистических или содержательных структур, указывающих на характер членения текста, в пределах которого идентифицируется присутствие или отсутствие единиц анализа — контекстуальных единиц. Например, если изучается феномен любви межличностной, то очевидно, что фразы о любви к капусте или путешествиям не должны включаться в анализ.
4 Выделение единиц счета, которые могут совпадать со смысловыми единицами или носить специфический характер. В первом случае процедура анализа сводится к подсчету частоты упоминания выделенной смысловой единицы, во втором — исследователь на основе анализируемого материала и целей исследования сам выдвигает единицы счета, которыми могут быть:
· физическая протяженность текстов;
· площадь текста, заполненная смысловыми единицами;
· число строк (абзацев, знаков, колонок текста);
· длительность трансляции по радио или ТВ;
· метраж пленки при аудио- и видеозаписях;
· количество рисунков с определенным содержанием, сюжетом и прочее.
5 Обработка данных может быть количественной и качественной. Количественный анализ. Процедура подсчета в общем виде сходна со стандартными приемами классификации по выделенным группировкам. Применяется составление специальных таблиц, применение компьютерных программ, специальных формул (например, «формула оценки удельного веса смысловых категорий в общем объеме текста»), статистические расчеты понятности и аттрактивности текста. Распространен метод Q–сортировки и парного сравнения.
Существуют также специальные процедуры подсчета применительно к контент-анализу, например, формула коэффициента Яниса, предназначенного для вычисления соотношения положительных и отрицательных (относительно избранной позиции) оценок, суждений, аргументов. В случае, когда число положительных оценок превышает число отрицательных:
где f — число положительных оценок; n — число отрицательных оценок; r — объем содержания текста, имеющего прямое отношение к изучаемой проблеме; t — общий объем анализируемого текста. В случае, когда число положительных оценок меньше, чем отрицательных:
Есть и более простые способы измерения. Удельный вес той или иной категории можно вычислить с помощью формулы:
К = число единиц анализа, фиксирующих данную категорию/общее число единиц анализа.
Обычно составляются таблицы следующего вида.
Упорядоченные категории анализа и счета
Единицы анализа | Единицы анализа | Единицы счета | Единицы счета |
Категории | Подкатегории | Частота упоминания абсолютная, раз | Частота упоминания относительная, % |
1 Категория | 01 подкатегория | 0,25 | |
02 подкатегория | 0,14 | ||
03 подкатегория | 0,61 | ||
Итого: |
Качественный анализ. Когда в ходе исследования могут браться в расчет и другие, возможно, более тонкие вопросы, относящиеся к форме сообщения, нужно задаться вопросом: сопровождается ли конкретное газетное сообщение фотографией или какой-либо иллюстрацией, каковы размеры заголовка данного газетного сообщения, напечатано ли оно на первой полосе или же помещено среди многочисленных рекламных сообщений. При ответе на подобные вопросы внимание исследователя фокусируется не на тонкостях содержания, а на способе презентации сообщения. Основным вопросом здесь является факт наличия или отсутствия материала по теме, степень его выделенности, его размеры, а не нюансы его содержания. В результате такого анализа часто получаются куда более надежные измерения, чем в случае исследования, ориентированного на содержание (поскольку формальным показателям в меньшей степени присуща неоднозначность), но зато, как следствие, и куда менее значимый. Измерения в параметрах, исследуемых в ходе качественного контент-анализа, поверхностно затрагивают само содержание каждого сообщения в отличие от детального и внимательного обследования, необходимого при количественном анализе. В результате качественный контент-анализ обычно более прост в разработке и проведении, а потому и более дешев и надежен, чем содержательный контент-анализ. И хотя его результаты, возможно, удовлетворят в меньшей степени, ибо они дают скорее набросок, чем законченную картину сообщения, но при ответе на конкретный исследовательский вопрос они могут зачастую оказаться вполне адекватными.
6 Интерпретация полученных результатов в соответствии с целями и задачами конкретного исследования. Обычно на этом этапе выявляются и оцениваются такие характеристики текстового материала, которые позволяют делать заключения о том, что хотел подчеркнуть или скрыть его автор. Возможно выявление процента распространенности в обществе субъективных смыслов объекта или явления.
Требования к проведению контент-анализа
Проведение контент-анализа требует предварительной разработки ряда исследовательских инструментов. Из них обязательными являются:
1) классификатор контент-анализа,
2) протокол итогов анализа, который имеет второе обозначение – бланк контент-анализа,
3) регистрационная карточка, или кодировальная матрица,
4) инструкция исследователю, непосредственно занимающемуся регистрацией и кодировкой единиц счета,
5) каталог (список) проанализированных документов.
Классификатором контент-анализа называется общая таблица, в которую сведены все категории (и подкатегории) анализа и единицы анализа. Ее основное предназначение – предельно четко зафиксировать то, в каких единицах выражается каждая категория, используемая в исследовании. Классификатор можно уподобить социологической анкете, где категории анализа играют роль вопросов, а единицы анализа – ответов. Он является основным методическим документом контент-анализа, предопределяющим содержание всех прочих инструментов этого метода.
Протокол (бланк) контент-анализа содержит, во-первых, сведения о документе (его авторе, времени издания, объеме и т.п.); во-вторых, итоги его анализа (количество случаев употребления в нем определенных единиц анализа и следующие отсюда выводы относительно категорий анализа). Протоколы заполняются, как правило, в закодированном виде, но не ради сохранения тайны итогов контент-анализа, а исходя из желательности на одном листе бумаги уместить всю информацию о документе, чтобы удобнее было сопоставлять друг с другом итоги анализа разных документов. Если в исследовании осуществляется контент-анализ малого числа документов, то можно обойтись без кодирования и заполнять эти протоколы в открыто-содержательном виде.
Регистрационная карточка представляет собой кодировальную матрицу, в которой отмечается количество единиц счета, характеризующих единицы анализа. Протокол контент-анализа каждого конкретного документа заполняется на основе подсчета данных всех регистрационных карточек, относящихся к этому документу.
Важным условием контент-анализа является разработка инструкции кодировщику — системы правил и пояснений для того, кто будет собирать эмпирическую информацию, кодируя (регистрируя) заданные единицы анализа. В инструкции точно и однозначно излагается алгоритм действий кодировщика, дается операциональное определение категорий и единиц анализа, правила их кодирования, приводятся конкретные примеры из текстов, являющихся объектом исследования, оговаривается, как следует поступать в спорных случаях, и т.д. Процедура подсчета при количественном контент-анализе в общем виде аналогична стандартным приемам классификации по выделенным группировкам ранжирования и измерения ассоциации.
Практические задания:
1 Ознакомьтесь с примерами контент-аналитического исследования (см. приложение 4). Спишите форму инструкции, протокола, аналитической матрицы.
2 Прочитайте выдержки и журнальных статей (см. приложение 5). Проведите контент-анализ на одну из тем: «Психологический возраст современных мужчин», «Отношение мужчин к женщинам в современном обществе».
Список литературы:
1 Дмитриев И. Контент-анализ: сущность, задачи, процедуры. М., 2005.
2 Дридзе Т.М. Текстовая деятельность в структуре социальной коммуникации. М., 1984.Манекин Р.В. Компьютер и история философии. Краткий обзор отечественных и зарубежных исследований. Донецк: Донецкого отделения САМИ, 1993. С. 68-82.
3 Манекин Р.В. Контент-анализ как метод исторического исследования. Донецк: Информсервис, 1991.
4 Методологические и методические проблемы контент-анализа (Тезисы докладов рабочего совещания социологов). М.: ИСИ АН СССР. 1973. Вып. 1-2.
5 Почепцов Г.Г. Теория коммуникации. М.: Рефл-бук, 2001.
6 Социологическая энциклопедия/под общ. ред. А.Н. Данилова. Минск, 2003.
Не нашли то, что искали? Воспользуйтесь поиском:
источник
Принципиальное отличие этих методов анализа заключено в явно выраженной строгости, формализованности, систематизированности контент-анализа. Он нацелен на выработку количественного описания смыслового и символического содержания документа, на фиксацию его объективных признаков и подсчет последних.
По мнению ряда социологов (Маркоффа, Шапиро, Вейтмана и др.), контент-анализ можно было бы назвать «текстуальным кодированием», так как он предполагает получение количественной информации о содержимом документа на основе ее кодирования.
Кроме того, контент-анализ отличается от всех прочих способов изучения документов, тем, что он позволяет «вписать» содержание документа в социальный контекст, осмыслить его одновременно и как проявление, и как оценку социальной жизни. «Вписывание» документа в изучаемую проблему предполагает выявление того, что: а) существовало до него и получило в нем отражение, б) наличествует только в нем, в) будет после него, т.е. явится итогом его восприятия адресатом.
- фиксация определенных единиц содержания,
- изучает документы в их социальном контексте,
- может использоваться как основной метод исследования (например, контент-анализ текста при исследовании политической направленности газеты), параллельный, т.е. в сочетании с другими методами (напр., в исследовании эффективности функционирования средств массовой информации), вспомогательный или контрольный (напр., при классификации ответов на открытые вопросы анкет).
- документы, исследуемое содержание которых, позволяет задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также, интересующие исследователя элементы содержания встречаются с достаточной частотой (принцип статистической значимости).
- чаще всего в качестве объектов исследования контент-анализа выступают сообщения печати, радио, телевидения, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет.
- выявление того, что существовало до текста и что тем или иным образом получило в нем отражение (текст как индикатор определенных сторон изучаемого объекта – окружающей действительности, автора или адресата);
- определение того, что существует только в тексте как таковом (различные характеристики формы – язык, структура, жанр сообщения, ритм и тон речи);
- выявление того, что будет существовать после текста, т.е. после его восприятия адресатом (оценка различных эффектов воздействия).
- формулируются тема, задачи и гипотезы исследования
- определяются категории анализа – наиболее общие, ключевые понятия, соответствующие исследовательским задачам.
Система категорий играет роль вопросов в анкете и указывает, какие ответы должны быть найдены в тексте.
Категории контент-анализа должны быть исчерпывающими (охватывать все части содержания, определяемые задачами данного исследования), взаимоисключающими (одни и те же части не должны принадлежать различным категориям), надежными (между кодировщиками не должно быть разногласий по поводу того, какие части содержания следует относить к той или иной категории) и уместными (соответствовать поставленной задаче и исследуемому содержанию). При выборе категорий для контент-анализа следует избегать крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Иногда необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми для контент-анализа.
Таким образом, категории анализа должны быть:
- уместными, т.е. соответствовать решению исследовательских задач;
- исчерпывающими, т.е. достаточно полно отражать смысл основных понятий исследования;
- взаимоисключающими (одно и то же содержание не должно входить в различные категории в одинаковом объеме);
- надежными, т.е. такими, которые не вызывали бы разногласий между исследователями по поводу того, что следует относить к той или иной категории в процессе анализа документа.
Необходимо выбрать соответствующую единицу анализа – лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явления.
За единицу анализа может быть принято:
- слово,
- предложение,
- тема,
- идея,
- автор,
- персонаж,
- социальная ситуация,
- часть текста, объединенная чем-то, что соответствует смыслу категории анализа.
Сложные виды контент-анализа обычно оперируют не одной, а несколькими единицами анализа. Единицы анализа, взятые изолировано, могут быть не всегда правильно истолкованы, поэтому они рассматриваются на фоне более широких лингвистических или содержательных структур, указывающих на характер членения текста, в пределах которого идентифицируется присутствие или отсутствие единиц анализа – контекстуальных единиц. Например, для единицы анализа «слово» контекстуальная единица – «предложение».
Необходимо установить единицу счета – количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п.), появление признаков в тексте, частота их появления (интенсивность).
Единица счета – количественная мера единицы анализа, позволяющая регистрировать частоту (регулярность) появления признака категории анализа в тексте. Единицами счета могут быть число определенных слов или их сочетаний, количество строк, печатных знаков, страниц, абзацев, авторских листов, площадь текста, выраженная в физических пространственных величинах и многое другое.
Важен выбор необходимых источников, подвергаемых контент-анализу.
Проблема выборки содержит в себе выбор источника, количества сообщений, даты сообщения и исследуемого содержания. Все эти параметры выборки определяются задачами и масштабами исследования.
Чаще всего контент-анализ проводится на годичной выборке: если это изучение протоколов собраний, то достаточно 12 протоколов (по числу месяцев), если изучение сообщений средств массовой информации – 12-16 номеров газеты или теле-, радиодней. Обычно выборка сообщений средств массовой информации составляет 200-600 текстов.
Выявление смысловых единиц контент-анализа, которыми могут быть:
- понятия, выраженные в отдельных терминах;
- темы, выраженные в целых смысловых абзацах, частях текстов, статьях, радиопередачах и т.п.;
- имена, фамилии людей;
- события, факты и т.п.;
- смысл апелляций к потенциальному адресату.
Единицы контент-анализа выделяются в зависимости от содержания, целей, задач и гипотез конкретного исследования.
Выделение единиц счета, которые могут совпадать либо не совпадать с единицами анализа. В 1-м случае процедура сводится к подсчету частоты упоминания выделенной смысловой единицы, во 2-м – исследователь на основе анализируемого материала и здравого смысла сам выдвигает единицы счета, которыми могут быть:
- физическая протяженность текстов;
- площадь текста, заполненная смысловыми единицами;
- число строк (абзацев, знаков, колонок текста);
- длительность трансляции по радио или ТВ;
- метраж пленки при аудио- и видеозаписях,
- количество рисунков с определенным содержанием, сюжетом и пр.
Процедура подсчета в общем виде сходна со стандартными приемами классификации по выделенным группировкам. Применяется составление специальных таблиц, применение компьютерных программ, специальных формул (напр., «формула оценки удельного веса смысловых категорий в общем объеме текста»), статистические расчеты понятности и аттрактивности текста.
Проведение контент-анализа требует предварительной разработки ряда исследовательских инструментов. Из них обязательными являются:
- классификатор контент-анализа,
- протокол итогов анализа, который имеет второе обозначение – бланк контент-анализа,
- регистрационная карточка или кодировальная матрица,
- инструкция исследователю, непосредственно занимающемуся регистрацией и кодировкой единиц счета,
- каталог (список) проанализированных документов.
Классификатором контент-анализа называется общая таблица, в которую сведены все категории (и подкатегории) анализа и единицы анализа. Ее основное предназначение – предельно четко зафиксировать то, в каких единицах выражается каждая категория, используемая в исследовании. Классификатор можно уподобить социологической анкете, где категории анализа играют роль вопросов, а единицы анализа – ответов. Он является основным методическим документом контент-анализа, предопределяющим содержание всех прочих инструментов этого метода.
Протокол (бланк) контент-анализа содержит: во-первых, сведения о документе (его авторе, времени издания, объеме и т.п.); во-вторых, итоги его анализа (количество случаев употребления в нем определенных единиц анализа и следующие отсюда выводы относительно категорий анализа). Протоколы заполняются, как правило, в закодированном виде, но не ради сохранения тайны итогов контент-анализа, а исходя из желательности на одном листе бумаги уместить всю информацию о документе, чтобы удобнее было сопоставлять друг с другом итоги анализа разных документов. Если в исследовании осуществляется контент-анализ малого числа документов, то можно обойтись без кодирования и заполнять эти протоколы в открыто-содержательном виде.
Регистрационная карточка представляет собой кодировальную матрицу, в которой отмечается количество единиц счета, характеризующее единицы анализа. Протокол контент-анализа каждого конкретного документа заполняется на основе подсчета данных всех регистрационных карточек, относящихся к этому документу
источник
Сущность контент-анализа и его общая характеристика. Основные направления использования. Сущность метода, его сильные и слабые стороны. Специфика применения метода контент-анаяиэа при изучении документов, их систематизация. Анализ публикаций в прессе, писем и других источников. Инструментарий метода контент-анализа, его основные параметры. Техническая сторона контент-анализа. Соотношение метода контент-анализа с другими приемами социологического анализа документов и методами социологического исследования. Анализ статистических документов. Виды статистики и основные формы статистической отчетности
Контент-анализ представляет собой перевод в количественные показатели массовой информации (текстовой, аудиовизуальной, цифровой) с последующей статистической ее обработкой. Его идея очень проста и повторяет ту, что лежит в основе любого другого количественного метода в социологии, будь то анкетирование или наблюдение. Надососчитать наиболее часто повторяющиеся слова или темы, например в газетном материале, и определить, что за этим кроется. Особенность заключается именно в применении статистических процедур для анализа однотипных текстов.
Кантент-анализ (анализ содержания) — количественный анализ текстов и текстовых массивов с целью последующей содержательной интерпретации выявленных числовых закономерностей.
А в известной у нас переводной книге Дж. Мангейма и Р. Рима сказано так: контент-анализ — это систематическая числовая обработка, оценка и интерпретация формы и содержания информационного источника. Этот тип неопросного исследования называют формализованным анализом документов.
Под текстами в контент-анализе понимают книги, книжные главы, эссе, интервью, дискуссии, заголовки газетных статей и сами статьи, исторические документы, дневниковые записи, речи выступлений, рекламные тексты и т.д. Когда говорят о контент-анализе текстов, то главный интерес всегда заключается не в самих характеристиках содержания, а во внеязыковой реальности, которая за ними стоит, — личных характеристиках автора текста, преследуемых им целях, характеристиках адресата текста, различных событиях общественной жизни и др.
Как любой другой социологический метод, контент-анализ используется не сам по себе, а в составе крупного исследовательского проекта, под который составлена научная программа, где четко прописаны цели и задачи, проблема и объект, теоретическая модель и предмет исследования, 1 выдвинуты гипотезы и проведены все другие операции, которые требует научный метод. Когда становится ясным, что поставленных целей никаким иным способом, как только анализом документов, достичь нельзя, социолог прописывает все этапы его применения: устанавливает объект, выделяет единицы анализа (их нередко называют еще единицами наблюдения и т.п.), выбирает статистический метод анализа данных, идет в библиотеку за источниками или садится за Интернет (полевая стадия), а потом ищет, суммирует, считает и интерпретирует, Контент-анализ позволяет обнаружить в документе то, что ускользает от поверхностного взгляда при его традиционном изучении. Он позволяет вписать содержание документа в социальный контекст, осмыслить его одновременно и как проявление, и как оценку социальной жизни.
Принято считать, что контент-анализ состоит из трех основных этапов: 1) выделяются единицы анализа, которые затем сводятся в категории анализа и переводятся в машиночитаемый вид; 2) проводится подсчет частотных распределений, применяется математический аппарат для выявления взаимосвязей единиц анализа; 3) осуществляется интерпретация полученных результатов. Выбор объекта и единиц анализа—чуть ли не самые сложные шаги на этом пути. Нужно найти ответы на вопросы: где мне это искать и как проявляется изучаемое мною явление, событие, процесс.
Объектом контент-анализа могут быть экземпляры книг, плакатов или листовок, номера газет, фильмы, публичные выступления, теле- и радиопередачи, общественные и личные документы, журналистские интервью, ответы на открытые вопросы анкет и др. Они составляют то, что называется выборкой, — ту часть текстов, которые достаточны для анализа всего массива публикаций, и обеспечивают репрезентативность данных.
Это довольно просто, зато с выбором единиц анализа придется помучиться, поскольку эту роль может выполнять что угодно: темы и проблемы, пропозиции, образы, идеологемы, метафоры, примеры и аналогии, каламбуры, аллитерации, мифологемы, кочующие образы и многое другое, иногда очень экзотическое, скажем, надписи на стенах публичных туалетов. Единицами анализа могут служить, например, упоминания о российских политических деятелях и политических партиях и движениях (фамилии, имена политиков и названия партий). В такой роли могут выступать также фрагменты текста или его признаки, фотографии, заголовки, названия профессий, события, города, страны, организации, оценки, суждения на определенную тему и т.п.
А теперь внимание. Хотя в природе контент-анализа не заложено никаких ограничений, а потому ничто не препятствует его применению к отдельному тексту, тем не менее существует ряд причин, по которым его используют только в информационных массивах, состоящих из большого количества текстов. Во-первых, статистические закономерности проявляются тем более отчетливо, чем больше объем выборки. Во-вторых, в большинстве случаев контент-анализ используется в компаративных, т.е. историко-сравнительных, целях. Он силен, когда раскрывает не одномоментные срезы, а динамику изменений.
Таким образом, идея контент-анализа предполагает анализ больших информационных массивов; с другой стороны, его относительная дешевизна и технологичность делают такой анализ принципиально возможным. Поэтому не приходится удивляться тому, что в истории контент-анализа имеются такие проекты, как анализ 427 школьных учебников, 481 частной беседы, 4022 рекламных сло-ганов, 8039 (в 1938) и 19 533 (в 1952) редакционных статей или 15 000 персонажей в 1000 часов телевизионного эфирного времени.
Выбор единиц анализа зависит от исследовательской программы, объекта, предмета, цели, задач и гипотез исследования. Если, скажем, нам предстоит выяснить перспективы забастовки рабочих предприятия, то станет очевидной потребность контент-анализа, как минимум, протоколов собраний рабочих, решений соответствующих профсоюзных комитетов, распоряжений руководителей, законов, регулирующих забастовочную борьбу, и т.п. Переход от задачи к единицам анализа аналогичен процедуре теоретической и эмпирической интерпретации понятий и поиска индикаторов.
Выяснение того, что считать, т.е. установление единиц анализа, — главная, решающая, ключевая (или как угодно еще) предпосылка контент-анализа. Допущенные здесь ошибки трещинами разойдутся по всему зданию. Обязательное условие: такие едини-
цы должны быть единообразными, тогда социолог получит четкие статистические показатели. Добиваются подобного единообразия благодаря стандартизации процедуры анализа текста, которая, устраняя субъективные смещения, раскрывает свои возможности только при достаточно больших массивах текстов. Единицы анализа должны легко и по возможности однозначно идентифицироваться в тексте. В идеале их лучше всего свести к самым употребляемым формальным значкам, например запятым или точкам. Тогда подсчет не представит никаких трудностей, а интерпретация результатов будет однозначной и объективной. Только кому нужен такой счет? Социологу он ничего не даст. Его задача — за внешними признаками, например отдельными словами или фразами, распознать таящееся в глубине социальное явление. А это уже качественный подход. Слова, выбранные для счета, должны обладать распознавательной силой, выступать диагностическим инструментом. Иными словами, единицы анализа должны быть интересными для последующей (политологической, культурологической, социологической и т.д.) интерпретации. Тут необходимы оригинальное видение мира, необычный подход.
Количественный подсчет встречаемости слов в тексте — самый простой вариант контент-анализа, который, однако, приводит к интересным результатам. Чаще всего подсчитывают «интересные» или «ключевые» слова и (или) словосочетания, например названия ценностных категорий типа свобода, стабильность, доверие, территориальная целостность; сценариев типа предательство или разочарование; достаточно однозначные обозначения тех или иных общественно значимых явлений, например коррупция, преступность или терроризм, и др.
С научно-познавательной точки зрения социолога интересуют все-таки не отдельные слова, а стоящие за их «спиной» понятийные категории, объединяющие множество разрозненных слов-признаков в тематическое целое. Исследователь, интересующийся тем, какое место в общественном сознании занимает, скажем, проблема преступности, обязан принимать во внимание не только присутствие в анализируемом информационном массиве слова «преступность», но и упоминания заказных и всяких прочих убийств, бандитского беспредела, «крыши», «братков», авторитетов, власти криминала и т.п.
По отношению к единицам анализа, сгруппированным по единому основанию, иначе говоря, составляющим концептуальное целое, специалисты употребляют другой термин — «категории анализа».
Категории анализа — его смысловые единицы, обозначающие эмпирические признаки текстовой информации, которые являются
результатом операционализации опорных теоретических понятии в концепции исследования. К категориям анализа предъявляются определенные требования: они должны выражать теоретические понятия исследования, иметь в соответствии признаки (смысловые единицы) в тексте, обладать возможностями однозначной регистрации признаков, составляющих эти категории. Основная задача сбора информации в ходе анализа — поиск индикатора, указывающего на наличие в документе выделенной проблемы, идеи, темы (например, «справедливое распределение благ»). Категории анализа выражаются определенными признаками (подкатегориями), характеризующими интенсивность, направленность, значимость выраженной в категории идеи, проблемы. К ним могут относиться понятия из любой сферы жизни общества: формы собственности, приватизация, финансовая система, научно-технический прогресс, методы хозяйствования, национализм, авторитаризм, демократия, международное сотрудничество, права человека, гуманизм» активность, деловая предприимчивость, нарушение законности, коррупция и др.
С помощью категорий выделяют концептуальные связи, модели, микропроблемы, тематические поля. В качестве примера можно привести анализ президентских посланий стране, с которыми обратился Б. Клинтон в 1994 и 1995 гг. Эти послания содержат от 7 тыс, до 10 тыс. слов. Были сформированы категории слов, относящихся к экономике, бюджету страны, образованию, преступности, вопросам семьи, международным делам, социальной помощи и др. В категорию «экономика» входили слова: экономика, безработица, инфляция; в категорию «семья» — ребенок, семья, родители, мать, отец. Именно учет частот встречаемости категорий, а не отдельных слов позволяет судить о внимании, уделенном в послании тем или иным вопросам. По изменению относительных частот в посланиях 1994 и 1995 гг. были сделаны выводы об изменении политики государства в различных областях. Эти темы нашли отражение в обоих посланиях, но в одном из них некоторым темам уделялось больше внимания, а в другом меньше. Скажем, в послании 1995 г. больше внимания было уделено вопросам образования, семьи, но меньше внимания — преступности, международным делам, социальной помощи. Отсюда последовал вывод о стратегических приоритетах правительства США.
Другой пример использования контент-анализа — изучение должностных инструкций на предприятии. Исследователь основывался на следующих предпосылках. Содержание инструкции как нормативного документа, координирующего взаимодействие людей, должно обеспечивать четкую регламентацию ролевых позиций. Чем она полнее, тем эффективнее взаимодействие и отношения людей. Ключевым явилось понятие «регламентация». Основные стороны производственной деятельности, подлежащие регламентации, составили ее предметное содержание. Они названы «категориями регламентации»: 1) место должности в структуре организации; 2) основные цели деятельности яиц, занимающих данную должность; 3) квалификационные требования; 4) обязанности работников; 5) подчиненность и права; 6) ответственность.
Благодаря этому появилась возможность расчленить текст на смысловые блоки по названным шести категориям, по каждой из них сделать стандартизованное заключение о наличии или отсутствии в тексте данной категории. Единицей счета выступил фрагмент текста, содержащий упоминание категории и характеристику ее содержания (независимо от полноты и точности этой характеристики). Далее на этом весьма обобщенном уровне анализа текста можно отличить более полную и четкую инструкцию от поверхностной и фрагментарной. Заключение о качестве инструкции здесь не интуитивное (как в случае экспертной оценки), а аргументированное.
Углубление контент-анализа идет за счет конкретизации понятия «категория регламентации», т.е. поиска детальных индикаторов. Таковыми оказались «элементы регламентации», например «ответственность», «подчиненность» и тд. Категории «подчиненность» и «права лиц, занимающих данную должность» раскрывались через суждения — индикаторы типа «как увольняются и назначаются лица, занимающие данную должность», «кому они подчиняются». Дробное членение содержания служебной деятельности и выявило в тексте такие единицы учета (суждения, сочетания слов, предложения), которые давали возможность построить числовые показатели, характеризующие отдельные качества должностных инструкций: подробность, четкость и т.д.
Категории анализа, по мнению С.И. Григорьева и Ю.Е. Растова, должны быть: а) уместными, т.е. соответствовать решению исследовательских задач; б) исчерпывающими, т.е. достаточно полно отражать смысл основных понятий исследования; в) взаимоисключающими (одно и то же содержание не должно входить в различные категории в одинаковом объеме); г) надежными, т.е. такими, которые не вызывали бы разногласий между исследователями по поводу того, что следует относить к той или иной категории в процессе анализа документа.
Однако указанные требования соблюдаются далеко не всегда. Сведение единиц анализа в категории всегда выступает способом их классификации, критерии которой не только чрезвычайно расплывчаты и туманны, но разнятся от одного исследователя к другому. Они опираются на экспертные оценки социолога, зависят от общего уровня его подготовки и знания социальных реалий. Количество самих категорий будет зависеть от степени допускаемого обобщения социального материала. В результате может нарушаться один из принципов научного исследования — возможность воспроизведения результатов опыта разными исследователями, хотя известно: каким бы образом ни были введены категории, воспроизведение проделанных частотных процедур контент-анализа вполне осуществимо. Однако слабым звеном остается выбор единиц анализа и единиц счета. Для того чтобы избежать априорной категоризации, в качестве единиц анализа зарубежные социологи проводят категоризацию с помощью тематических словарей или каталогов. Для подобных целей еще в конце 1960-х гг. предлагалось применять компьютерные программы, в основе которых лежал факторный анализ.
В любом случае в контент-анализе категории выполняют функцию, аналогичную абстрактным объектам, которые в теоретической модели предмета исследования приходится опе рационализировать, разбивая их на совокупность конкретных терминов и признаков. Роль последних в контент-анализе выполняют «низшие чины» — слова.
Хотя о единицах анализа мы рассказали раньше, чем о его категориях, при построении программы контент-анализа социологи часто идут в обратном порядке — от общего к частному, от категорий к единицам. Подобная логика совпадает с методологией разработки программы фундаментального исследования в социологии,
В таком случае методолого-методическая часть программы разбивается на три этапа. Первым шагом будет определение системы категорий анализа, вторым — соответствующая им единица анализа текста, а третьим — установление единиц счета, т.е. количественной меры единиц анализа (их еще называют индикаторами контент-анализа), позволяющей регистрировать частоту (регулярность) появления признака категории анализа в тексте.
Единице счета— количественная характеристика единицы анализа, она фиксирует регулярность, с которой встречается в тексте та или иная смысловая единица.
За единицу счета могут быть приняты: 1) частота появления признака категории анализа; 2) объем внимания, уделяемого категории анализа в содержании текста. Для установления объема внимания могут быть учтены количество печатных знаков, абзацы, площадь текста, выраженная в физических пространственных единицах. Для газетных и других стандартных текстов — ширина колонки и высота высказывания. Для текстов, передаваемых устно, в качестве единицы счета могут использоваться единицы времени.
Единицами счета могут быть число определенных слов или их сочетаний, частота упоминаний слов, количество строк, печатных знаков, страниц, абзацев, авторских листов, площадь текста, выраженная в физических величинах, эфирное время и многое другое. Единицы счета «могут и совпадать и не совпадать с единицами анализа. В первом случае квантификация сводится к определению частот упоминания выделенной смысловой единицы по отношению к другим категориям (как в случае построения индекса самостоятельности инженеров). Во втором случае единицей счета избирают физическую протяженность или площадь текстов, заполненную смысловыми единицами: число строк, абзацев, квадратных миллиметров, знаков, колонок — в печатных текстах; длительность трансляции по радио или телевидению, метраж пленки при магнитофонных записях» 23 .
Процедура контент-анализа включает в себя применение стандартных правил выделения в изучаемом тексте однотипных единиц анализа (счета, наблюдения) и подсчет частоты встречаемости этих единиц в выборке (количество документов, подвергаемых непосредственному счету) как в абсолютных (число раз), так и в относительных (проценты) величинах. Обязательный момент в такой процедуре — использование математико-статистических методов счета. Ведь основу контент-анализа составляет подсчет встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными количественными или качественными характеристиками.
Связь между категориями устанавливают методом совместной встречаемости слов различных категорий; для каждого предложения текста выясняют, слова каких категорий в нем встречаются. После этого легко подсчитать обычный коэффициент корреляции, который выражает силу связи между категориями и знак этой связи.
Контент-анализ текстов с использованием категорий иногда называют концептуальным анализом. Сфера его применения довольно широка. С его помощью решают два основных типа задач:
1. Есть два или более текстов, которые необходимо сравнить в отношении нагрузки на определенные категории. Например, задача выяснить, какое внимание уделяют две разные газеты определенным темам. Если эти газеты рассчитаны на одну аудиторию, то существенное различие в частотах позволит судить о различиях в политике, проводимой людьми, стоящими за ними.
2. Задача отслеживания динамики изменения нагрузки на определенные категории. Например, выяснить частоту упоминания темы внешнего долга России в фиксированном наборе центральных газет на протяжении какого-то времени и соотнести ее с колебаниями курса доллара путем простого корреляционного анализа.
Из истории разведки известно, как по изменению в специальной литературе частоты упоминания определенных научных тем и фамилий ученых делались достоверные выводы об успехах, достигнутых в конкретных областях исследований.
Относительные частоты употребления тех или иных единиц анализа позволяют сравнивать два и более текстов, делать важные теоретические обобщения. Например, в тексте выступления депутата Думы можно оценить уровень агрессивности, для чего конструируется категория агрессивно окрашенной лексики. После этого сравнивают текст выступления данного депутата с другими выступлениями и выявляют, кто агрессивнее. Можно сравнивать данный текст не с другими текстами, а с некой нормой, своеобразной нулевой отметкой агрессивности. Мы получим ее, если выясним относительную частоту употребления агрессивно окрашенных слов средним носителем русского языка. Помощь в этом могут оказать частотные словари. Сравнивая относительную частоту употребления агрессивно окрашенной лексики в выступлении депутата с частотой ее употребления средним носителем русского языка, можно сделать вывод о степени агрессивности. Но и это еще не все. Небольшие отклонения частот в большую или меньшую сторону могут быть следствием случайных колебаний.
Квантификаиия данных в контент-анализе проводится самыми разными способами. Помимо анализа частотного распределения к ним относятся анализ различного рода корреляций между переменными, ассоциаций, анализ сопряженности, кластерный анализ, их оценка по тем или иным градуированным качественным шкапам.
После квалификации, т.е. перевода данных в числовую форму, их математическая и, в частности, статистическая обработка может осуществляться многими разными программными средствами, в том числе стандартными статистическими пакетами типа СПСС. При анализе текста и последующем сохранении результатов этого анализа в базах данных могут использоваться специальные программы, предназначенные для целей лингвистических исследований.
Аналитические исследования СМИ предполагают проведение статистического и качественного анализа информации за конкретный период. В частности, составляется полный статистический отчет упоминаний в СМИ интересующей клиента темы с отражением характера упоминаний (положительные, нейтральные или негативные отзывы). На основе этих данных выявляются тенденции, разрабатываются рекомендации по ответной реакции в СМИ и улучшению имиджевой ситуации.
В настоящее время различается четыре методологии контент-анализа: грамматический (лингвистический) — по размеру абзацев,. длине фраз, порядку слов в предложении, метрическому составу и другим формальным признакам языка; семантический (социологический) — по экспертным оценкам содержания; документа-листический (кибернетический) — по параметрам языка, текста и документа как сообщения (дескрипторы и их нагрузка, компактность, информационная плотность, аспектность, проточность, физический и информационный объемы, информационная емкость и информативность); цитационный — анализ библиографических ссылок в научной литературе,
Проведение контент-анализа требует предварительной разработки ряда исследовательских инструментов. Разные специалисты и источники называют неодинаковое число таких документов. По мнению С.И. Григорьева и Ю.Е. Растова, их должно быть пять: 1) классификатор контент-анализа; 2) протокол итогов анализа (он еще называется — бланк контент-анализа); 3) регистрационная карточка (кодировальная матрица); 4) инструкция исследователю, непосредственно занимающемуся регистрацией и кодировкой единиц счета; 5) каталог (список) проанализированных документов. Классификатором контент-анализа авторы называют общую таблицу, в которую сведены все категории (и подкатегории) анализа и единицы анализа. Ее основное предназначение — предельно четко зафиксировать то, в каких единицах выражается каждая категория, используемая в исследовании. Классификатор уподобляется социологической анкете, где категории анализа играют роль вопросов, а единицы анализа — ответов, и считается основным методическим документом контент-анализа, предопределяющим содержание других документов. Протокол (бланк) контент-анализа содержит: во-первых, сведения о документе (его авторе, времени издания, объеме и т.п.); во-вторых, итоги его анализа (количество случаев употребления в нем определенных единиц анализа и следующие отсюда выводы относительно категорий анализа). Протоколы заполняются, как правило, в закодированном виде, но не ради сохранения тайны контент-анализа, а исходя из желания на одном листе бумаги уместить всю информацию о документе (так удобнее сопоставлять друг с другом итоги анализа разных документов). Регистрационная карточка представляет собой кодировальную матрицу, в которой отмечается количество единиц счета, характеризующих единицы анализа. Протокол контент-анализа каждого конкретного документа заполняется на основе подсчета данных всех регистрационных карточек, относящихся к этому документу.
По другим источникам, главными среди методических документов контент-анализа являются кодировочная карточка (кодификатор, код, бланк кодировки) и инструкция кодировщику 28 .
Первый нормативный документ принимает разные формы, может быть менее и более подробным, но в любом своем виде он представляет собой таблицу.
В более подробном варианте в кодировочной карточке, т.е. специальной таблице, перечислены единицы наблюдения с необходимой степенью дробности, указаны правила их регистрации и оставлено место для записей результатов наблюдений (подсчета
числа упоминаний и других показателей). В ней указываются также общие характеристики анализируемого текста (название источника, дата и номер анализируемого экземпляра, название анализируемой публикации, автор, жанр). В сокращенном варианте, иногда называемом бланком кодировки, количество сообщаемых сведений меньше. Бланк кодировки составляется в соответствии со схемой операциональных понятий, содержит единицы анализа и все элементы описания проблемной ситуации, устанавливает однозначное соответствие между лексикой текста и кодами, над которыми производятся вычислительные операции. — В качестве примера приведем фрагмент бланка, с помощью которого можно осуществить кодирование
Кодирование данных при контент-анализе обычно осуществляется с помощью достаточно простых анкет или компьютерных программ, в которых фиксируется каждое появление в анализируемом тексте искомой единицы. Операции кодирования проводит кодировщик — сотрудник, который работает с текстом, фиксирует частоту употребления единиц счета.
Инструкция кодировщику. Ее содержанием выступает описание правил соотнесения единиц текста с перечнем категорий анализа, а также правил регистрации в Кодировочной карточке. Примером может служить список категорий и элементов регламентации, который называют кодификатором (кодом). Карточка содержит не только список наблюдаемых индикаторов, но и данные в документе, который подвергся кодированию (например, номер или название подразделения, в котором используется данная инструкция, ее объем в страницах, число разделов и т.п.).
Инструкция кодировщику содержит обычно не только правила поиска и регистрации единиц текста, соответствующих делениям кодификатора, но и примеры таких единиц, слова, высказывания, суждения и т.п.
После разработки инструкция проверяется на однозначность ее понимания различными кодировщиками. Цель — выяснить, помогает ли инструкция кодировщикам получать единообразные, стандартные результаты, не зависящие от субъективных особенностей восприятия кодировшиков. Делается это следующим образом: один и тот же текст дается группе кодировщиков, которые работают с едиными кодификаторами (кодировочными карточками) и инструкциями. Затем проверяется совпадение результатов. Случаи расхождения результатов выясняются, обсуждаются их причины. Те указания инструкции, которые не обеспечивают однозначного восприятия кодировщиками, уточняются, после чего проводится новая проверка инструкции до получения необходимого уровня совпадения результатов.
В контент-анализе изучение любого текста проливает свет на его автора и те социальные условия, в которых создавался текст. В результате обнаруживаются авторство анонимной работы и плагиат, определяются жанр и авторский стиль, степень новизны и достоверности и даже характер интеллекта автора. Отсюда принадлежащее А.Г. Здравомыслову полушутливое определение контент-анализа как «научно обоснованного метода чтения между строк». Контент-анализ позволяет социологу изучать более глубокий слой социальных явлений, чем это доступно другим методам. Чтобы обнаружить явление, стоящее за суждениями, в социологии ищут связанные с ним слова, А для понимания их важности сравнивают с другими основополагающими понятиями. События в Косове и вторая чеченская война изменили политический и культурный климат России. Они отразились в публикациях СМИ и электронной базе Интернета. Анализ частоты употребления слов «Косово», «беженцы», «албанцы», «Югославия», «НАТО» и подобных им демонстрирует, насколько было взбудоражено общественное сознание россиян этими событиями. Контент-анализ электронных изданий, проведенный А. Костинским, выявил удивительную вешь: в период косовского кризиса слово «НАТО» встречалось 132 раза на 100 тыс. слов, США — более 80. Для сравнения: даже сумма частот употребления слов «Чечня», «чечен», «чеченцы», «чеченская» ни в первую, ни во вторую чеченскую войну не превышала 16 слов на 100 тыс. Создается впечатление, будто НАТО и США — главная забота россиян. Размытый прежде враждебный образ Запада сосредоточился для нас в этих двух понятиях 30 .
Если контент-анализ применяется впервые, то допускаются многочисленные ошибки. Среди них специалисты отмечают наиболее типичные просчеты:
Анализ документов опережает разработку исследовательской программы.
Анализируются документы, не связанные с гипотезами исследования (имеющие сходство с темой исследования лишь по названию).
Не проверена подлинность документа.
Не уточнено его авторство.
Неполно учтено его предназначение.
Категории анализа не определены до такой степени, которая позволяет четко различать смысловые единицы текста документа.
Категории анализа не субординарны и не приведены в соответствие с теми дефинициями и операционализирующими их терминами, которые зафиксированы в программе исследования.
Категории анализа несопоставимы со смыслом и языком текста анализируемого документа.
Единицы анализа характеризуют категории анализа лишь внешне, а не по существу, поэтому единицы анализа не позволяют идентифицировать содержание документа в полном соответствии с категориями анализа.
Анализ документа ведется без предварительной подготовки всего комплекса методических инструментов.
Классификатор имеет недочеты, составлен с нарушением правил логики.
Регистраторы (кодировщики) не получили должной методической подготовки.
Инструкция по регистрации и кодировке недостаточно полная, составлена исследователем, который сам предварительно не апробировал инструментарий.
Кодировка не соответствует программе математической обработки данных исследования.
Результаты контент-анализа не перепроверены информацией, собранной иными методами.
Контент-анализ прессы требует сравнительно больших затрат времени и средств, поэтому может использоваться и метод экспресс-анализа. В его основе лежит количественный подсчет содержательных элементов текста (факт, конфликт, аргумент, тема, обобщение), а также учет качественных характеристик публикаций (соответствие цели, информативность, актуальность, доказательность, конструктивность). Как и при контент-анализе, эти характеристики текста кодируются, обозначаются определенной цифрой, и затем при чтении текста исследователь их фиксирует».
Переписи. К отечественным всеобщим переписям современного типа принято относить Всесоюзные переписи 1926, 1937, 1939, 1959, 1979 и 1989 гг., а также Первую всеобщую перепись населения Российской империи 1897 г. Иногда в этом ряду упоминается перепись 1920 г., но она не полностью охватила территорию РСФСР в тогдашних ее границах из-за продолжавшейся гражданской войны.
Материалы переписей используются на всех этапах этносоциологи-ческого исследования: в процессе предварительного осмысления проблемы, планирования выборки, интерпретации данных.
От переписи к переписи содержание многих признаков-вопросов, включавшихся в бланки, менялось.
Текущий учет населенияК материалам текущего учета населения, содержащим личностные характеристики, относятся следующие:
1) архивы отделов ЗАГС, в которых хранятся акты о рождении и смерти, о заключении и расторжении брака;
2) картотеки паспортных столов милиции: форма, заполняемая при получении паспорта, листки прибытия и убытия, а также статистические талоны к ним, фиксирующие факт прописки и выписки;
3) домовые и нехозяйственные книги, заполняемые на проживающих в каждом жилом помещении.
Значительный интерес для изучения представляют данные похозяйственного учетав сельской местности, а также домовых книгв городах.
Основными документами нехозяйственного учета являются: форма № 1 — похозяйственная книга, форма № 2 — список лиц, временно проживающих на территории сельсовета, форма № 3 — алфавитная книга хозяйств. Похозяйственные книги с момента своего введения в 1934 г. испытывали лишь незначительные изменения в составе учитываемых признаков. В отличие от уже рассмотренных документов текущего учета населения, здесь каждая форма заполняется не на отдельного человека, а на семью — совокупность лиц, ведущих совместное хозяйство и находящихся в родственных отношениях. Помимо личных данных, в нехозяйственных книгах содержится экономическая характеристика хозяйства.
Менее надежны экономические характеристики хозяйства, так как они связаны с налогообложением и в ряде случаев могут искажаться.
Бланки домовых книг также заполняются на одну семью, при условии проживания ее в одном помещении, и ведутся паспортистками ЖЭК и ЖСК. Каждый житель характеризуется примерно по тем же параметрам, что и в нехозяйственных книгах; кроме того, фиксируются основные характеристики жилой площади. Материалы домовых книг могут стать важным источником исследования городского населения, хотя до сих пор они использовались в основном как вспомогательный источник при организации выборки. Также не разрабатывались данные картотек временного учета как в сельской, так и в городской местности.
Изменившаяся с начала 90-х годов политическая ситуация в стране значительно расширила круг источников, доступных исследователю; в ряде случаев появились новые источники.
Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим.
Механическое удерживание земляных масс: Механическое удерживание земляных масс на склоне обеспечивают контрфорсными сооружениями различных конструкций.
источник