Контент-анализ. Контент анализ Основные процедуры контент-анализа

Контент-анализ — описание метода

Контент-анализ (от англ. contens содержание) — метод качественно-количественного анализа содержания документов с целью выявления или измерения различных фактов и тенденций, отраженных в этих документах. Особенность контент-анализа состоит в том, что он изучает документы в их социальном контексте. Может использоваться как основной метод исследования (например, контент-анализ текста при исследовании политической направленности газеты), параллельный, т.е. в сочетании с другими методами (напр., в исследовании эффективности функционирования средств массовой информации), вспомогательный или контрольный (напр., при классификации ответов на открытые вопросы анкет).

Не все документы могут стать объектом контент-анализа. Необходимо, чтобы исследуемое содержание позволило задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также, чтобы интересующие исследователя элементы содержания встречались с достаточной частотой (принцип статистической значимости). Чаще всего в качестве объектов исследования контент-анализа выступают сообщения печати, радио, телевидения, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет. Основные направления применения контент-анализа: выявление того, что существовало до текста и что тем или иным образом получило в нем отражение (текст как индикатор определенных сторон изучаемого объекта — окружающей действительности, автора или адресата); определение того, что существует только в тексте как таковом (различные характеристики формы — язык, структура, жанр сообщения, ритм и тон речи); выявление того, что будет существовать после текста, т.е. после его восприятия адресатом (оценка различных эффектов воздействия).

В разработке и практическом применении контент-анализа выделяют несколько стадий. После того, как сформулированы тема, задачи и гипотезы исследования, определяются категории анализа — наиболее общие, ключевые понятия, соответствующие исследовательским задачам. Система категорий играет роль вопросов в анкете и указывает, какие ответы должны быть найдены в тексте. В практике отечественного контент-анализа сложилась довольно устойчивая система категорий — знак, цели, ценности, тема, герой, автор, жанр и др. Все более широко распространяется контент-анализ сообщений средств массовой информации, основанный на парадигматическом подходе, в соответствии с которым изучаемые признаки текстов (содержание проблемы, причины ее возникновения, проблемообразующий субъект, степень напряженности проблемы, пути ее решения и др.) рассматриваются как определенным образом организованная структура.

Категории контент-анализа должны быть исчерпывающими (охватывать все части содержания, определяемые задачами данного исследования), взаимоисключающими (одни и те же части не должны принадлежать различным категориям), надежными (между кодировщиками не должно быть разногласий по поводу того, какие части содержания следует относить к той или иной категории) и уместными (соответствовать поставленной задаче и исследуемому содержанию). При выборе категорий для контент-анализа следует избегать крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Иногда необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми для контент-анализа.

После того, как категории сформулированы, необходимо выбрать соответствующую единицу анализа — лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явления. В практике отечественных контент-аналитических исследований наиболее, употребительными единицами анализа являются слово, простое предложение, суждение, тема, автор, герой, социальная ситуация, сообщение в целом и др. Сложные виды контент-анализа обычно оперируют не одной, а несколькими единицами анализа. Единицы анализа, взятые изолировано, могут быть не всегда правильно истолкованы, поэтому они рассматриваются на фоне более широких лингвистических или содержательных структур, указывающих на характер членения текста, в пределах которого идентифицируется присутствие или отсутствие единиц анализа — контекстуальных единиц. Например, для единицы анализа «слово» контекстуальная единица — «предложение». Наконец, необходимо установить единицу счета — количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п.), появление признаков в тексте, частота их появления (интенсивность).

Важен выбор необходимых источников, подвергаемых контент-анализу. Проблема выборки содержит в себе выбор источника, количества сообщений, даты сообщения и исследуемого содержания. Все эти параметры выборки определяются задачами и масштабами исследования. Чаше всего контент-анализ проводится на годичной выборке: если это изучение протоколов собраний, то достаточно 12 протоколов (по числу месяцев), если изучение сообщений средств массовой информации — 12—16 номеров газеты или теле-, радиодней. Обычно выборка сообщений средств массовой информации составляет 200—600 текстов.

Термин content-analysis впервые начал применяться в конце XIX – начале XX вв. в американской журналистике (см. раб.: Б.Мэттью, А.Тенни, Д.Спиид, Д.Уипкинс). У истоков методологии контент-анализа находились американский социолог Г. Лассуэл и французский журналист Ж.Кайзер.

Так, в начале 60-х гг. Г. Лассуэл осуществил попытку политологического анализа СМИ, исходя из учета формальных критериев. Он ввел в научный оборот некую абстрактную единицу: «слово». Целью работы Лассуэла было получение собственно социологического результата на нетипичном для социологии материале: текстах печатных изданий. Исследователь проделал огромную работу, но, поскольку в методике Лассуэла качественные оценки не были адекватно соотнесены с количественными методами, результаты его трудов с трудом поддавались верификации.

В начале 60-х гг. Ж. Кайзер разработал оригинальную методику статистического анализа периодики. В ее основе лежал подход к тестовому массиву, как информационной системе. Тем самым Кайзер сформулировал теоретическую базу последующего распространения социологических методов в сферы изучения всех нарративных источников, включая эпиграфический и эпистолярный материал. В работе Ж. Кайзера акцентировалось внимание на внешней форме организации материала: его расположении, оглавлении, оформлении и т.д. Кайзер разработал целый комплекс исследовательских процедур, обеспечивающих полную формализацию, как единичного газетного номера, так и совокупности однотипных периодических изданий. Тем самым Ж.Кайзер сформулировал систему, позволяющую фиксировать развитие тенденций в публикациях СМИ.

Свое дальнейшее развитие «кайзеровское направление» методологии контент-анализа получило в работах Э. Морэн. Э. Морен ввела в научный оборот термин «единица информации» - семантический блок, содержание которого отвечает на вопрос: «О чем говориться?» Последнее обстоятельство сделало возможным изучение любых форм организации текстового материала, причем, как на терминологическом уровне, так и на уровне фразы, абзаца, статьи и даже целых книг. Тем самым, Э.Морэн разрушила критерий однородности, применявшийся ранее при статистической обработке нарративов. Взамен, она предложила идеологию «семантических групп», которые, по ее мнению, должны учитываться по тематическому признаку. Кроме того, Э.Морэн разработала концепцию «тона» материала, который определялся социометрически: «положительная информация», «отрицательная», «нейтральная».

Важный вклад в развитие контент-анализа внесли российские и эстонские социологи, особенно А.Н.Алексеев, Ю. Вооглайд, П. Вихалемм, Б.А. Грушин, М. Лауристинь и др.

Для изучения содержания текста традиционно применяется метод контент-анализа. Слово «контент» означает содержимое (или содержание) документа. Под документом при этом понимается не только официальный текст (типа инструкции или правового закона), но все написанное или произнесенное, все, что стало коммуникацией. Так, по словам Ядова В.А., документальной называют любую информацию, фиксированную в печатном или рукописном тексте, на магнитной ленте, на фото- или киноплёнке.

Контент-анализу подвергаются книги, газетные или журнальные статьи, объявления, телевизионные выступления, кино- и видеозаписи, фотографии, лозунги, этикетки, рисунки, другие произведения искусства, а также, разумеется, и официальные документы. В настоящее время в связи с активным использованием электронных средств общения, анализу подвергаются и электронные документы.

Существуют различные определения контент-анализа, некоторые из них не совпадают во взглядах на количественный и качественный аспект метода. Так, существуют две точки зрения на контент-анализ :

Контент-анализ - самостоятельный метод, отличный от обычного содержательного анализа документов

Принципиальное отличие этих методов анализа заключено в явно выраженной строгости, формализованности, систематизированности контент-анализа. Он нацелен на выработку количественного описания смыслового и символического содержания документа, на фиксацию его объективных признаков и подсчет последних.

Федотова Л.Н. выделяет такие присущие методу характеристики: сложность, тщательность, пунктуальность трудоёмкость.

Являясь сторонником данной точки зрения на контент-анализ, В.А.Ядов определяет контент-анализ следующим образом - это перевод в количественные показатели массовой текстовой (или записанной на плёнку) информации с последующей статистической её обработкой.

Вторая точка зрения принимает в расчет оба вида анализа.

Контент-анализ включает в себя как количественный, так и качественный анализ текста.

Первый дополняет второй, а их сочетание углубляет понимание смысла любого текста. Контент-анализ позволяет обнаружить в документе то, что ускользает от поверхностного взгляда при его традиционном изучении, но что имеет важный социальный смысл.

Итак, с точки зрения видов проводимого анализа, выделяется два вида: количественный и качественный контент-анализ. При проведении количественного контент-анализа анализируется частота появления в тексте каких-либо единиц, будь упоминания тем или названий компаний. Определения качественного контент-анализа достаточно размыты, в них чаще всего говорится, что при проведении качественного анализа выводы делаются на основе наличия в тексте какого-либо факта. На самом деле, речь идет об интерпретации содержания текста, которое часто встречается в исторической науке и филологии. По этой причине качественный контент-анализ вернее называть интерпретативным.

В западной исследовательской традиции контент-анализ однозначно рассматривается как количественный метод. Несомненно, что количественный контент-анализ обладает более широкой областью применения и надежностью, чем качественный. Одна из наиболее значимых причин – это объективный характер количественных показателей, в то время как интерпретация почти всегда носит субъективный характер. Впрочем, интерпретация результатов количественного анализа тоже имеет субъективные элементы.

По мнению ряда социологов (Маркоффа, Шапиро, Вейтмана и др.), контент-анализ можно было бы назвать «текстуальным кодированием», так как он предполагает получение количественной информации о содержимом документа на основе ее кодирования.

Итак,количественный контент-анализ в первую очередь интересуется частотой появления в тексте определенных характеристик (переменных) содержания.

Качественный контент-анализ позволяет делать выводы даже на основе единственного присутствия или отсутствия определенной характеристики содержания.

На вопрос: "в каких случаях не следует прибегать к количественному анализу?", В.А. Ядов отвечает: если мы имеем дело с уникальными документами, где главная цель изучения - всесторонняя содержательная интерпретация материала.

От количественных данных качественные отличаются тем, что содержание последних несет в себе смысл, непосредственно характеризующий самого их носителя, в то время как количественные указывают на масштаб, объем, интенсивность характеристик изучаемого явления. Качественные данные позволяют раскрыть значения социального явления, количественные показывают, насколько часто оно случается или насколько интенсивно представлено в социальной реальности. Качественные данные обозначают предмет исследования, количественные - показывают, насколько сильно он проявлен в объекте. Продолжая такого рода рассуждения, можно сделать вывод, что одни данные в большей степени ориентированы на создание суждения о социальном явлении, другие - на оценку значимости или тестирование этого суждения. Эти различия в природе двух типов данных привели к тому, что так называемые качественные исследования (исследования, основанные на сборе и анализе качественных данных) стали связывать в большей степени с этапом генерирования или построения теории, а количественные исследования - с ее верификацией.

То, что качественным методам отводится второстепенная роль, значительно сужает их возможности, по мнению Б. Глезера и А. Страусса, выдвинувших "обоснованную теорию" (grounded theory). Авторы помещают свой метод качественного исследования - "обоснованную теорию" - между подходом контент-анализа и подходом, предлагающим выработку некоторых предварительных идей и гипотез. Классический контент-анализ предлагает следующую модель: сначала задается модель кодировки, а потом данные систематически собираются, оцениваются и анализируются по заранее определенным, неизменным и единым для всех них шкалам, которые позволяют придать качественным (словесным) данным квантифицируемую форму.

Метод Глезера и Страусса предполагает постоянное сравнение и перегруппировку данных. Цель метода постоянного сравнения, в котором объединены кодирование и анализ, - генерирование теории более систематически, чем предполагается во втором подходе, при помощи использования развернутого кодирования и аналитических процедур.

Сравнительный метод используется на каждом этапе аналитического процесса построения обоснованной теории. Он включает в себя следующие процедуры: кодирование, выделение ключевых категорий, теоретический отбор и формирование теоретической выборки, теоретическое насыщение и интеграцию теории.

Этапы контент-анализа

	Определение задач, теоретической основы и объекта исследования, разработка категориального аппарата, набор соответствующих качественных и количественных единиц.
	Составление кодировочной инструкции.
	Пилотажная кодировка текста
	Кодировка всего массива исследуемых текстов.
	Статистическая обработка полученных количественных данных.
	Интерпретация полученных данных на основе задач и теоретического контекста исследования.

Контент-анализ состоит из ряда этапов: отбора материалов, выбора единицы анализа, подсчета единиц и, наконец, интерпретации результатов. С точки зрения чистой методологии отбор материалов носит предварительный характер. После определения темы происходит определение потенциального круга источников, в которых может находиться интересующая информация. Затем из этой информации отбирается та, которая содержит значимую с точки зрения исследования информацию. Отобранные материалы далее анализируются. В классических описаниях метода оговаривается, что при большом объеме более или менее однородных источников допустим анализ не всего массива информации, а только части её.

Описывая процедуру контент-анализа, можно выделить несколько этапов, а именно:

1-й этап исследования : Определение задач, теоретической основы и объекта исследования, разработка категориального аппарата, набор соответствующих качественных и количественных единиц.

Данный этап непосредственно связан с составлением программы исследования. Он носит характер качественного анализа, который подготавливает перевод смыслового содержания текста в цифровое выражение для его последующего количественного анализа. В этих целях на основе задач и теоретического контекста осуществляется выбор объекта исследования и определяются конкретные единицы анализа.

2-й этап : Составление кодировочной инструкции.

На этом этапе осуществляется соотнесение категорий и подкатегорий контент-анализа с конкретными содержательными элементами текста, т.е. происходит отыскание в тексте индикаторов выбранных категорий исследования. Здесь либо составляется соответствующий словарь индикаторов категорий, либо даётся развёрнутое описание категорий в терминах исследуемых текстов. Все категории и подкатегории контент-аналитического исследования кодируются, т.е. им даются определённые цифровые или буквенные обозначения, что составляет код данного исследования. Всё это входит в кодировочную инструкцию. В неё также включается обозначение знака информации. Он обычно определяется как "положительное", "отрицательное" и "нейтральное" отношение, что соответственно кодируется как +, -, 0.

Составление кодировочной инструкции имеет очень большое значение, так как по существу в ней находят своё конкретное выражение основные положения методики исследования. Кроме соответствующего определения категорий и подкатегорий и других единиц анализа в кодировочную инструкцию включаются правила кодирования, оговариваются спорные случаи и т.д. При составлении конкретного кода в категориях предусматривается подкатегория "другое", в которую включаются те индикаторы данной категории, которые не вошли в выделенные подкатегории, но тем не менее являются её референтами и поэтому должны быть зафиксированы в частоте (и объёме) её упоминаний. Необходимость включения подкатегории "другое" вызывается тем, что заранее невозможно, а часто и не нужно предусматривать все подкатегории.

3 -й этап: Пилотажная кодировка текста

На данном этапе осуществляется кодировка части исследуемого массива текстов с целью апробации методики, изложенной в кодировочной инструкции. Кодировка текста представляет собой процедуру непосредственного перевода качественных, смысловых единиц (категорий, подкатегорий) через нахождение их индикаторов в тексте в количественные единицы, т.е. перевод текстов в условные обозначения - коды (цифры или буквы, которыми обозначены в кодировочной инструкции те или иные подкатегории). Подобная пилотажная кодировка даёт возможность проверить надёжность методики, т.е. испытать её на обоснованность (соответствие задачам и теоретическим понятиям исследования) и устойчивость (воспроизводим ость результатов)

Обоснование полноты объёма выделяемых смысловых единиц доказывается следующим образом: выделяются все смысловые единицы из первого анализируемого текста, затем из второго текста - те же единицы плюс ранее не встречавшиеся, из третьего документа - те же, что встречались в двух предыдущих, плюс дополнительные и т.д. После изучения 3-5 очередных текстов, в которых не попадается ни одной новой единицы, ранее не фиксированной в предыдущих документах, можно полагать, что "поле" смысловых единиц из изучаемого материала исчерпано.

Устойчивость данных определяется при помощи повторного кодирования тех же документов тем же кодировщиком ("устойчивость во времени") или разными кодировщиками по единой инструкции ("устойчивость среди аналитиков").

4-й этап : Кодировка всего массива исследуемых текстов.

Осуществляется процесс квантификации, т.е. перевод в цифровое выражение всей совокупности исследуемых текстов. Регистрация частоты (и объёма) упоминания категорий и подкатегорий контент-анализа может производиться либо в заранее подготовленных таблицах, либо на отдельных карточках и перфокартах.

5-й этап: Статистическая обработка полученных количественных данных.

Эта обработка осуществляется вручную или на ЭВМ. Нередко оба эти способа используются одновременно в сочетании. Существуют специальные компьютерные программы, помогающие осуществить анализ более оперативно, такие как Контент-анализ 1.6, WINMAX, ATLAS/ ti, NUDIST, а также AQUAD, CAQDAS, ETHNOGRAPH.

Статистическая обработка цифрового материала, полученного в процессе кодировки, не отличается фактически по своим методам от статистической обработки данных, полученных в других видах социально-психологических исследований. Обычно используются процентные и частотные распределения, разнообразные коэффициенты корреляций и т.д. Вместе с тем используются и особые способы количественной обработки данных (см. формулу "удельного веса" смысловых категорий в общем объёме текста, предложенную А.Н. Алексеевым).

6 -й этап: Интерпретация полученных данных на основе задач и теоретического контекста исследования.

На данном, последнем этапе исследования, как и на первом, связанным с составлением программы, особенно ярко выступает качественная сторона контент-анализа в отличие от количественного аспекта, преобладающего на промежуточных этапах. Для адекватной интерпретации результатов и их соотнесения с данными, полученными с помощью других методов, особенно большое значение имеет учёт более широкого теоретического и социального контекста.

Формализованность, систематизированность и строгость контент-анализа проявляется в следующем. Прежде, чем непосредственно анализировать текст документа, исследователь определяет категории анализа, т.е. ключевые понятия (смысловые единицы), имеющиеся в тексте и соответствующие тем дефинициям и их эмпирическим индикаторам, которые зафиксированы в программе исследования. При этом желательно избежать крайностей. Если за категории анализа будут приняты слишком общие (абстрактные) понятия, то это предопределит поверхностность анализа текста, не позволит углубиться в его содержание. Если же категории анализа будут предельно конкретными, то их окажется слишком много, что приведет не к анализу текста, а к его сокращенному повторению (конспекту). Нужно найти золотую середину и постараться достичь того, чтобы категории анализа были: а) уместными, т.е. соответствовали решению исследовательских задач; б) исчерпывающими, т.е. достаточно полно отражали смысл основных понятий исследования; в) взаимоисключающими (одно и то же содержание не должно входить в различные категории в одинаковом объеме); г) надежными, т.е. такими, которые не вызывали бы разногласий между исследователями по поводу того, что следует относить к той или иной категории в процессе анализа документа.

Единицы контент-анализа После определения системы категорий анализа выбирается соответствующая им единица анализа текста.

Богомолова Н.Н. И Стефаненко Т.Г. предлагают разделять единицы контент-анализа на две большие группы:

качественные

количественные .

Качественные единицы контент-анализа отвечают на вопрос, ЧТО надо считать в тексте, а количественные единицы отвечают на вопрос, КАК надо считать.

К качественным предлагают отнести категории и их референты в тексте (индикаторы). Следует обратить внимание на то, что для обозначения различных единиц контент-анализа используются разнообразные термины, лишь основная единица контент-анализа - категория - признаётся всеми авторами. Большой разнобой в терминологии при обозначении различных единиц контент-анализа в определённой степени затрудняет понимание процедуры данного метода.

Категории могут подразделяться на более мелкие качественные единицы - подкатегории. Индикаторами категорий называются те элементы текста, те единицы содержания, которые служат референтами, качественными признаками соответствующих категорий и подкатегорий. В зависимости от специфики исследования индикаторы категорий могут выражаться в виде отдельных слов, словосочетаний, суждений, тем и т.д.

За единицу анализа может быть принято: а) слово б) предложение в) тема г) идея д) автор е) персонаж ж) социальная ситуация з) часть текста, объединенная чем-то, что соответствует смыслу категории анализа

Когда контент-анализ выступает единственным методом информации, оперируют не одной, а сразу несколькими единицами анализа.

При использовании самой простой единицы анализа, слова, очень легко потерять контекст упоминания. Прямой подсчет количества упоминаний дает так называемые «простые частоты». Однако для сравнения, например, количества упоминаний такой показатель не подходит в силу того, что является нестандартизированным. Возникает необходимость использования «относительных частот», т.е. количество упоминаний на какую-либо единицу текста (общее число слов в публикациях, тысячу слов, количество предложений, абзацев, публикаций и т.д.).

Количественными единицами контент-анализа являются единицы счёта и единицы контекста.

Единицы контекста используются для обозначения того сегмента текста, в пределах которого определяется частота упоминания соответствующих категорий и подкатегорий. Единицей контекста может служить предложение, статья, ответ на вопрос анкеты, интервью и т.д. Затем устанавливаетсяединица счета , т.е. количественная мера единицы анализа, позволяющая регистрировать частоту (регулярность) появления признака категории анализа в тексте. Единицами счета могут быть число определенных слов или их сочетаний, количество строк, печатных знаков, страниц, абзацев, авторских листов, площадь текста, выраженная в физических пространственных величинах и многое другое.

Богомолова Н.Н. И Стефаненко Т.Г. выделяют два вида подсчётов частоты упоминаний категорий и подкатегорий при квантификации: а) сплошной, терминологический, б) сегментарный, типологический.

При сплошном подсчёте регистрируются, а потом подсчитываются все появления индикаторов данной категории или подкатегории. При сегментарном, тематическом подсчёте упоминаний категорий регистрируется лишь первое появление данной категории в единице контекста, а повторные упоминания этой категории в данной единице контекста не учитываются.

Единицей счёта может быть объём - физическая протяженность или площадь текстов, заполненная смысловыми единицами. Объём упоминаний категорий может измеряться различными способами: подсчётом числа строк, печатных знаков, квадратных сантиметров площади, посвященных данной категории и т.д.

В основу системы кодирования должна быть заложена по крайней мере одна (или несколько) из следующих четырех характеристик содержания текста: частоты, направленности, интенсивности и пространства. Как уже отмечалось выше, чаще всего измеряют частоту и объём занимаемого пространства. В исследовательском проекте, основанном на контент-анализе, исследователь может замерить как одну, так и все четыре характеристики. Поясним, что собой представляет каждая из них.

Частота. Это всего лишь фиксация и подсчет, имеет ли нечто место или нет, а если да, то как часто. Например, сколько пожилых людей появляется в телевизионных программах на протяжении одной недели? Какова их доля среди всех персонажей? Или же какова доля этих программ среди остальных?

Направленность. Речь идет об указании направления сообщений внутри содержания некоего континуума (их позитивный или негативный, поддерживающий или опровергающий характер). Например, исследователь может разработать перечень способов показа ситуаций, в которых действуют пожилые люди. Способы эти могут быть позитивными (например, дружелюбный, мудрый, уравновешенный человек), либо негативными (например, непристойный, тупой, самовлюбленный).

Интенсивность. Это сила или мощь сообщения в заданной направленности. Например, негативная характеристика забывчивости может быть смягчена (забыл взять ключи, уходя из дома; не сразу вспомнил имя человека, которого не видел несколько лет) или преувеличена (не помнит, как его зовут, не узнает своих детей).

Пространство. Исследователь может зафиксировать размер сообщения или количественно охарактеризовать пространство, им занимаемое. Пространство письменного текста измеряется путем подсчета слов, предложений, абзацев или места, отведенного сообщению на странице (например, в квадратных дюймах или сантиметрах). Для измерения видео- и аудиотекстов можно использовать количественные характеристики времени. Например, персонаж может присутствовать в течение нескольких секунд или появляться периодически в каждой сцене двухчасовой программы.

В общем виде процедуры подсчёта при контент-анализе аналогичны стандартным приёмам классификации по выделенным группировка, ранжирования и шкального измерения. Для исчисления результатов контент -анализа используются и специально разработанные формулы.

А.Н. Алексеев предложил для оценки "удельного веса" смысловых категорий в общем объёме текста следующую формулу, указывающую на уровень интенсивности представленной в тексте определённой темы:

Укс - "удельный вес" данной смысловой единицы

Кгл - число случаев, когда смысловая единица оказалось главной

Квт - число случаев, когда та же единица оказывается второстепенной

E - сумма анализируемых текстов (документов)

Специальным способом, разработанным для нужд контент-анализа, является методика Ч. Осгуда анализа зависимости элементов для расчёта совместной встречаемости различных элементов в тексте. Процедура данной методики состоит в том, что после подсчёта совместной встречаемости единиц анализа, рассчитывается квадратная матрица возможных и фактических совместных появлений этих единиц в тексте.

1. Типы информационных массивов и единицы контент-анализа

Основа контент-анализа - это подсчет встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными иными количественными или качественными характеристиками. Отсюда понятно, что главная предпосылка контент-анализа - это выяснение того, что считать; иными словами, определение единиц анализа.

Единицы эти в зависимости от целей анализа, типа информационного массива, а также ряда дополнительных причин могут быть (и реально бывают) весьма разнообразными. К ним предъявляются два естественных, но, к сожалению, обычно плохо совместимых требования. С одной стороны, они должны легко и по возможности однозначно идентифицироваться в тексте; в идеале хотелось бы, чтобы их выявление вообще могло быть алгоритмизовано.

Понятно, что такому требованию лучше всего удовлетворяют формальные элементы текста или же элементы, имеющие четко выраженные и однозначные формальные соответствия, например слова. С другой стороны, от единиц контент-анализа чаще всего требуется некая субъективная, да к тому же еще и зависящая от контекста значимость, делающая их распределение и динамику такого распределения диагностичными для выявления изменений в индивидуальном и общественном сознании, системах убеждений и т.д. - иными словами, единицы должны быть интересными для последующей (политологической, культурологической, социологической и т.д.) интерпретации.

Между тем такие единицы (например, темы) носят собственно содержательный характер, и упоминание их в тексте может осуществляться многими разнообразными способами. Их идентификация в общем случае предполагает семантический анализ текста, проблема автоматизации которого, несмотря на многолетние усилия лингвистов и программистов, далека от решения. Характеристику единиц контент-анализа необходимо предварить кратким соображением о природе анализируемого информационного массива.

В самом определении метода контент-анализа нет ничего, что препятствовало бы применению его к отдельно взятому тексту; более того, примеры такого анализа известны. Тем не менее существует ряд причин, по которым объектом контент-аналитических проектов обычно является не отдельный текст, пусть даже значительный по объему, а именно информационный массив, или информационный поток, состоящий из большого количества текстов.

Во-первых, статистические закономерности проявляются тем более отчетливо, чем больше объем выборки.

Во-вторых, большинство целей контент-анализа предопределяют его тяготение к компаративности; аналитиков чаще всего интересуют не одномоментные срезы, а динамика изменений, а если и срезы, то, как правило, «пестрые», отражающие, например, различные СМИ или сознание различных социальных групп.

Наконец, при всем разбираемом ниже разнообразии единиц контент-анализа наиболее популярными являются различные макроединицы: темы и/или проблемы, пропозиции, образы и идеологемы. Таковых в отдельно взятых текстах и особенно в небольших по объему текстах СМИ обычно немного, да и новые макроединицы появляются не столь часто, поэтому оценить их динамику можно лишь на большом временном промежутке или при широком «горизонтальном сопоставлении».

Таким образом, идея контент-анализа предполагает анализ больших информационных массивов; с другой стороны, его относительная дешевизна и технологичность делают такой анализ принципиально возможным. Поэтому не приходится удивляться тому, что в истории контент-анализа имеются такие проекты, как анализ 427 школьных учебников, 481 частной беседы, 4022 рекламных слоганов, 8039 (в 1938) и 19 533 (в 1952) редакционных статей или 15 000 персонажей в 1000 часов телевизионного эфирного времени. Конкретное разнообразие единиц контент-анализа практически безгранично, однако среди них можно выделить несколько основных типов. (Классификация, приводимая ниже, построена с учетом типологии К.Криппендорфа, однако отличается от нее весьма существенно.)

Информационные технологии, способствующие повышению мотивации при обучении говорению.

Использование фразеологических единиц в языке детективного жанра (на примере творчества Агаты Кристи)

При исследовании фразеологического состава современного английского языка мы считаем необходимым ознакомиться с понятиями идиомы (или фразеологической единицы), представленными в различных лингвистических источниках...

Контент-аналитические исследования текстов и текстовых массивов

Контент-аналитические исследования можно разделить на два больших класса, которые, пользуясь вышеупомянутой «военной метафорой», можно назвать фронтальными и рейдовыми...

Лаборатория информационной безопасности: языковой аспект

Всемирная федерация ученых в августе 2000 г. первой в списке угроз человечеству в XXI веке поставила угрозу информационной безопасности. Почему угрозы в информационной сфере вырвались вперед, обогнав экологию...

Методы статистического анализа текста

Появление такого метода как контент-анализ среди других методов статистического анализа было обусловлено прежде всего тем, что возникла потребность в создании определенного объективного метода анализа текста...

Методы статистического анализа текста

Известно, что методика контент-анализа нашла широкое применение именно в информационную эпоху, переживая второе рождение вместе с развитием Интернета. Однако, стоит помнить, что появился данный метод задолго до создания глобальной сети...

Методы статистического анализа текста

Процедура контент-анализа различается в зависимости от источников информации и особенностей задач их анализа. В общем виде она описывается как набор следующих этапов...

Методы статистического анализа текста

В научной литературе принято выделять следующие основные виды контент-анализа : · Количественный контент-анализ...

Сложное синтаксическое целое

В соответствии с вышеизложенным текст может быть проанализирован по следующей схеме, предложенной профессором Солгаником Г.Я. : 1. Характеристика текста с точки зрения его состава (предложение, строфа или фрагмент) и его композиция. 2...

Как и в начале предыдущего, в данном разделе необходимо дать определения некоторым терминам. Информация - все те сведения, которые уменьшают степень неопределенности нашего знания о каком-либо объекте. А, соответственно...

Современные информационные и коммуникационные технологии и их использование при обучении иностранному языку

Все средства ИКТ, применяемые в системе образования можно разделить на два типа: аппаратные и программные. (Сводную таблицу средств ИКТ см. в Приложении 1). Аппаратные средства: Компьютер - универсальное устройство обработки информации...

Теоретические аспекты морфологии

Аналитический подход к языку (путь от языковых средств к их функциям и значениям) во многом предполагает использование одинаковых исследовательских процедур по отношению к единицам фонологического...

Функционирование неологизмов в сфере информационных технологий

Мы уже определили, что входит в понятие языковых неологизмов. Неологизмы сферы информационных технологий делятся на семантические и лексические...

Контент-анализ представляет собой формализованный метод сбора данных из вторичных источников и качественно-количественного анализа их содержания. Проведение контент-анализа основано на следующих принципах:

Формализации - необходимо задать однозначные правила для выявления искомых характеристик содержания;

Статистической значимости - интересующие исследователя элементы содержания должны встречаться с достаточной частотой.

Алгоритм выполнения контент-анализа представлен на рис. 16 и состоит из следующих этапов:

1. Постановка задач контент-анализа.

2. Определение системы категорий анализа.

3. Определение единицы анализа.

4. Выбор количественных и качественных характеристик текста, которые интересуют исследователя для характеристики взаимосвязи содержания с внешними параметрами.

5. Выбор источников для обследования.

6. Разработка таблиц сбора данных на каждую категорию анализа.

7. Разработка инструкций кодировщику, где описывается система правил сбора эмпирических данных, пояснения для правильного понимания персоналом процедур регистрации заданных единиц анализа, алгоритм действий.

8. Сбор информации.

9. Обработка результатов и их интерпретация.

10. Подготовка отчета.

Объектом анализа могут выступать материалы газет и других печатных изданий, содержание радио- и телепередач, кинофильмов, рекламных обращений, а также данные, полученные посредством открытых вопросов анкет или свободных интервью.

Цель исследования - выявление аспектов, касающихся объекта и предмета исследования, которые получили подробное рассмотрение в документах, вышедших в течение некоторого периода времени. Например, изучение общественного мнения по поводу нового закона о проблемах ЖКХ.

Рис. 16. Алгоритм контент-анализа

В зависимости от целей исследования можно выделить несколько типов контент-анализа:

Первый тип контент-анализа: подсчет символов (ключевых слов), содержащихся в материалах (например, упоминание торговой марки или названия фирмы);

Второй тип: дальнейшая проработка первого - это классификация символов по отношению авторов публикаций к изучаемому объекту (в положительном или отрицательном смысле);

Третий тип: анализ по элементам содержания - классификация отдельных частей документов по заданным критериям.

Четвертый тип: тематический анализ - выявление явных и скрытых тем публикаций.

Пятый тип: структурный анализ - выявление взаимоотношений различных тем публикаций. Эти отношения могут быть взаимодополняющими, развивающими одну тему, и конфликтными (когда темы работают на взаимно противоположные цели).

Шестой тип: анализ взаимоотношений различных материалов, имеющих общую цель публикаций, кроме вопросов пятого типа контент-анализа, - здесь изучается последовательность появления публикаций и отслеживается динамика характеристик содержания во времени (например, изучение реакции на предвыборную агитацию).

Категория контент-анализа - это наиболее общие, ключевые понятия, позволяющие группировать затрагиваемые темы в содержании сообщения в соответствии с выбранной классификацией (например, по проблематике), что позволяет идентифицировать содержание материалов в общем виде. Категория анализа имеет то же назначение, что и вопросы в анкете, т. е. призвана указывать характер получаемых данных.

К процедуре формирования категорий анализа предъявляются определенные требования:

Одни и те же элементы содержания не должны быть отнесены к различным категориям;

Не должно быть разногласий по поводу отнесения элемента содержания к той или иной категории, т. е. категории должны быть надежными.

Единица контент-анализа - это элемент содержания, некоторая его смысловая часть, которая раскрывает определенную категорию. Чтобы определение категории было надежным, необходимо перечислить все единицы анализа или индикаторы их присутствия (признаки наличия определенного элемента содержания). Это могут быть определенные термины, слова, выражения, предложения, имена, темы и т. д. Единицы анализа могут включать в себя оценки отношения (хорошо/ плохо) или оценки эффективности (выгодно/невыгодно) к анализируемым элементам содержания.

Если продолжить рассмотрение примера об изменении законодательства по ЖКХ, то в качестве основных категорий анализа можно выделить:

Проблемы, вынуждающие к изменению законодательства;

Ожидаемые положительные перемены, вызванные изменением законодательства;

Ожидаемые отрицательные перемены, вызванные изменением законодательства;

Конкретные предложения по совершенствованию законодательства.

Расшифровка категории «ожидаемые отрицательные перемены, вызванные изменением законодательства о «ЖКХ» может быть дана с помощью таких единиц: «квартиры скупят «новые русские», «народ попадет в кабалу» т. д.

В исследованиях сообщений средств массовых коммуникаций, где контент-анализ применим наиболее широко, выделяются некоторые «стандартные» смысловые единицы:

Понятие, выраженное отдельным словом, термином или сочетанием слов. Применение такой смысловой единицы целесообразно при изучении способов, посредством которых источник информации организует сообщение, передает свои намерения тем, кому оно направлено, например в рекламе.

Тема, выраженная в единичных суждениях, смысловых абзацах, целостных текстах. Тема является важной смысловой единицей при анализе направленности интересов, ценностных ориентации, установок тех, кто передает сообщение. Однако определение темы бывает затруднено в связи с ее неясностью в тексте. Аналитику приходится определять тему и ее границы внутри текста. Выбор темы в качестве единицы анализа подразумевает также внутреннее разделение текста на определенные части (единицы контекста), в рамках которых тема может быть определена.

Имена людей, географические названия, торговые марки, названия организаций, упоминание какого-либо события. Частота и длительность временного интервала, с которыми они присутствуют в сообщениях, могут послужить показателями их важности, значимости.

Контент-анализ – метод качественно-количественного анализа содержания документов с целью выявления или измерения различных фактов и тенденций, отраженных в этих документах.

Контент-анализ – формализованный метод изучения текстовой и графической информации, заключающийся в переводе изучаемой информации в количественные показатели и ее статистической обработке. Характеризуется большой строгостью, систематичностью. Контент-анализ не отменяет необходимости обычного (т.е. содержательного) анализа документов. Первый дополняет второй, их сочетание углубляет понимание смысла любого текста. Контент-анализ позволяет обнаружить в документе то, что ускользает от поверхностного взгляда при его традиционном изучении, но что имеет важный социальный смысл.

Кроме того, контент-анализ отличается от всех прочих способов изучения документов, тем, что он позволяет «вписать» содержание документа в социальный контекст, осмыслить его одновременно и как проявление, и как оценку социальной жизни. «Вписывание» документа в изучаемую проблему предполагает выявление того, что:

А) существовало до него и получило в нем отражение,

б) наличествует только в нем,

в) будет после него, т.е. явится итогом его восприятия адресатом.

Объект контент-анализа - документы, исследуемое содержание которых, позволяет задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также, интересующие исследователя элементы содержания встречаются с достаточной частотой (принцип статистической значимости).

Чаще всего в качестве объектов исследования контент-анализа выступают сообщения печати, радио, телевидения, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет.

Стадии разработки и применения контент-анализа:

Формулируются тема, задачи и гипотезы исследования

Определяются категории анализа – наиболее общие, ключевые понятия, соответствующие исследовательским задачам.

Система категорий играет роль вопросов в анкете и указывает, какие ответы должны быть найдены в тексте. Категории контент-анализа должны быть уместными, т.е. соответствовать решению исследовательских задач; исчерпывающими, т.е. достаточно полно отражать смысл основных понятий исследования; взаимоисключающими (одно и то же содержание не должно входить в различные категории в одинаковом объеме); надежными, т.е. такими, которые не вызывали бы разногласий между исследователями по поводу того, что следует относить к той или иной категории в процессе анализа документа.

Необходимо выбрать соответствующую единицу анализа – лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явления. За единицу анализа может быть принято слово, предложение, тема, идея, автор, персонаж, социальная ситуация, часть текста, объединенная чем-то, что соответствует смыслу категории анализа. Сложные виды контент-анализа обычно оперируют не одной, а несколькими единицами анализа.

Необходимо установить единицу счета – количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п.), появление признаков в тексте, частота их появления (интенсивность). Единица счета – количественная мера единицы анализа, позволяющая регистрировать частоту (регулярность) появления признака категории анализа в тексте. Единицами счета могут быть число определенных слов или их сочетаний, количество строк, печатных знаков, страниц, абзацев, авторских листов, площадь текста, выраженная в физических пространственных величинах и многое другое.

< Назад
Вперёд >