(pdf) content analysis: a flexible methodology
Litkowski, K., & McTavish, D. (2001). DIMAP-4 (DIctionary MAintenance Programs) [com-
Компьютерное программное обеспечение]. Дамаск, MD: CL Research.
Ломбард, М., Снайдер-Дуч, Дж. и Брекен, К.К. (2005). Практические ресурсы для анализа и оценки.
Корректировка межкодерной надежности в исследовательских проектах, использующих контент-анализ. Загружено 27 мая 2005 г. из.
Университет Темпл, Школа коммуникации и театра, программа PhD в области массовых коммуникаций.
Media & Communication, http://www.temple.edu/mmc/reliability.
Лоу, В. (2002). Программное обеспечение для компьютерного анализа — обзор. Получено 14 октября 2005 г. с сайта Har-.
vard University, The Institute for Quantitative Social Science, http://people.iq.harvard
.edu/~wlowe/Publications/rev.pdf.
Lynch, B. P., & Smith, K. R. (2001). The changing nature of work in academic libraries. College
& Research Libraries,62(5), 407–420.
Малони-Кричмар, Д. и Прис, Дж. (2005). Многоуровневый анализ сообщества, коммунальных услуг и
Динамика сообщества в онлайн-сообществе по вопросам здоровья. ACMTransactions on Computer-Hu-.
Взаимодействие человека, 12(2), 201-232.
Марш, Е. Е. (2002). Риторические отношения между изображениями и текстом на веб-страницах. Неопубликованный
Докторская диссертация, Университет штата Мэриленд в Колледж-Парке, Мэриленд.
Марш, Э. Э. и Уайт, М. Д. (2003). Таксономия отношений между изображением и текстом.
Journal of Documentation,59(6), 647–672.
Майринг, П. (2000). Качественный контент-анализ. Форум качественных социальных исследований/Forum Quali-
tative Sozialforschung, 1(2). Retrieved September 24, 2005, from http://www.qualitative-
research.net/fqs-texte/2-00/2-00mayring-e.htm.
Миллер, М. М. (2003). VBPro (Verbatim Protocol) [компьютерное программное обеспечение]. Freeware.
Muhr, T. (2004). Atlas.ti5 [computer software]. Berlin: ATLAS.ti Scientifi c Software Develop-
ment GmbH.
Нойендорф, К. A. (2002). Руководство по контент-анализу. Тысяча дубов, Калифорния: Sage.
Нойендорф, К. А. (2005). Онлайн-руководство по контент-анализу: сопровождение контента.
Руководство по анализу Кимберли А. Нойендорф. Кливленд, штат Огайо : Кливлендский государственный университет.
Retrieved March 1, 2006, from http://academic.csuohio.edu/kneuendorf/content.
Нитецки, Д. A. (1993). Концептуальные модели библиотек, используемые преподавателями, администраторами и
librarians: An exploration of communications in the Chronicle of Higher Education.Journal
of Documentation,49(3), 255–277.
NVivo 2.0 [программное обеспечение]. (2003-2005). Донкастер, Виктория, Австралия: QSR International.
Пеладо, Н. (2005). WordStat 5.0 [компьютерная программа]. Монреаль: Provalis Research.
QSR N6 [компьютерное программное обеспечение]. (2005). Дарем, Великобритания: Программное обеспечение QSR.
Rogers, E. M. (1995). Diffusion of innovations (4th ed.). New York: Free Press.
Ротер, Д. Л. (1984). Вопросы пациента при взаимодействии пациента с врачом. Психология здоровья,
3(5), 395–409.
Шиффрин, Д. (1994). Подходы к дискурсу. Кембридж, штат Массачусетс: Блэквелл.
Schoch, N. A., & White, M. D. (1997). A study of the communications patterns of participants
В электронных дискуссионных группах по вопросам здоровья потребителей. В С. Шварц и М. Рорвиг (ред. ),
Цифровые коллекции — последствия для пользователей, финансистов, создателей и сопровождающих, Proceedings of the
60-я ежегодная встреча Американского компьютерного общества, Вашингтон, округ Колумбия, ноябрь.
1-6, 1997 (стр. 280-292). Медфорд, штат Нью-Джерси : Информация сегодня.
Schrodt, P. A. (1996). KEDS (Kansas Event Data System) [computer software]. Lawrence:
Кафедра политологии Канзасского университета.
Schrodt, P. A. (2000). TABARI 0.5.1 (Textual Analysis By Augmented Replacement Instruc-
Тионы) [компьютерное программное обеспечение]. Лоуренс: факультет политологии, Университет им.
Kansas.
Скальски, П. (2002). Программное обеспечение для компьютерного контент-анализа. В К. A. Neuendorf, Analiza treści.
Руководство (стр. 225-235). Тысяча дубов, Калифорния : Sage.
Стэнсбери, М. К. (2002). Проблемы семи журналов LIS: применение метода Her-.
non/Metoyer-Duran attributes. Library & Information Science Research,24(2), 157–168.
StatSoft, Inc. (2004). Electronic Statistics Textbook. Tulsa, OK: StatSoft. Retrieved October 31,
2005, from StatSoft, Inc., http://www.statsoft.com/textbook/stathome.html.
Стоун, П. Дж. (2002). Добро пожаловать на домашнюю страницу General Inquirer. Кембридж, штат Массачусетс: Гарвардский колледж.
Retrieved March 1, 2006, from http://www.wjh.harvard.edu/~inquirer.
Titscher, S., Meyer, M., Wodak, R., & Vetter, E. (2000). Methods of text and discourse analysis (B.
Jenner, Trans.). Thousand Oaks, CA: Sage.
Wang, J., & Gao, V. (2004). Technical services on the net: Where are we now? A comparative
44 библиотечные тенденции/лето 2006 года
§
Culture and society
В своем исследовании популярной религии Шнайдер и Дорнбуш (1958) иллюстрируют использование контент-анализа для отражения не психологических состояний отдельных людей, а ценностей всего общества. Исследователи отобрали 46 репрезентативных произведений американской вдохновляющей литературы, опубликованных за 80-летний период, выбрав бестселлеры, чтобы убедиться, что книги были прочитаны.
They classified each, paragraph by paragraph, according to its main themes (”religion brings physical health,” “happiness can be expected by most men”) and then ascertained what proportion of the total paragraphs is devoted to each theme. In their report they described the changes in these themes within the wider context of historical trends in American religion and culture and used a socio-logical model to interpret the functions of popular religion in society.
Значительная традиция этого типа анализа основана на предположении, что культурные ценности, которые стали институционализированными в определенных сегментах общества, представлены в коммуникациях индивидов в этих сегментах. Некоторые анализы подчеркивают социальные детерминанты идей или ценностей, выраженных, например, в фольклоре и проповедях; другие подчеркивают культурные детерминанты этих выражений.
Так, публичные сообщения руководителей американских корпораций отражают их деловые убеждения; загадки и мифы Бразилии отражают дидактические аспекты религии страны; популярные песни Японии отражают послевоенное одиночество и беспомощность (Shiso… 1959, p. 122).
Контент-анализ проводится путем выбора и адаптации определенных эмпирических процедур, используемых в социальных науках: обычно это методы использования имеющихся данных (хотя иногда для определенных целей можно получить новый материал путем задавания вопросов или наблюдения) и методы измерения в сочетании с выборочным и статистическим анализом.
Inadequate use of theory
К сожалению, слишком часто забывают, что контент-анализ бесполезен без тщательного обращения к соответствующей теории. Сложные методы измерения и анализа можно применять вслепую, не подвергая сомнению их теоретическую полезность.
Содержание может быть произвольно разделено на части, которые искажают сообщение, вырывая его из контекста. На основе содержания DeepL можно сделать вывод о состоянии коммуникатора или его социальной системы, не признавая и не оценивая изоморфизм (обсуждается в George 1959).
Можно уделить мало внимания важности определенного количества частот, поскольку это может относиться к интенсивности позиции одного человека, к согласию нескольких людей по одной и той же позиции или к рассчитанному эффекту повторения на аудиторию. Тем не менее, такое пренебрежение в связи методов с теорией может привести к бессмысленным — и даже вводящим в заблуждение — результатам.
Проверка гипотез. Ошибки, связанные с чисто эмпирическими данными, менее вероятны, когда исследователь может использовать контент-анализ для проверки гипотез вместо исследования. Это часто возможно, когда концептуальная модель достаточно разработана, чтобы можно было предложить интерпретацию до начала контент-анализа (например, Osgood and Walker 1959).
При проверке гипотез исследователь не может избежать объяснения предполагаемой связи между теорией и действием. Он использует логические или математические рассуждения, чтобы определить, какими были бы ожидаемые результаты, если бы предположения модели соответствовали фактам.
Вспомогательные анализы. Подобно тому, как модель коммуникации включает не только единицу коммуникации, но и лежащие в ее основе установки, поведение, ценности и социальные структуры, анализ содержания сам по себе не может дать полного понимания коммуникации.
Независимо от того, насколько идеально он был проведен и интерпретирован и как часто его повторяли, его часто необходимо дополнять другими методами, которые больше сосредоточены на различных аспектах процесса коммуникации. Так, точная оценка предполагаемого смысла сообщения зависит от знания ситуационного и поведенческого контекста (George 1959); содержание терапии не может быть оценено без внешнего показателя, такого как выздоровление пациента; интерпретация предсмертной записки требует определения того, действительно ли ее автор склонен к самоубийству; подразумеваемые призывы пропаганды или рекламы должны быть проверены на реакцию аудитории.
The very ability of the language to communicate must often be tested —for instance, by Taylor’s “cloze” procedure, in which sample recipients are given a message in mutilated form and asked how far they can reconstruct it (see Work Conference on Content Analysis 1959, pp. 78–88).
Всестороннее понимание коммуникации, конечно же, будет основано на накоплении идей и фактов из многих смежных исследований. Среди них результаты контент-анализа могут внести особый вклад благодаря своей объективности. Контент-анализ писем Осгуда и Уокера, например, более открыт для оценки и повторения другими исследователями, чем менее систематическая обработка польской крестьянской переписки Томасом и Знанецким; контент-анализ Шнайдера и Дорнбуша более открыт, чем проницательное построение Максом Вебером идеальных типов из трудов Бенджамина Франклина или Джонатана Эдвардса.
Матильда Уайт Райли и Клариса С. Столл
(Дальнейший соответствующий материал можно найти в разделе Факторный анализ и шкалы).
Auld, Frank Jr.; and Murray, Edward J. 1955 Content Analysis Studies of Psychotherapy. Psychological Bulletin 52:377–395.
Bales, Robert F. (1952) 1963 Some Uniformities of Behavior in Small Social Systems. Pages 98–III in Matilda White Riley, Sociological Research.New York: Harcourt.
Берельсон, Бернард 1952 Контент-анализ в коммуникационных исследованиях. Гленко, III. : Свободная пресса.
Джордж, Александр Л. 1959 г. Анализ пропаганды : исследование выводов, сделанных из нацистской пропаганды во время Второй мировой войны. Эванстон, III. : Роу, Петерсон.
Knight, Oliver 1960 The Grand Remonstrance. Public Opinion Quarterly 24:77–84.
Лассуэлл, Гарольд Д. 1938 Предварительная классификация данных о символах. Psychiatrie 1:197-204.
Лассуэлл, Гарольд Д. ; и Лейтес, Натан 1949 Язык политики : исследования в области количественной семантики.Нью-Йорк: Стюарт.
Mosteller, Frederick; and Wallace, David L. 1964 Inference and Disputed Authorship: The Federalist. Reading, Mass.: Addison-Wesley.
Osgood, Charles E.; and Walker, Evelyn G. 1959 Motivation and Language Behavior: A Content Analysis of Suicide Notes. Journal of Abnormal and Social Psychology 59:58–67.
Шнайдер, Луис; ог Дорнбуш, Сэнфорд М. 1958 Популярная религия: вдохновляющие книги в Америке. Univ. of Chicago Press.
Shiso no Kagaku KenkyŪkai 1959 Японская популярная культура: исследования массовой коммуникации и культурных изменений в Японском институте наук о мышлении. Отредактировано и переведено Хидетоси Като. Rutland, Vt: Tuttle.
Сорокин, Питирим А. (1937-1941) 1962 Социальная и культурная динамика. 4 тома. Englewood Cliffs, N.J. : Bedminster Press. → Том 1: Колебания форм искусства. Том 2: Колебания истины, этики и правовых систем. Том 3:
Стоун, Филипп Дж. и др. 1962 г. The General Inquirer: Компьютерная система для анализа содержания и извлечения информации, основанная на предложении как единице информации. Behavioral Science 7:484-498.
Work Conference on Content Analysis, Monticello, Ill., 1955 1959 Trends in Content Analysis: Papers. Edited by Ithiel de Sola Pool. Urbana: Univ. of Illinois Press.
Use of available data
Чаще всего контент-аналитик выбирает из огромного пула информации, которая уже имеется в библиотеках, клиниках, архивах, медицинских регистрах и семейных чердаках. Поэтому он должен знать, как использовать преимущества имеющихся данных, избегая при этом подводных камней.
Преимущества. Студент-коммуникатор, который предпочитает использовать существующие материалы, а не искать новые, имеет несколько преимуществ. (1) Время, усилия и затраты часто можно сэкономить, когда исследователь может перейти непосредственно к сути своего анализа и пропустить предварительные полевые работы, эксперименты или очистку документов. (2)
Когда требуются большие объемы данных, выходящие за рамки одного нового исследования, существующий материал часто позволяет получить широкий спектр потенциально значимых переменных и более тонко измерить каждую переменную. (3) Самое главное, что имеющиеся данные являются единственно возможным способом исследования определенных типов коммуникационных проблем.
Прошлые события не могут быть непосредственно наблюдаемы повторным исследователем, равно как и события не могут быть получены путем опроса респондентов, живущих сегодня. Таким образом, анализ исторических ситуаций или долгосрочных тенденций — важное исследование социальных изменений — зависит от предварительного существования соответствующего материала.
Аналогичным образом, для изучения межкультурной коммуникации на расстоянии (например, вкусы в кино и фольклоре по всему миру или сходства и различия во внимании к важным политическим символам в разных странах) могут потребоваться материалы, которые исследователь не в состоянии получить самостоятельно.
Содержание коммуникации в технических областях, находящихся вне компетенции исследователя, может быть первоначально собрано в форме, пригодной для использования экспертом, таким как психиатр, социальный работник или этнограф. Иногда, как в случае с письмами или дневниками, существующие материалы могут предоставить глубокую информацию об интимных чувствах или личных отношениях; иногда, как в анализе Сорокина, они могут расширить фокус исследователя, включив макроскопические социальные или культурные системы.
Ловушки. При таких впечатляющих ресурсах существуют некоторые фундаментальные проблемы, которые необходимо преодолеть при использовании данных, изначально собранных не для конкретных целей. (1) Материал часто бывает неполным. Контент-аналитик должен попытаться обнаружить пропущенные письма в файле переписки или выступления в коллекции, что может означать, что данные не являются репрезентативными. (2)
Данные могут быть ненадежными или устаревшими. Например, изолированная запись исторического события не может быть проверена путем сравнения различных рассказов, прямого наблюдения или опроса исследователя. Напротив, подсказки о валидности часто можно получить, сравнивая два набора данных, претендующих на отражение одной и той же концепции, как это делает Сорокин (1937-1941), показывая параллелизм между предубеждениями в научных открытиях и предубеждениями в эмпирическом мышлении, возникающими в результате контент-анализа. (3)
Данные из различных социально-временных контекстов не могут быть непосредственно сопоставимы, поскольку сами источники информации могут меняться со временем или от страны к стране, или одни и те же категории могут иметь разное значение. Эта трудность требует тщательного документирования и поиска лингвистических эквивалентов. (4)
Наконец, данные, поступающие к исследователю в форме, которую он или она не до конца понимает, могут не соответствовать его или ее определениям рассматриваемых понятий. В отличие от исследователя, который имеет дело с собранными им данными, он часто не знает обстоятельств, при которых первоначально происходило общение.
Однако содержание дневника может зависеть от того, для общественного или частного пользования он ведется, а на ответ на открытый вопрос может повлиять предвзятость интервьюера. Важно попытаться реконструировать процесс, в результате которого были получены данные, учесть и, по возможности, компенсировать любые ограничения или предубеждения, а также переформулировать данные в форме, соответствующей новой проблеме.
Хотя исследователю, возможно, придется отказаться от некоторых данных, потому что он не может правильно оценить их ограничения или найти адекватные способы их компенсации, широкий спектр доступных данных, которые можно классифицировать в одном смысле как коммуникации, является очень ценным источником для дальнейшего применения контент-анализа.
Use of measurement
Контент-аналитик использует свои данные для измерения своих концепций, а не описывает их на дискурсивном языке. Его данные состоят из определенных конкретных сообщений определенных конкретных лиц (случаев). Его концептуальная модель содержит соответствующие определения определенных типов ориентаций, действий или характеристик (свойств) определенных типов людей или сообществ.
По сути, он поступает так: рассматривает сенсорные данные (письменные или устные слова, жесты или изображения, которые он наблюдает) как проявления или индикаторы этих свойств (идей, которые он имеет в своем уме). Таким образом, измерение здесь определяется как классификация случаев (лиц, групп) в соответствии с заданным свойством, согласно правилам отбора и комбинирования соответствующих коммуникационных данных в качестве показателей.
Композитные меры. Принципы измерения, используемые в контент-анализе, варьируются в деталях от исследования к исследованию, но в целом характеризуются двухэтапной процедурой, в результате которой получается составной, а не простой показатель. Исследователь не просто классифицирует (кодирует) каждый случай в целом.
Вместо этого он разбивает всю коммуникацию на множество составляющих единиц (например, слова, заявления, статьи, книги); сначала он кодирует каждую из этих единиц содержания отдельно, а затем объединяет закодированные единицы, чтобы получить составной показатель.
Например, Бейлз, классифицируя свои случаи (группы) по различным параметрам взаимодействия, мог бы наблюдать за целой сессией малых групп и затем выставлять общие баллы (простые меры), чтобы показать степень, в которой, например, выражалась солидарность или проводилась деятельность по управлению напряжением.
Вместо этого он разбил свойство (взаимодействие) на более мелкие единицы содержания (акты), классифицировал поведение акт за актом, а затем подсчитал количество актов в каждой категории. Эта составная мера дает профиль группы — распределение общего числа актов по категориям кода — по которому группы ранжируются по степени, в которой члены демонстрируют согласие, участвуют в деятельности по управлению напряженностью и т.д.
Кодирование. В первом случае процесс кодирования использует измерительный инструмент для присвоения каждой единице содержания определенных кодовых обозначений, которые указывают на количество (или атрибуты) свойств, которыми она обладает. Этот инструмент состоит из (1) кода или набора кодовых обозначений.
Код состоит из цифр, символов или названий категорий и перечисляет все категории, обозначенные на каждом измерении каждого свойства. (Под свойствами понимается наличие одного или нескольких основных измерений или аспектов; в случае многомерных показателей, показатели отдельных измерений — простых или сложных — в конечном итоге должны быть объединены для отражения свойства в целом).
Инструмент также содержит (2) инструкции по кодированию, которые, с одной стороны, определяют каждое измерение и его категории в терминах концептуальной модели и, с другой стороны, указывают типы данных, которые должны быть взяты в качестве индикаторов в каждой категории.
The coding instrument for a particular study is sometimes taken from an existing body of theory (such as Riesman’s “inner-direction” versus “other-direction”); it may be a standard code developed by other researchers (such as the D.R.Q. or the verb-adjective ratio); or it may be developed from the empirical data of the study.
Комбинация. На втором этапе — объединение единиц содержания для соотнесения с сообщением в целом — контент-аналитик может просто подсчитать количество единиц в каждой категории (например, чтобы показать количество позитивных и негативных утверждений или найти средний процент догматических разделов в выборке религиозных книг).
Эти подсчеты частоты схожих единиц имеют эффект взвешивания категории, чтобы показать преобладание или отсутствие этой категории в общей коммуникации. Иногда единицы взвешиваются одинаково (например, Bales 1952); или могут быть присвоены разные веса, например, для разных степеней интенсивности отношения, как оценивают судьи, или для разных степеней воздействия на аудиторию;
В качестве альтернативы, контент-аналитик может адаптировать различные доступные процедуры, чтобы найти эмпирические закономерности среди различных типов людей и показать, как конкретные действия, отношения или черты характера сочетаются в едином процессе коммуникации.
Например, факторный анализ может быть использован для выделения широких измерений (таких как отношение к психическому здоровью, выраженное в СМИ, или сенсационность в новостных сообщениях), или шкала Гуттмана может быть использована для выявления совокупных закономерностей (таких как различные обязанности и функции, возложенные законами штатов на советы по образованию).
Достоинством этих процедур является то, что они содержат встроенные доказательства соответствия между концепцией исследователя о благе и правилами, которым он следует при проведении измерений. Эти тесты позволяют избежать необходимости полностью полагаться на произвольное суждение исследователя при комбинировании и взвешивании показателей.
Такая закономерность становится очевидной, конечно, когда исследователь, завершив измерение каждого признака, переходит к изучению положительных или отрицательных корреляций между признаками. Ссылки на дьявола и на исповедь могут встречаться вместе в некоторых народных сказках; или пациент, проходящий психотерапию, может быть склонен отделять мысли о матери от мыслей о гомосексуальности (например.
(Контингентный анализ Осгуда в «Рабочей конференции по контент-анализу», 1959, с. 54-78). Некоторые контент-аналитики применяют статистические тесты для оценки вероятности того, что такие корреляции полностью обусловлены случайностью, хотя адекватность конкретных тестов часто проблематична (например, когда различные сообщения выбранных людей могут не соответствовать предположениям о статистической независимости).
Полезность комплексного измерения. Типичная двухэтапная процедура измерения — сначала кодирование, а затем объединение единиц контента — в целом повышает точность, возможную при простом общем измерении, при этом надежность межкодерного измерения предполагается высокой.
Правила кодирования могут быть определены более подробно, а решения о кодировании небольших единиц содержания принимать легче, чем всего сообщения (см. Schneider and Dornbusch 1958, pp. 165-169, для сравнения глобальных рейтингов целых книг с рейтингами тех же книг по главам).
Хотя детальная процедура часто отнимает больше времени и сил, нет сомнений, что компьютерные программы будут все чаще использоваться для ускорения многих из этих операций (например, система General Inquirer для контент-анализа, Stone et al. 1962).
С математической точки зрения, составной показатель является количественным, что часто облегчает его применение по отношению к другим показателям. Хотя каждое действие или единица смысла на первом этапе процедуры может быть закодирована по номинальной шкале (описана такими словами, как позитивный или негативный, солидарный или несолидарный и т.д.), на втором этапе, когда все эти коды объединяются, результирующее измерение состоит из чисел или пропорций (позитивные комментарии или солидарные групповые действия). Такие числовые данные используются для классификации отдельных лиц или групп по шкалам, которые, по крайней мере, находятся на порядковом уровне.
Однако точный и количественный вид многих составных показателей, используемых в контент-анализе, может ввести в заблуждение. Без четкого соответствия между операциями измерения и процессом коммуникации возникают серьезные проблемы интерпретации.
История метода
Метод контент-анализа нашел широкое применение в информационную эпоху, но его история выходит за рамки эры автоматической обработки текстов. Например, в Швеции еще в 18 веке наличие определенных тем в тексте определяло еретический статус книги[1].
Несмотря на это, только с 1930-х годов в США на контент-анализ можно полагаться как на полноценную методологию[2]. Термин «контент-анализ» впервые был использован в конце XIX — начале XX века американскими журналистами Б. Мэтью, А. Тенни, Д. Спидом и Д. Уипкинсом. Французский журналист Ж. Кайзер также стоял у истоков формирования методологии контент-анализа.
Использовался контент-анализ преимущественно в социологических исследованиях, в том числе при изучении рекламных и пропагандистских материалов.
Именно во время Второй мировой войны Х. Лассуэлл начал использовать методологию контент-анализа для анализа пропагандистских материалов.
В рамках так называемого «методологического взрыва» 1960-х годов исследования контент-анализа были особенно активны. Таким образом, методология развивалась и ее варианты были разнообразны. Именно в этот период началось активное использование компьютерных технологий в исследованиях.
Качественный контент-анализ
Помимо слов, тем и других элементов, обозначающих содержание сообщений, существуют и другие единицы, позволяющие провести качественный или, как его еще называют, структурный анализ содержания. В этом случае исследователя интересует не столько то, что сказано, сколько то, как это сказано [8].
Например, задачей может быть определение того, сколько времени или печатной площади посвящено интересующему вопросу в конкретном источнике, или сколько слов или газетных колонок было посвящено каждому кандидату в ходе определенной избирательной кампании.
С другой стороны, можно принять во внимание и другие, возможно, более тонкие вопросы, связанные с формой сообщения: сопровождается ли газетное сообщение фотографией или иллюстрацией, каков размер заголовка газетного сообщения, печатается ли оно на первой странице или размещается среди множества рекламных объявлений.
Исследователь, отвечающий на подобные вопросы, обращает внимание не на детали содержания, а на способ подачи сообщения. В этом случае наиболее значимыми факторами являются количество материала по теме, его обособленность и размер, а не тонкости его содержания.
Такой анализ часто приводит к гораздо более надежным измерениям, чем исследования, ориентированные на содержание (потому что формальные показатели менее неоднозначны по своей сути), но, как следствие, они также гораздо менее значительны[8].
Измерения параметров, исследуемых в качественном контент-анализе, поверхностно затрагивают само содержание каждого сообщения, в отличие от детального и тщательного изучения, требуемого в количественном анализе. В результате качественный контент-анализ обычно проще в разработке и проведении, а также надежнее и дешевле, чем количественный контент-анализ.
И хотя его результаты могут быть менее удовлетворительными, поскольку они дают скорее общее представление, чем полную картину сообщения, они часто могут оказаться вполне адекватными при ответе на конкретный вопрос исследования[8].
Количественный контент-анализ
Количественный контент-анализ (также называемый анализом содержания) основан на изучении слов, тем и сообщений, фокусируя внимание исследователя на содержании сообщения. Таким образом, стремясь проанализировать отобранные предметы, необходимо уметь предвидеть их значение и определить каждый возможный результат наблюдения в соответствии с ожиданиями исследователя [8].
В качестве первого шага в проведении контент-анализа такого типа исследователь должен создать словарь, в котором каждое наблюдение будет распределено по категориям.
В процессе работы исследователь должен предвидеть не только ссылки, с которыми он столкнется, но и элементы их контекстуального использования, для чего должна быть разработана подробная система правил оценки каждого случая использования.
Обычно это делается путем пилотирования совокупности сообщений, подлежащих анализу (т.е. определения на основе небольшой выборки сообщений типов ключевых упоминаний, которые, скорее всего, появятся в последующем, более глубоком анализе), в сочетании с контекстуальными и арбитражными оценками использования терминов.
Более сложной задачей является необходимость приписать конкретные оценки ключевым упоминаниям — когда мы должны решить, в каком смысле дано данное упоминание — положительном или отрицательном, «за» или «против» интересующего нас объекта и т.д., и когда мы должны ранжировать ряд упоминаний по силе их оценок (т.е. по тому, какое из них наиболее положительное, какое следующее по положительности и т.д.). ).
Для этого исследователю нужны индикаторы, достаточно тонкие, чтобы измерить не только чувства политических акторов, но и силу этих чувств. Эта задача особенно сложна в исторических, историко-философских и психологических исследованиях, поскольку предполагает высокий уровень гуманитарной подготовки специалистов, использующих методологию контент-анализа.
Существует множество методов, помогающих принять это решение. В некоторых случаях они основаны на суждении группы арбитров (экспертов) о значении или силе (интенсивности) термина. Примерами таких методов являются метод Q-сортировки и шкала парных сравнений. [8] В конце двадцатого — начале двадцать первого века специалисты по применению математических методов к историческим исследованиям уделяли большое внимание разработке специализированных компьютерных систем (в рамках идеологии искусственного интеллекта).
Контент-анализ

Контент-анализ (от английского «содержание» и греческого «разложение») — это формализованный количественный метод анализа документов. Перевод текстовой или фонетической информации о массе в количественные показатели с последующей статистической обработкой. Она характеризуется высокой степенью строгости и систематичности. Предметом контент-анализа может быть содержание различных публикаций, радио- и телепередач, фильмов, рекламы, документов, публичных выступлений и анкет.
Она включает :
— выделение системы опорных понятий (категорий анализа);
— отыскание их индикаторов — слов, словосочетаний, суждений и т. п. — (единиц анализа);
— статистическую обработку данных.
Метод зародился в 1920-х годах в американской журналистике как метод количественно-качественного исследования содержания прессы. Сейчас он активно используется в социальной психологии, социологии, психодиагностике, политологии, психологии рекламы и пропаганды.
К его несомненным преимуществам относятся способность точно обнаруживать внешне ненаблюдаемые показатели в больших объемах эмпирических данных, возможность выявления скрытых тенденций и закономерностей, возможность отложенного анализа событий и ситуаций, относительная объективность процедур и надежность результатов, отсутствие влияния исследователя на поведение испытуемых.
Контент-анализ — это, по сути, перевод качественно представленной информации на язык бухгалтерского учета. Это требует, во-первых, достаточно полного и насыщенного содержанием текста и, во-вторых, определенной исследовательской подготовки, чтобы эффективно использовать потенциал этого метода.
Кроме того, контент-анализ имеет некоторые ограничения. Хорошо известно, что характер информации, помимо прочего, во многом определяется намерениями ее автора и особенностями ее подачи. Из-за плохого выражения данных в обработанном материале исследователю может быть довольно легко принять вымысел за документальность. Во многих случаях искажения происходят потому, что исследователь недостаточно четко различает категории или не учитывает все возможные словесные выражения. Кроме того, не всякий материал поддается формализации. Например, лирического героя было бы крайне сложно описать с помощью этого метода.
Описывая особенности применения контент-анализа, принято указывать меру стабильности получаемой информации при смене кодеров (лиц, фиксирующих параметры и признаки) и давать характеристики, степень согласованности результатов этого метода с другими, собранными иными методами. Рассмотрим основные этапы контент-анализа.
1. подготовительная фаза (разработка программы анализа материалов)
Она включает постановку цели исследования, предварительную проверку адекватности выбранного метода особенностям предстоящей работы, составление классификатора (опорной схемы контент-анализа), подготовку инструкций для тех, кто занимается внедрением метода, пилотное исследование, последующая корректировка программы.
Здесь особое внимание следует уделить сборке классификатора анализа, который состоит из списка категорий анализа, соответствующих показателей и принятых единиц учета. На этом основываются различные действия, от качества которых зависит эффективность всей работы в целом.
Категории анализа — это ключевые элементы концепции исследования, единицы смысла, выражение которых должно быть зафиксировано в соответствии с поставленной целью. Исследователь заранее предлагает определенные вопросы, темы или проблемы в качестве категорий анализа. Интервью или анкета могут служить отправной точкой для определения характера человека. Категории включают отношение человека к себе, другим людям, деятельности, вещам (объектам) и природе. Изучая, например, тревожность как черту личности, мы предварительно выделяем набор составляющих ее «тем»: тревога по поводу здоровья, семьи, карьеры, финансового положения и т.д.
Самое главное, чтобы список категорий был максимально исчерпывающим и чтобы можно было однозначно отнести часть текста к той или иной категории.
Единицы анализа или индикаторы, знаки выражения смысловых единиц, — это части текста, которые характеризуются принадлежностью к определенной категории. Это могут быть символы, слова, выражения, комбинации слов разной длины, ситуации, суждения, реплики, интонации и т.д. Именно этот материал позволяет оценить значение текста в каждой категории.
В тексте одна и та же категория может быть выражена по-разному: символами или словами, предложениями или абзацами. В результате выбор единиц анализа — задача не из легких и требует от исследователя вдумчивости и разборчивости.
Более того, категория может быть представлена в тексте несколькими единицами анализа. Выражение может принимать форму негативного (критического), нейтрального или позитивного выражения. В этом типе отношений варианты более разнообразны.
Единицы счета — это количественные характеристики отношения категорий друг к другу или единиц анализа к категориям. В исследовательской практике обычно используются два варианта:
— частоту проявлений в тексте категории или ее признака;
— пропорцию представленности категории (её признака) или, иначе, объём внимания, уделяемый ей автором текста.
Например: сопоставимое количество печатных знаков, площадь соответствующих частей текста (в квадратах или процентах), необходимое время произнесения и т. д.
Разработка классификатора завершается написанием инструкций для кодировщиков и подготовкой матрицы кодирования.
В инструкциях очень четко указаны категории, которые все идентифицируются, набор текстовых признаков, соответствующих каждой категории, и тип используемых счетных единиц. Объективность результатов контент-анализа повысится, если исследователь сформулирует инструкции в письменном виде, даже если он сам является кодером.
Матрица оценки — это таблица, которую удобно использовать для записи первичных результатов исследования. Обычно она содержит категории анализа справа и источники информации слева (отдельные документы, отчеты, личности испытуемых и т.д.). по горизонтали. Затем середина таблицы заполняется числами, показывающими частоту встречаемости каждой категории в данном материале.
Пилотный опрос, завершающий подготовительный этап контент-анализа, помогает выявить недостающие категории, опущенные единицы анализа и неточные инструкции.
2. фаза внедрения
Предоставляет набор {процедур для выявления индикаторов категорий и регистрации характеристик их присутствия в тексте.
Здесь могут быть допущены ошибки, например:
— неверное соотнесение единиц анализа с категориями;
— пропуск тех или иных единиц анализа;
— фиксация того, чего нет на самом деле.
Все это снижает устойчивость результатов контент-анализа. Существует множество причин низких показателей устойчивости, таких как плохие инструкции, недостаточная квалификация кодеров, неподходящая рабочая среда, отсутствие внимательности, терпения и добросовестности.
3. фаза обработки данных
Его содержание определяется целью исследования. Например, могут быть рассчитаны частотные или процентные распределения, коэффициенты корреляции, сравнительные таблицы. может использоваться при обработке результатов (одна или несколько матриц кодирования).
В случаях, когда анализируется большой объем данных, иногда используются специальные математические и статистические методы, разработанные специально для нужд контент-анализа.
В факторном анализе целью является выявление набора причинно-следственных связей между переменными, чтобы установить, существует ли явление, объясняющее существование взаимосвязи.
В последние десятилетия для обработки данных контент-анализа или корреляционного анализа все чаще используется специальный метод математической статистики, позволяющий выявить угрозы (факторы), скрытые от непосредственного восприятия, и уточнить степень их влияния на конкретные характеристики.
Примером может служить расчет коэффициента Яниса, который используется для установления доли положительных и отрицательных оценок по отношению к определенным категориям. Этот коэффициент рассчитывается по формуле :
, для случая, когда f>n ,
, для случая, когда f
Где f — количество положительных оценок, n — количество отрицательных оценок, r — объем единиц информации, отражающей исследуемую категорию, t — общий объем единиц проанализированного текста.
Источник: Учебник из серии: Практическая психология, Издатель: Питер.
Скачать краткий пример контент-анализа статьи с расчетом коэффициента Яниса (64 Kb): content_analysis.doc
Теги: технологии, проведение исследований
Материал подготовлен Руденко Владимиром
Метод q-сортировки
В Q-рейтинге используется жесткая шкала распределения из девяти пунктов: пункт 1 соответствует минимальной интенсивности измеряемого атрибута (например, самый низкий рейтинг одобрения), а пункт 9 — максимальной интенсивности (например, самый высокий рейтинг одобрения).
Цель состоит в том, чтобы просто проранжировать (упорядочить) все оценки по одной оси оценки. Судья получает конкретную жесткую квоту для каждой категории по шкале (т.е. ожидаемое количество слов или фраз, которые будут отнесены к данной категории) и затем должен распределить заданный набор выражений так, чтобы не превысить установленную квоту.
Квоты основаны на (не обязательно верном) предположении, что вариации интенсивности слов и фраз должны вписываться в нормальное распределение (в котором изучаемые случаи максимально сосредоточены в середине шкалы и равномерно убывают к ее полюсам).
После того, как судьи завершили свою работу, вычисляется среднее арифметическое значение шкалы для каждого случая, а затем полученные средние баллы ранжируются соответствующим образом. Результаты этого ранжирования интенсивности прецедентов затем используются для присвоения кодов анализируемым текстам на основе встречаемости слов или тем, которые получили нашу оценку.
Примечания
- К содержанию ↑ 123Почепцов Г. G. G. Теория коммуникации — М.: Рефл-бук, 2001 — ISBN 5-87983-101-9
- ↑ 1234Дмитриев И. Контент-анализ: сущность, задачи, процедуры (русский) (2005). Дата обращения: 10 марта 2008 г.
- ↑ Манекин Р.В. Компьютеры и история философии. Краткий обзор российских и зарубежных исследований — Москва-Донецк: Донецкий филиал САМИ, 1993 — С. 68-82.
- ↑Манекин Р.В. Контент-анализ как метод исторического исследования. — Донецк: Информсервис, 1991 г. — ISSN08991096. Архивировано 21 марта 2009 года.
- ↑Holsti O. Р. Контент-анализ для социальных и гуманитарных наук. — Ридинг, Масс, и т.д., 1969 — ISBN 0-394-34926-1.
- ↑ 12Лисовский С. Ф., Евстафьев В. A. Избирательные технологии: история, теория и практика. — Коммерсантъ. — М., 2000. — ISBN 5-86014-129-7.
- ↑ Харченко К. V. Материальная сторона жизни в зеркале субъективных смыслов: опыт контент-анализа // Социология: метод, методики, математическое моделирование. — 2009. — № 1 (28). — С. 129-148.
- ↑ 123456789101112Manheim J.B., Rich R.K. Political Science. Методы исследования: перевод с английского / под ред. Соколов = Эмпирический политический анализ : Методы исследования в политологии. — М.: Весь мир, 1997.
Сфера применения
Спектр дисциплин, в которых применяется контент-анализ, достаточно широк. Помимо социологии и политологии, методология используется в антропологии, управлении человеческими ресурсами, психологии, литературоведении, истории и истории философии [3].
Оле Холсти приводит следующее распределение исследований контент-анализа по наукам: социология, антропология — 27,7%, теория коммуникации — 25,9%, политология — 21,5%. Также стоит отметить использование контент-анализа в исторических исследованиях[4] и связях с общественностью[5].
Контент-анализ позволяет анализировать различные типы текстов, такие как сообщения СМИ, заявления политиков, партийные программы, законодательные акты, рекламные и пропагандистские материалы, исторические источники, литературные произведения.
Шкалирование методом парного сравнения
Попарное шкалирование преследует те же цели, что и предыдущий метод, но техника его применения несколько отличается. Каждый оцениваемый случай сравнивается последовательно в парах со всеми другими случаями, и каждый судья должен решить, какое слово (или фраза) в каждой паре «сильнее» (или интенсивнее) другого.
Так, если есть пять утверждений (случаев), подлежащих сравнению, каждый судья сначала сравнит 1-е утверждение со 2-м, затем 3-е, 4-е, 5-е, затем 2-е с 3-м, 4-м, 5-м и т.д., отмечая каждый раз, какое из них сильнее. Подсчитав, сколько раз каждый случай «сильнее» других в оценке всех судей, и разделив это число на количество судей (т.е. вычислив среднюю оценку, данную каждому утверждению группой судей), мы можем количественно ранжировать все случаи по степени их интенсивности
Однако существует как минимум две проблемы с Q-сортировкой и попарным сравнением. Во-первых, в обоих случаях исследователь полностью полагается на решения арбитров, чьи критерии оценки могут быть или не быть действительными.
В такого рода экспертизе стандарты не всегда ясны или, во всяком случае, не всегда четко определены, и, как следствие, сами оценки являются спорными. В некоторых случаях один и тот же арбитр дает разную оценку одному и тому же иску после ряда одинаковых правил.
Более того, арбитры выбираются весьма произвольно. Следовательно, надежность результатов, полученных при опоре на таких арбитров, также весьма относительна. В результате эти процедуры должны использоваться с учетом «человеческого фактора»[8].








