Из Википедии, свободной энциклопедии
  (Перенаправлено из текстового анализа )
Перейти к навигации Перейти к поиску

Контент-анализ - это изучение документов и артефактов коммуникации, которыми могут быть тексты различных форматов, изображения, аудио или видео. Социологи используют контент-анализ для систематического и воспроизводимого изучения моделей общения. [1] Одним из ключевых преимуществ использования контент-анализа для анализа социальных явлений является его неинвазивный характер, в отличие от моделирования социального опыта или сбора ответов в опросах.

Практика и философия контент-анализа различаются в зависимости от академической дисциплины. Все они включают систематическое чтение или наблюдение за текстами или артефактами, которым присваиваются ярлыки (иногда называемые кодами), указывающие на наличие интересных, значимых фрагментов контента. [2] [3] Систематически маркируя содержание набора текстов , исследователи могут анализировать шаблоны содержания количественно, используя статистические методы , или использовать качественные методы для анализа значений содержания в текстах .

Компьютеры все чаще используются в контент-анализе для автоматизации маркировки (или кодирования) документов. Простые вычислительные методы могут предоставить описательные данные, такие как частота слов и длина документа. Классификаторы машинного обучения могут значительно увеличить количество текстов, которые можно пометить, но научная польза от этого остается предметом споров. Кроме того, доступны многочисленные компьютерные программы компьютерного анализа текста (CATA), которые анализируют текст на предмет заранее определенных лингвистических, семантических и психологических характеристик. [4]

Цели [ править ]

Контент-анализ лучше всего понимать как широкое семейство методов. Эффективные исследователи выбирают методы, которые лучше всего помогают им ответить на их основные вопросы. При этом, по словам Клауса Криппендорфа , при каждом контент-анализе необходимо ответить на шесть вопросов: [5]

  1. Какие данные анализируются?
  2. Как определяются данные?
  3. Из какого населения взяты данные?
  4. Каков соответствующий контекст?
  5. Какие границы анализа?
  6. Что измерять?

Самая простая и объективная форма анализа содержания учитывает однозначные характеристики текста, такие как частота слов , площадь страницы, занимаемая газетной колонкой, или продолжительность радио- или телепрограммы . Анализ частот простых слов ограничен, потому что значение слова зависит от окружающего текста. Подпрограммы ключевого слова в контексте (KWIC) решают эту проблему, помещая слова в их текстовый контекст. Это помогает разрешить двусмысленность, например, вызванную синонимами и омонимами .

Следующим шагом в анализе является различие между словарными (количественными) подходами и качественными подходами. Подходы на основе словарей создают список категорий, полученных из частотного списка слов, и управляют распределением слов и их соответствующих категорий по текстам. В то время как методы количественного контент-анализа таким образом преобразуют наблюдения найденных категорий в количественные статистические данные, качественный контент-анализ больше фокусируется на намерении и его последствиях. Между качественным контент-анализом и тематическим анализом есть сильные параллели . [6]

Качественный и количественный контент-анализ [ править ]

Количественный анализ контента подчеркивает подсчет частот и объективный анализ этих кодированных частот. [7] Кроме того, количественный контент-анализ начинается с сформулированной гипотезы, решение о кодировании которой принимается до начала анализа. Эти категории кодирования строго соответствуют гипотезе исследователя. Количественный анализ также использует дедуктивный подход. [8]

Зигфрид Кракауэр критикует количественный анализ, утверждая, что он упрощает сложные коммуникации, чтобы быть более надежными. С другой стороны, качественный анализ имеет дело со сложностями скрытых интерпретаций, тогда как количественный анализ сосредоточен на явных значениях. Он также признает «совпадение» качественного и количественного контент-анализа. [7] При качественном анализе паттерны изучаются более внимательно, и, исходя из скрытых значений, которые может найти исследователь, курс исследования может быть изменен. Он носит индуктивный характер и начинается с открытых исследовательских вопросов, а не с гипотезы. [8]

Вычислительные инструменты [ править ]

В более общем плане контент-анализ - это исследование с использованием категоризации и классификации речи, письменного текста, интервью, изображений или других форм общения. Вначале, с использованием первых газет конца 19 века, анализ проводился вручную путем измерения количества столбцов, в которых была указана тема. Этот подход также можно проследить до того, как в 1893 году студент университета изучал закономерности в шекспировской литературе. [9] С появлением обычных вычислительных средств, таких как ПК, популярность компьютерных методов анализа растет. [10] [11] [12] Ответы на открытые вопросы, газетные статьи, манифесты политических партий, медицинские записи или систематические наблюдения в экспериментах могут быть предметом систематического анализа текстовых данных.

Благодаря тому, что содержание сообщения доступно в форме машиночитаемых текстов, входные данные анализируются на предмет частот и кодируются по категориям для создания выводов.

Компьютерный анализ может помочь с большими наборами электронных данных, сокращая время и устраняя необходимость использования нескольких человеко-кодировщиков для обеспечения межкодерной надежности. Тем не менее, человеческие кодировщики все еще могут использоваться для анализа контента, поскольку они часто более способны выявлять нюансы и скрытые значения в тексте. Исследование показало, что люди-программисты могли оценивать более широкий диапазон и делать выводы, основанные на скрытых значениях. [13]

Надежность [ править ]

Роберт Вебер отмечает: «Чтобы сделать обоснованные выводы из текста, важно, чтобы процедура классификации была надежной в смысле согласованности: разные люди должны кодировать один и тот же текст одинаково». [14] Достоверность, межкодерная надежность и внутрикодерная надежность являются предметом интенсивных методологических исследований в течение долгих лет. [5] Нойендорф предполагает, что при использовании кодировщиков в контент-анализе следует использовать как минимум два независимых кодировщика. Надежность кодирования человеком часто измеряется с использованием статистической меры межкодерной надежности или «количества согласия или соответствия между двумя или более кодировщиками». [4]Лейси и Рифф называют измерение межкодерной надежности сильной стороной количественного контент-анализа, утверждая, что, если контент-аналитики не измеряют межкодерную надежность, их данные не более надежны, чем субъективные впечатления отдельного читателя. [15]

Виды текста [ править ]

В контент-анализе есть пять типов текстов:

  1. письменный текст , например книги и документы
  2. устный текст, например речь и театральное представление
  3. иконический текст , например рисунки, картины и значки
  4. аудиовизуальный текст, например телепрограммы, фильмы и видео
  5. гипертексты , которые представляют собой тексты, найденные в Интернете

История [ править ]

На протяжении многих лет контент-анализ применялся в самых разных областях. Герменевтика и филология давно использовали контент-анализ для интерпретации священных и светских текстов и, во многих случаях, для атрибуции авторства и подлинности текстов . [3] [5]

В последнее время, особенно с появлением массовой коммуникации , контент-анализ стал широко использоваться для глубокого анализа и понимания медиа-контента и логики медиа . Политолог Гарольд Лассуэлл сформулировал основные вопросы контент-анализа в его основной версии начала середины 20-го века: «Кто что говорит, кому, почему, в какой степени и с каким эффектом?». [16] Строгий упор на количественный подход, начатый Лассуэллом, наконец, был сделан другим «отцом» контент-анализа, Бернардом Берельсоном., который предложил определение контент-анализа, которое с этой точки зрения символично: «метод исследования для объективного, систематического и количественного описания явного содержания коммуникации». [17]

В последние годы количественный контент-анализ приобрел новую популярность благодаря технологическим достижениям и плодотворному применению в исследованиях массовых и личных коммуникаций. Популярным стал контент-анализ больших текстовых данных, создаваемых новыми медиа , особенно социальными сетями и мобильными устройствами . Эти подходы используют упрощенный взгляд на язык, который игнорирует сложность семиозиса, процесса, посредством которого значение формируется из языка. Количественные контент-аналитики подвергались критике за ограничение объема контент-анализа простым подсчетом и за применение методологий измерения естественных наук без критического осмысления их соответствия социальным наукам.[18] И наоборот, качественных контент-аналитиков критиковали за недостаточную систематичность и слишком импрессионистский подход. [18] Криппендорф утверждает, что количественный и качественный подходы к контент-анализу имеют тенденцию пересекаться, и что не может быть обобщенного вывода о том, какой из подходов лучше. [18]

Контент-анализ также можно описать как изучение следов , которые представляют собой документы из прошлых времен, и артефактов, которые не являются лингвистическими документами. Считается, что тексты создаются коммуникативными процессами в широком смысле этого слова, часто приобретая значимость за счет похищения . [3] [19]

Скрытое и явное содержание [ править ]

Контент манифеста легко понять по его номинальной стоимости. Его значение прямое. Скрытое содержание не так очевидно и требует интерпретации, чтобы раскрыть смысл или подтекст. [20]

Использует [ редактировать ]

Холсти разделил пятнадцать способов использования контент-анализа на три основные категории : [21]

  • делать выводы об антецедентах общения
  • описывать и делать выводы о характеристиках коммуникации
  • делать выводы об эффектах общения.

Он также помещает эти способы использования в контекст базовой парадигмы коммуникации .

В следующей таблице показаны пятнадцать вариантов использования контент-анализа с точки зрения их общей цели, элемента парадигмы коммуникации, к которой они применяются, и общего вопроса, на который они призваны ответить.

В противоположность этому, существуют ограничения на объем использования процедур, характеризующих контент-анализ. В частности, если доступ к цели анализа может быть получен прямыми средствами без материального вмешательства, то методы прямых измерений дают более точные данные. [23] Таким образом, в то время как контент-анализ пытается количественно описать коммуникации , характеристики которых в основном являются категориальными - обычно ограниченными номинальной или порядковой шкалой - с помощью выбранных концептуальных единиц ( унификация ), которым присваиваются значения ( категоризация ) для перечисления при мониторинге надежность интеркодера, если вместо этого целевая величина явно уже поддается непосредственному измерению - обычно по шкале интервалов или соотношений - особенно непрерывной физической величины, то такие целевые значения обычно не указываются среди тех, которые нуждаются в «субъективном» выборе и формулировках контент-анализа. [24] [25] [26] [27] [28] [29] [30] [31] Так , например (от смешанных исследований и клинического применения), а медицинские изображения связывать диагностические возможности для врачей, нейровизуализации «ы инсульт (инфаркт ) шкала объема, называемая ASPECTS, разделена на 10 качественно очерченных (неравных) областей мозга в средней мозговой артерии.Территория, которую он классифицирует как хотя бы частично или совсем не инфаркт, чтобы перечислить последнее, с опубликованными сериями, часто оценивающими надежность межкодера с помощью каппы Коэна . Вышеупомянутые операции, выделенные курсивом, накладывают некредитованную форму анализа содержания на оценку степени инфаркта, которая вместо этого достаточно легко и более точно измеряется как объем непосредственно на изображениях. [32] [33] («Точность ... является высшей формой надежности». [34] ) Однако сопутствующая клиническая оценка по шкале инсульта Национального института здравоохранения (NIHSS) илимодифицированная шкала Рэнкина (mRS) сохраняет необходимую форму контент-анализа. Признавая потенциальные ограничения контент-анализа как в содержании языка, так и в изображениях, Клаус Криппендорф утверждает, что «понимание [понимание] ... может ... вообще не соответствовать процессу классификации и / или подсчета, с помощью которого проводится большинство контент-анализов. , " [35] предполагая, что контент-анализ может существенно исказить сообщение.

Разработка исходной схемы кодирования [ править ]

Процесс первоначальной схемы кодирования или подхода к кодированию зависит от конкретного выбранного подхода к контент-анализу. Посредством направленного контент-анализа ученые составляют предварительную схему кодирования на основе ранее существовавших теорий или предположений. В то время как при традиционном подходе к контент-анализу первоначальная схема кодирования развивалась на основе данных.

Обычный процесс кодирования [ править ]

При использовании любого из описанных выше подходов исследователям рекомендуется погрузиться в данные для получения общей картины. Более того, определение последовательной и четкой единицы кодирования имеет жизненно важное значение, и выбор исследователей варьируется от одного слова до нескольких абзацев, от текстов до знаковых символов. Наконец, построение отношений между кодами путем сортировки их по определенным категориям или темам. [36]

См. Также [ править ]

  • Дональд Уэйн Фостер
  • Герменевтика
  • Текстовый майнинг
  • Польский крестьянин в Европе и Америке
  • Переходные слова
  • Анализ видеоконтента

Ссылки [ править ]

  1. ^ Алан., Брайман (2011). Методы бизнес-исследования . Белл, Эмма, 1968- (3-е изд.). Кембридж: Издательство Оксфордского университета. ISBN 9780199583409. OCLC  746155102 .
  2. ^ Ходдер, I. (1994). Толкование документов и материальная культура . Таузенд Оукс и др .: Шалфей. п. 155. ISBN 978-0761926870.
  3. ^ a b c Типальдо, Г. (2014). L'analisi del contenuto ei media . Болонья, Италия: Il Mulino. п. 42. ISBN 978-88-15-24832-9.
  4. ^ a b Кимберли А. Нойендорф (30 мая 2016 г.). Руководство по контент-анализу . МУДРЕЦ. ISBN 978-1-4129-7947-4.
  5. ^ a b c Криппендорф, Клаус (2004). Контент-анализ: введение в его методологию (2-е изд.). Таузенд-Оукс, Калифорния: Сейдж. п. 413. ISBN 9780761915454.
  6. ^ Vaismoradi, Mojtaba; Турунен, Ханнеле; Бондас, Тереза ​​(01.09.2013). «Контент-анализ и тематический анализ: последствия для проведения качественного описательного исследования». Медсестринское дело и медицинские науки . 15 (3): 398–405. DOI : 10.1111 / nhs.12048 . ISSN 1442-2018 . PMID 23480423 .  
  7. ^ a b Кракауэр, Зигфрид (1952). «Проблема качественного контент-анализа». Общественное мнение ежеквартально . 16 (4, Специальный выпуск по международным исследованиям связи): 631. DOI : 10,1086 / 266427 . ISSN 0033-362X . 
  8. ^ а б Уайт, Мэрилин Дома; Марш, Эмили Э. (2006). «Контент-анализ: гибкая методология». Библиотечные тенденции . 55 (1): 22–45. DOI : 10,1353 / lib.2006.0053 . ЛВП : 2142/3670 . ISSN 1559-0682 . S2CID 6342233 .  
  9. ^ Самптер, Рэндалл С. (июль 2001). «Новости о новостях». История журналистики . 27 (2): 64–72. DOI : 10.1080 / 00947679.2001.12062572 . ISSN 0094-7679 . S2CID 140499059 .  
  10. ^ Пфайффер, Сильвия, Стефан Фишер и Вольфганг Эффельсберг. « Автоматический анализ аудиоконтента ». Технические отчеты 96 (1996).
  11. ^ Гриммер, Джастин и Брэндон М. Стюарт. « Текст как данные: перспективы и недостатки методов автоматического контент-анализа политических текстов ». Политический анализ 21.3 (2013): 267-297.
  12. ^ Nasukawa, Tetsuya и Jeonghee Yi. « Анализ настроений: определение предпочтений с помощью обработки естественного языка ». Материалы 2-й международной конференции по захвату знаний. ACM, 2003.
  13. Конвей, Майк (март 2006 г.). «Субъективная точность компьютеров: методологическое сравнение с кодированием человека в контент-анализе». Ежеквартально по журналистике и массовым коммуникациям . 83 (1): 186–200. DOI : 10.1177 / 107769900608300112 . ISSN 1077-6990 . S2CID 143292050 .  
  14. ^ Вебер, Роберт Филип (1990). Базовый контент-анализ (2-е изд.). Ньюбери-Парк, Калифорния: Сейдж. п. 12 . ISBN 9780803938632.
  15. ^ Лейси, Стивен R; Рифф, Дэниел (1993). «Грехи упущения и комиссии в количественном исследовании массовых коммуникаций». Ежеквартально по журналистике и массовым коммуникациям . 70 (1): 126–132. DOI : 10.1177 / 107769909307000114 . S2CID 144076335 . 
  16. ^ Лассуэлл, Гарольд Дуайт (1948). Власть и личность . Нью-Йорк, штат Нью-Йорк.
  17. ^ Берельсон, В. (1952). Контент-анализ в коммуникационных исследованиях . Гленко: Свободная пресса. п. 18.
  18. ^ a b c Криппендорф, Клаус (2004). Контент-анализ: введение в его методологию . Калифорния: Шалфей. стр.  87 -89. ISBN 978-0-7619-1544-7.
  19. ^ Тиммерманс, Стефан; Тавори, Иддо (2012). «Построение теории в качественных исследованиях» (PDF) . Социологическая теория . 30 (3): 167–186. DOI : 10.1177 / 0735275112457914 . S2CID 145177394 .  
  20. Джанг-Хван Ли; Ён-Гуль Ким; Сун-Хо Ю (2001). «Сценическая модель управления знаниями». Труды 34-й ежегодной Гавайской международной конференции по системным наукам . IEEE Comput. Soc: 10. DOI : 10,1109 / hicss.2001.927103 . ISBN 0-7695-0981-9. S2CID  34182315 .
  21. ^ a b c Холсти, Оле Р. (1969). Контент-анализ для социальных и гуманитарных наук . Ридинг, Массачусетс: Эддисон-Уэсли. С. 14–93. (Таблица 2-1, стр. 26).
  22. ^ Берельсон, Бернард (1952). Контент-анализ в коммуникационных исследованиях . Гленко, Иллинойс: Свободная пресса.
  23. ^ Holsti, Ole R. (1969). Контент-анализ для социальных и гуманитарных наук . Ридинг, Массачусетс: Эддисон-Уэсли. С. 15–16.
  24. ^ Holsti, Ole R. (1969). Контент-анализ для социальных и гуманитарных наук . Ридинг, Массачусетс: Эддисон-Уэсли.
  25. Перейти ↑ Neuendorf, Kimberly A. (2002). Руководство по контент-анализу . Таузенд-Оукс, Калифорния: Сейдж. С. 52–54. ISBN 0761919783. (Об описательной роли контент-анализа).
  26. ^ Агрести, Алан (2002). Категориальный анализ данных (2-е изд.). Хобокен, Нью-Джерси: Уайли. С. 2–4. ISBN 0471360937. (О значениях «категориальных» и других шкал измерения).
  27. ^ Delfico, Джозеф Ф. (1996). Контент-анализ: методология структурирования и анализа письменных материалов . Вашингтон, округ Колумбия: Главное бухгалтерское управление США. С. 19–21. (Связано с PDF-файлом).
  28. ^ Delfico, Джозеф Ф. (1996). Контент-анализ: методология структурирования и анализа письменных материалов . Вашингтон, округ Колумбия: Главное бухгалтерское управление США. (Транскрипция ASCII; Глава 3: 1.1, об использовании в соответствии с типом шкалы, и Приложение III, о надежности интеркодера).
  29. ^ Карни, Т [хомас] Ф [рансис] (1971). «Анализ содержания: обзорное эссе» . Информационный бюллетень по историческим методам . 4 (2): 52–61. (О количественном характере контент-анализа, его объединении и категоризации, а также описательной роли).
  30. ^ Krippendorff Клаус (2004). Контент-анализ: введение в его методологию (2-е изд.). Таузенд-Оукс, Калифорния: Сейдж. стр. (passim). ISBN 0761915451. (О количественном характере контент-анализа, его объединении и категоризации, а также использовании по типу шкалы).
  31. ^ Холл, Calvin S .; Ван де Кастл, Роберт Л. (1966). Контент-анализ сновидений . Нью-Йорк: Appleton-Century-Crofts. С. 1–16. (Глава 1, «Методология контент-анализа», о количественном характере и использовании контент-анализа, и цитирование «субъективного» со страницы 12).
  32. ^ Сасс, Ричард А. (2020). "АСПЕКТЫ, неправильное измерение инсульта: метрологическое исследование" . Препринты OSF . (§3, §6 и §7 о характере, рисках и альтернативе ASPECTS, и стр. 76 для сравнения с анализом содержимого).
  33. ^ Сасс, Ричард А .; Пинхо, Марко К. (2020). «АСПЕКТЫ искажает измерение объема инфаркта» . Американский журнал нейрорадиологии . 41 (5): E28.
  34. ^ Вебер, Роберт Филип (1990). Базовый контент-анализ (2-е изд.). Ньюбери-Парк, Калифорния: Сейдж. п. 17. ISBN 0803938632.
  35. ^ Криппендорф, Клаус (1974). «Обзор Томаса Ф. Карни, контент-анализ: метод систематического вывода из сообщений » . Университет Пенсильвании Scholarly Commons, Annenberg School of Communication Departmental Papers . (Цитата с 4-й страницы, без номера).
  36. ^ «Анализ содержания» . Шалфей . Проверено 16 декабря 2019 года .

Дальнейшее чтение [ править ]

  • Гранехейм, Улла Хеллгрен; Лундман, Берит (2004). «Качественный контент-анализ в медсестринских исследованиях: концепции, процедуры и меры для достижения надежности». Медсестринское образование сегодня . 24 (2): 105–112. DOI : 10.1016 / j.nedt.2003.10.001 . PMID  14769454 .
  • Бадж, Ян (редактор) (2001). Настройки политики сопоставления. Оценки для партий, выборщиков и правительств за 1945–1998 годы . Оксфорд, Великобритания: Издательство Оксфордского университета. ISBN 978-0199244003 . 
  • Криппендорф, Клаус и Бок, Мэри Анджела (редакторы) (2008). Читатель контент-анализа. Таузенд-Оукс, Калифорния: Сейдж. ISBN 978-1412949668 . 
  • Нойендорф, Кимберли А. (2017). Руководство по контент-анализу, 2-е изд. Таузенд-Оукс, Калифорния: Сейдж. ISBN 978-1412979474 . 
  • Робертс, Карл В. (редактор) (1997). Анализ текста для социальных наук: методы построения выводов из текстов и стенограмм. Махва, Нью-Джерси: Лоуренс Эрлбаум. ISBN 978-0805817348 . 
  • Виммер, Роджер Д. и Доминик, Джозеф Р. (2005). Исследования СМИ: Введение, 8-е изд. Бельмонт, Калифорния: Уодсворт. ISBN 978-0534647186 .