Catpac - Catpac

Catpac - это компьютерная программа, которая анализирует образцы текста, чтобы определить ключевые концепции, содержащиеся в образце. Он был разработан главным образом Ричардом Холмсом, программистом из штата Мичиган, и доктором Дж. Джозеф Вельфель, университет в Олбани и Университет Буффало социолог для анализа формирования и изменения установки в социологическом контексте. Вклад Роба Зиммельмана, студента и аспиранта Университета Олбани, с 1981 по 1984 год на мэйнфрейме Univac 1100, включал включение программного обеспечения CATPAC в систему Galileo * Telegal, текстовую маркировку и перенос вывода CATPAC для Система парно-сравнительной концептуальной визуализации Galileo. CATPAC и система Galileo все еще находятся в коммерческом использовании и сегодня, а с учетом последних достижений в области сбора и визуализации данных, продолжают расти. Благодаря вкладам других студентов университета было создано программное обеспечение, которое до сих пор используется в коммерческих целях. Он использует текстовые файлы в качестве входных данных и производит выходные данные, такие как частота слов и букв, а также различные типы кластерного анализа.^[1]

Дизайн

Catpac - это самоорганизующийся, то есть без присмотра, интерактивная активация и соревнование (МАК) искусственная нейронная сеть используется для анализа текста.^[2]^[3] Программа генерирует многомерное скаляр вывод, упорядочивая слова по всему тексту, создавая взвешенное слово за словом матрица что устанавливает собственный вектор центральности понятий.^[4] Пословная матрица представляет собой взаимосвязь между одним словом и появлением другого.^[5] Catpac определяет важные слова и шаблоны на основе организации текста.^[2] Этот процесс имитирует связи между нейронами в человеческом мозгу, укрепляя связи посредством кондиционирования, чтобы создать образец сходства между всеми словами в тексте.^[2]

Использовать

Catpac использовался в коммерческих исследованиях, в академических исследованиях для исследования массивных наборов текстовых данных,^[6]^[7] как мощный инструмент семантического сетевого анализа,^[4]^[5]^[8] для продольного анализа,^[4]^[8]^[9]^[10]^[11] для многоязычного анализа,^[12]^[13] как предсказатель использования СМИ^[14] и как мощный инструмент анализа контента.^[15]^[16]

Доступность

Catpac, задуманный как усовершенствование простого программного обеспечения для подсчета слов более 30 лет назад, в настоящее время доступен в 32-битном формате Windows.^[2]

Рекомендации

^ «Архивная копия». Архивировано из оригинал на 2012-07-01. Получено 2010-11-26.CS1 maint: заархивированная копия как заголовок (связь)
^ ^а ^б ^c ^d Вельфель, Джозеф. «Руководство пользователя Catpac II» (PDF) (Версия 2.0 изд.). Компания "Галилео".
^ http://www.galileoco.com/literature/Wolfpak10a.pdf
^ ^а ^б ^c Egnoto, M .; Nam, Y .; Вишванат, А (ноябрь 2010 г.). Продольный анализ газетного освещения сотовых телефонов.. Конференция Национальной ассоциации связи. Сан-Франциско, Калифорния.
^ ^а ^б Doerfel, M. L .; Барнетт, Г. А. (1999). «Семантический сетевой анализ Международной коммуникационной ассоциации». Исследования человеческого общения. 25 (4): 589–603. CiteSeerX 10.1.1.531.2227. Дои:10.1111 / j.1468-2958.1999.tb00463.x.
^ Chen, H .; Evans, C .; Батлсон, Б .; Zubrow, E .; Вельфель, Дж. (10 октября 2011 г.). «Процедуры точного анализа массивных текстовых наборов данных». Коммуникационный и научный журнал.
^ Doerfel, M. L .; Барнетт, Г. А. (1996). «Использование CATPAC для анализа текста». Полевые методы. 8 (2): 4–7. Дои:10.1177 / 1525822x960080020501.
^ ^а ^б Ортега, C.R .; Эгното, М.Дж. (2011). Лонгитюдный анализ освещения в прессе жестоких видеоигр: оценка установления повестки дня с помощью семантического анализа и анализа LIWC. Конференция NYSCA.
^ Kim, J.H .; Вс, Вт-У .; Хонг, Дж. (2007). «Влияние геополитики и внешней политики на СМИ США и Канады: анализ газетного освещения конфликта в Дарфуре в Судане». Гарвардский международный журнал прессы / политики. 12 (3): 87–95. Дои:10.1177 / 1081180x07302972.
^ Murphy, P .; Мэйнард, М. (2000). «Обрамление проблемы генетического тестирования: дискурс и культурные столкновения между политическими сообществами». Научное общение. 22 (2): 133–153. Дои:10.1177/1075547000022002002.
^ Rosen, D .; Woelfel, J .; Крикориан, Д .; Барнетт, Г.А. (2003). «Процедуры анализа интернет-сообществ». Журнал компьютерных коммуникаций. 8 (4).
^ Evans, C .; Chen, H .; Батлсон, Б .; Wölfel, J.K .; Вельфель, Дж. (2008). Нейронные сети для распознавания образов в многоязычном тексте. Международная сеть анализа социальных сетей (INSNA) Конференция Sunbelt. Сант Пит Бич, Флорида.
^ Evans, C .; Chen, H .; Батлсон, Б .; Wölfel, J.K .; Вельфель, Дж. (2010). Неконтролируемые искусственные нейронные сети для распознавания образов в многоязычном тексте. Амхерст, штат Нью-Йорк: RAH Press.
^ Cheong, P .; Hwang, J .; Эльбирт, Б .; Chen, H .; Evans, C .; Вельфель, Дж (2010). «Использование СМИ как функция идентичности: роль самооценки в использовании СМИ». В Хиннер, М. (ред.). Freiberger beiträge zur interkulturellen und wirtschaftskommunikation [Форум для общего и межкультурного делового общения]. Взаимосвязь бизнеса и общения. 6. Берлин: Питер Ланг. С. 365–381.
^ Криппендорф, К. (2004). Контент-анализ: введение в его методологию (2-е изд.). Таузенд-Оукс, Калифорния: SAGE Publications.
^ Нойендорф, К. «Программы количественного анализа текста». Руководство по контент-анализу в Интернете. Архивировано из оригинал 1 июля 2012 г.. Получено 26 ноября 2010.

внешняя ссылка

Библиография исследований с использованием Catpac

[1] «Архивная копия». Архивировано из оригинал на 2012-07-01. Получено 2010-11-26.CS1 maint: заархивированная копия как заголовок (связь)

[ref12-2] а ^б ^c ^d Вельфель, Джозеф. «Руководство пользователя Catpac II» (PDF) (Версия 2.0 изд.). Компания "Галилео".

[3] ttp://www.galileoco.com/literature/Wolfpak10a.pdf

[ref11-4] а ^б ^c Egnoto, M .; Nam, Y .; Вишванат, А (ноябрь 2010 г.). Продольный анализ газетного освещения сотовых телефонов.. Конференция Национальной ассоциации связи. Сан-Франциско, Калифорния.

[ref3-5] а ^б Doerfel, M. L .; Барнетт, Г. А. (1999). «Семантический сетевой анализ Международной коммуникационной ассоциации». Исследования человеческого общения. 25 (4): 589–603. CiteSeerX 10.1.1.531.2227. Дои:10.1111 / j.1468-2958.1999.tb00463.x.

[ref1-6] Chen, H .; Evans, C .; Батлсон, Б .; Zubrow, E .; Вельфель, Дж. (10 октября 2011 г.). «Процедуры точного анализа массивных текстовых наборов данных». Коммуникационный и научный журнал.

[ref2-7] Doerfel, M. L .; Барнетт, Г. А. (1996). «Использование CATPAC для анализа текста». Полевые методы. 8 (2): 4–7. Дои:10.1177 / 1525822x960080020501.

[ref14-8] а ^б Ортега, C.R .; Эгното, М.Дж. (2011). Лонгитюдный анализ освещения в прессе жестоких видеоигр: оценка установления повестки дня с помощью семантического анализа и анализа LIWC. Конференция NYSCA.

[ref6-9] Kim, J.H .; Вс, Вт-У .; Хонг, Дж. (2007). «Влияние геополитики и внешней политики на СМИ США и Канады: анализ газетного освещения конфликта в Дарфуре в Судане». Гарвардский международный журнал прессы / политики. 12 (3): 87–95. Дои:10.1177 / 1081180x07302972.

[ref8-10] Murphy, P .; Мэйнард, М. (2000). «Обрамление проблемы генетического тестирования: дискурс и культурные столкновения между политическими сообществами». Научное общение. 22 (2): 133–153. Дои:10.1177/1075547000022002002.

[ref10-11] Rosen, D .; Woelfel, J .; Крикориан, Д .; Барнетт, Г.А. (2003). «Процедуры анализа интернет-сообществ». Журнал компьютерных коммуникаций. 8 (4).

[ref13-12] Evans, C .; Chen, H .; Батлсон, Б .; Wölfel, J.K .; Вельфель, Дж. (2008). Нейронные сети для распознавания образов в многоязычном тексте. Международная сеть анализа социальных сетей (INSNA) Конференция Sunbelt. Сант Пит Бич, Флорида.

[ref15-13] Evans, C .; Chen, H .; Батлсон, Б .; Wölfel, J.K .; Вельфель, Дж. (2010). Неконтролируемые искусственные нейронные сети для распознавания образов в многоязычном тексте. Амхерст, штат Нью-Йорк: RAH Press.

[ref16-14] Cheong, P .; Hwang, J .; Эльбирт, Б .; Chen, H .; Evans, C .; Вельфель, Дж (2010). «Использование СМИ как функция идентичности: роль самооценки в использовании СМИ». В Хиннер, М. (ред.). Freiberger beiträge zur interkulturellen und wirtschaftskommunikation [Форум для общего и межкультурного делового общения]. Взаимосвязь бизнеса и общения. 6. Берлин: Питер Ланг. С. 365–381.

[ref7-15] Криппендорф, К. (2004). Контент-анализ: введение в его методологию (2-е изд.). Таузенд-Оукс, Калифорния: SAGE Publications.

[ref9-16] Нойендорф, К. «Программы количественного анализа текста». Руководство по контент-анализу в Интернете. Архивировано из оригинал 1 июля 2012 г.. Получено 26 ноября 2010.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]