Catpac - Catpac

Catpac - это компьютерная программа, которая анализирует образцы текста, чтобы определить ключевые концепции, содержащиеся в образце. Он был разработан главным образом Ричардом Холмсом, программистом из штата Мичиган, и доктором Дж. Джозеф Вельфель, университет в Олбани и Университет Буффало социолог для анализа формирования и изменения установки в социологическом контексте. Вклад Роба Зиммельмана, студента и аспиранта Университета Олбани, с 1981 по 1984 год на мэйнфрейме Univac 1100, включал включение программного обеспечения CATPAC в систему Galileo * Telegal, текстовую маркировку и перенос вывода CATPAC для Система парно-сравнительной концептуальной визуализации Galileo. CATPAC и система Galileo все еще находятся в коммерческом использовании и сегодня, а с учетом последних достижений в области сбора и визуализации данных, продолжают расти. Благодаря вкладам других студентов университета было создано программное обеспечение, которое до сих пор используется в коммерческих целях. Он использует текстовые файлы в качестве входных данных и производит выходные данные, такие как частота слов и букв, а также различные типы кластерного анализа.[1]

Дизайн

Catpac - это самоорганизующийся, то есть без присмотра, интерактивная активация и соревнование (МАК) искусственная нейронная сеть используется для анализа текста.[2][3] Программа генерирует многомерное скаляр вывод, упорядочивая слова по всему тексту, создавая взвешенное слово за словом матрица что устанавливает собственный вектор центральности понятий.[4] Пословная матрица представляет собой взаимосвязь между одним словом и появлением другого.[5] Catpac определяет важные слова и шаблоны на основе организации текста.[2] Этот процесс имитирует связи между нейронами в человеческом мозгу, укрепляя связи посредством кондиционирования, чтобы создать образец сходства между всеми словами в тексте.[2]

Использовать

Catpac использовался в коммерческих исследованиях, в академических исследованиях для исследования массивных наборов текстовых данных,[6][7] как мощный инструмент семантического сетевого анализа,[4][5][8] для продольного анализа,[4][8][9][10][11] для многоязычного анализа,[12][13] как предсказатель использования СМИ[14] и как мощный инструмент анализа контента.[15][16]

Доступность

Catpac, задуманный как усовершенствование простого программного обеспечения для подсчета слов более 30 лет назад, в настоящее время доступен в 32-битном формате Windows.[2]

Рекомендации

  1. ^ «Архивная копия». Архивировано из оригинал на 2012-07-01. Получено 2010-11-26.CS1 maint: заархивированная копия как заголовок (связь)
  2. ^ а б c d Вельфель, Джозеф. «Руководство пользователя Catpac II» (PDF) (Версия 2.0 изд.). Компания "Галилео".
  3. ^ http://www.galileoco.com/literature/Wolfpak10a.pdf
  4. ^ а б c Egnoto, M .; Nam, Y .; Вишванат, А (ноябрь 2010 г.). Продольный анализ газетного освещения сотовых телефонов.. Конференция Национальной ассоциации связи. Сан-Франциско, Калифорния.
  5. ^ а б Doerfel, M. L .; Барнетт, Г. А. (1999). «Семантический сетевой анализ Международной коммуникационной ассоциации». Исследования человеческого общения. 25 (4): 589–603. CiteSeerX  10.1.1.531.2227. Дои:10.1111 / j.1468-2958.1999.tb00463.x.
  6. ^ Chen, H .; Evans, C .; Батлсон, Б .; Zubrow, E .; Вельфель, Дж. (10 октября 2011 г.). «Процедуры точного анализа массивных текстовых наборов данных». Коммуникационный и научный журнал.
  7. ^ Doerfel, M. L .; Барнетт, Г. А. (1996). «Использование CATPAC для анализа текста». Полевые методы. 8 (2): 4–7. Дои:10.1177 / 1525822x960080020501.
  8. ^ а б Ортега, C.R .; Эгното, М.Дж. (2011). Лонгитюдный анализ освещения в прессе жестоких видеоигр: оценка установления повестки дня с помощью семантического анализа и анализа LIWC. Конференция NYSCA.
  9. ^ Kim, J.H .; Вс, Вт-У .; Хонг, Дж. (2007). «Влияние геополитики и внешней политики на СМИ США и Канады: анализ газетного освещения конфликта в Дарфуре в Судане». Гарвардский международный журнал прессы / политики. 12 (3): 87–95. Дои:10.1177 / 1081180x07302972.
  10. ^ Murphy, P .; Мэйнард, М. (2000). «Обрамление проблемы генетического тестирования: дискурс и культурные столкновения между политическими сообществами». Научное общение. 22 (2): 133–153. Дои:10.1177/1075547000022002002.
  11. ^ Rosen, D .; Woelfel, J .; Крикориан, Д .; Барнетт, Г.А. (2003). «Процедуры анализа интернет-сообществ». Журнал компьютерных коммуникаций. 8 (4).
  12. ^ Evans, C .; Chen, H .; Батлсон, Б .; Wölfel, J.K .; Вельфель, Дж. (2008). Нейронные сети для распознавания образов в многоязычном тексте. Международная сеть анализа социальных сетей (INSNA) Конференция Sunbelt. Сант Пит Бич, Флорида.
  13. ^ Evans, C .; Chen, H .; Батлсон, Б .; Wölfel, J.K .; Вельфель, Дж. (2010). Неконтролируемые искусственные нейронные сети для распознавания образов в многоязычном тексте. Амхерст, штат Нью-Йорк: RAH Press.
  14. ^ Cheong, P .; Hwang, J .; Эльбирт, Б .; Chen, H .; Evans, C .; Вельфель, Дж (2010). «Использование СМИ как функция идентичности: роль самооценки в использовании СМИ». В Хиннер, М. (ред.). Freiberger beiträge zur interkulturellen und wirtschaftskommunikation [Форум для общего и межкультурного делового общения]. Взаимосвязь бизнеса и общения. 6. Берлин: Питер Ланг. С. 365–381.
  15. ^ Криппендорф, К. (2004). Контент-анализ: введение в его методологию (2-е изд.). Таузенд-Оукс, Калифорния: SAGE Publications.
  16. ^ Нойендорф, К. «Программы количественного анализа текста». Руководство по контент-анализу в Интернете. Архивировано из оригинал 1 июля 2012 г.. Получено 26 ноября 2010.

внешняя ссылка