Таксономия (общая) - Taxonomy (general)

Таксономия это практика и наука категоризация или же классификация на основе дискретные множества. Слово также используется как считать имя существительное: таксономия, или же таксономическая схема, это особая категоризация. Слово уходит своими корнями в греческий язык τάξις, Таксис (что означает «порядок», «порядок») и νόμος, номос («закон» или «наука»). Первоначально таксономия относится только к категоризации организмов или конкретной категоризации организмов. В более широком, более общем смысле это может относиться к категоризации вещей или концепций, а также к принципам, лежащим в основе такой категоризации. Таксономия отличается от мерономия, который имеет дело с категоризацией частей целого.

Многие таксономии имеют иерархический структура, но это не требование. Таксономия использует таксономические единицы, известные как «таксоны» (единственное число «таксон»).

Приложения

Категории Википедии иллюстрируют таксономию,[1] а полная таксономия категорий Википедии может быть извлечена автоматически.[2] По состоянию на 2009 год, было показано, что таксономия, построенная вручную, такая как таковая вычислительных лексиконов, как WordNet, можно использовать для улучшения и реструктуризации таксономии категорий Википедии.[3]

В более широком смысле таксономия также применяется к схемам отношений, отличным от иерархий родитель-потомок, таким как сетевые структуры. Тогда таксономии могут включать в себя одного дочернего элемента с несколькими родителями, например, «Автомобиль» может появляться с обоими родителями «Транспортное средство» и «Стальные механизмы»; Однако для некоторых это просто означает, что «автомобиль» является частью нескольких различных таксономий.[4] Таксономия может также быть просто организацией разных вещей в группы или алфавитным списком; здесь, однако, более уместен термин «словарь». В настоящее время используется в управление знаниями, таксономии считаются уже, чем онтологии поскольку онтологии применяют большее разнообразие типов отношений.[5]

Математически иерархическая таксономия - это древовидная структура классификаций для заданного набора объектов. Его также называют иерархия сдерживания. В верхней части этой структуры находится единая классификация, корневой узел, который применяется ко всем объектам. Узлы ниже этого корня представляют собой более конкретные классификации, которые применяются к подмножествам общего набора классифицированных объектов. Ход рассуждения идет от общего к более частному.

Напротив, в контексте юридической терминологии используется открытая контекстная таксономия - таксономия, относящаяся только к определенному контексту. В сценариях, взятых из правовой области, моделируется формальный учет открытой текстуры юридических терминов, который предлагает различные понятия «ядра» и «полутени» значений концепции. Ход рассуждения идет от частного к более общему.[6]

История

Антропологи заметили, что таксономии обычно встроены в местные культурные и социальные системы и выполняют различные социальные функции. Пожалуй, самое известное и влиятельное исследование народные систематики является Эмиль Дюркгейм с Элементарные формы религиозной жизни. Более позднюю трактовку народных таксономий (включая результаты нескольких десятилетий эмпирических исследований) и обсуждение их связи с научной таксономией можно найти в Скотт Атран с Когнитивные основы естествознания. Было обнаружено, что народные таксономии организмов в значительной степени согласуются с научной классификацией, по крайней мере, для более крупных и очевидных видов, что означает, что народные систематики не основаны исключительно на утилитарных характеристиках.[7]

В семнадцатом веке немецкий математик и философ Готфрид Лейбниц, следуя трудам майоркского философа XIII века Рамон Лулль на его Ars generalis ultima, система для процедурной генерации концепций путем комбинирования фиксированного набора идей, стремилась разработать алфавит человеческой мысли. Лейбниц намеревался характеристика универсальный быть «алгеброй», способной выразить все концептуальные мысли. Концепция создания такого "универсальный язык "часто исследовался в 17 веке, в том числе английским философом Джон Уилкинс в его работе Эссе о реальном персонаже и философский язык (1668), из которых классификационная схема в Roget с Тезаурус в конечном итоге получается.

Использование таксономий в различных дисциплинах

Таксономии в программной инженерии

Vegas et al.[8] привести убедительные доводы в пользу продвижения знаний в области разработки программного обеспечения с помощью таксономий. Аналогичным образом Ore et al.[9] предоставить систематическую методологию подхода к построению таксономии в вопросах, связанных с программной инженерией.

Таксономии тестирования программного обеспечения

В исследованиях тестирования программного обеспечения было предложено несколько таксономий для классификации методов, инструментов, концепций и артефактов. Ниже приведены некоторые примеры таксономий:

  1. Таксономия методов тестирования на основе моделей[10]
  2. Таксономия инструментов статического анализа кода[11]

Engström et al.[12] предложить и оценить использование таксономии для связи между исследователями и практиками, занятыми в области тестирования программного обеспечения. Они также разработали веб-инструмент[13] для облегчения и поощрения использования таксономии. Инструмент и его исходный код доступны для публичного использования.[14]

Таксономии в публикациях исследований

Ссылаясь на несоответствия существующей практике составления списков авторов статей в медицинских исследовательских журналах, Драммонд Ренни и соавторы обратились к статье 1997 года в JAMA, то Журнал Американской медицинской ассоциации за

радикальное концептуальное и систематическое изменение, чтобы отразить реалии множественного авторства и укрепить ответственность. Мы предлагаем отказаться от устаревшего понятия "автор" в пользу более полезного и реалистичного понятия "участник".[15]:152

С 2012 года несколько крупных академических и научных издательств создали Проект CRediT разработать контролируемый словарный запас ролей участников.[16] Известный как CREDIT (Таксономия ролей участников), это пример плоской неиерархической таксономии; тем не менее, он включает необязательную широкую классификацию степени вклада: вести, равный или же поддерживающий. Эми Брэнд и соавторы резюмируют свой предполагаемый результат как:

Выявление конкретных вкладов в опубликованные исследования приведет к соответствующему признанию, меньшему количеству споров между авторами и меньшим препятствиям для сотрудничества и обмена данными и кодом.[15]:151

По состоянию на середину 2018 года эта таксономия явно ограничивает область применения результаты исследований, в частности журнальные статьи; однако он довольно необычно «надеется… поддержать идентификацию рецензентов».[16] (Таким образом, в нем еще не определены термины для таких ролей, как редактор или автор главы в книга результатов исследования.) Версия 1, созданная первой Рабочей группой (северной) осенью 2014 года, определяет 14 конкретных ролей участников, используя следующие определенные термины:

  • Концептуализация
  • Методология
  • Программного обеспечения
  • Проверка
  • Формальный анализ
  • Расследование
  • Ресурсы
  • Курирование данных
  • Письмо - оригинальный черновик
  • Написание - просмотр и редактирование
  • Визуализация
  • Надзор
  • Администрация проекта
  • Получение финансирования

Восприятие было неоднозначным: несколько крупных издателей и журналов планируют внедрить CRediT к концу 2018 года, в то время как почти столько же не убеждены в необходимости или ценности его использования. Например,

В Национальная Академия Наук создал TACS (Прозрачность вклада авторов в науку) на веб-странице, где перечислены журналы, которые обязуются устанавливать стандарты авторства, определять обязанности соответствующих авторов, требовать идентификаторы ORCID и применять таксономию CRediT.[17]

На той же веб-странице есть таблица со списком 21 журнала (или семейства журналов), из которых:

  • 5 внедрили или к концу 2018 года внедрили CRediT,
  • 6 требуется заявление автора и предлагается использовать CRediT,
  • 8 не используют CRediT, в 3 из которых приводятся причины, по которым это не следует делать, и
  • 2 малоинформативны.

Таксономия - это открытый стандарт, соответствующий OpenStand принципы,[18] и публикуется под Creative Commons лицензия.[16]

Таксономия в Интернете

Веб-сайты с хорошо продуманной таксономией или иерархией легко понимаются пользователями благодаря возможности разработки пользователями ментальной модели структуры сайта.[19]

Рекомендации по написанию таксономии для Интернета

  • Взаимоисключающие категории могут быть полезными. Если категории появляются в нескольких местах, это называется перекрестным списком или полииерархическим. Иерархия потеряет свою ценность, если перекрестные списки будут появляться слишком часто. Перекрестный список часто появляется при работе с неоднозначными категориями, которые подходят более чем одному месту.[19]
  • Полезно иметь баланс между широтой и глубиной таксономии. Слишком много вариантов (широты) перегрузят пользователей, предоставив им слишком много вариантов. В то же время слишком узкая структура с более чем двумя или тремя уровнями перехода по клику вызовет разочарование у пользователей и они могут сдаться.[19]

Отношения есть и есть, и гипонимия

Два преобладающих типа отношений в представление знаний системы предикация и универсально количественно условный. Отношения предикации выражают представление о том, что отдельная сущность является примером определенного типа (например, Джон холостяк), в то время как универсально определяемые условные выражения выражают представление о том, что тип является подтипом другого типа (например, "Собака - это млекопитающее ", что означает то же, что и "Все собаки - млекопитающие ").[20]

Таксономии часто представлены как это иерархии где каждый уровень является более конкретным (на математическом языке «подмножеством») уровнем выше него. Например, базовая таксономия биологии будет включать такие понятия, как млекопитающее, который является подмножеством животное, и собаки и кошки, которые являются подмножествами млекопитающее. Таксономия такого рода называется моделью как модель, потому что конкретные объекты рассматриваются как экземпляры концепции. Например, Фидо это - образец концепции собака и Пушистый это Кот.[21]

В лингвистика, is-a отношения называются гипонимия. Слова, описывающие категории, называются гиперонимами, а слова, являющиеся примерами категорий, - гипонимами. В простом примере биологии собака гиперним и Фидо это один из его гипонимов. Слово может быть как гипонимом, так и гиперонимом. Например, собака это гипоним млекопитающее а также гипероним Фидо.

Смотрите также

Примечания

  1. ^ Зирн, Цецилия, Виви Настасе и Майкл Штрубе. 2008 г. «Различение экземпляров и классов в таксономии Википедии» (видеолекция). 5-й ежегодный Европейская конференция по семантической паутине (ESWC 2008).
  2. ^ С. Понцетто и М. Штрубе. 2007 г. «Получение крупномасштабной таксономии из Википедии». Proc. 22-й конференции по развитию искусственного интеллекта, Ванкувер, Британская Колумбия, Канада, стр. 1440-1445.
  3. ^ С. Понцетто, Р. Навильи. 2009 г. «Крупномасштабное картографирование таксономии для реструктуризации и интеграции Википедии». Proc. 21-й Международной совместной конференции по искусственному интеллекту (IJCAI 2009), Пасадена, Калифорния, стр. 2083-2088.
  4. ^ Джексон, Иоав. «Таксономия - это не просто дизайн, это искусство», Государственные компьютерные новости (Вашингтон, округ Колумбия.). 2 сентября 2004 г.
  5. ^ Сурьянто, Хендра и Пол Комптон. «Изучение классификационных таксономий на основе системы классификационных знаний». Университет Карлсруэ; "Определение" таксономии "" Сайт Straights Knowledge.
  6. ^ Гросси, Давиде, Фрэнк Дигнум и Джон-Жюль Чарльз Мейер. (2005). «Контекстные таксономии» в Вычислительная логика в многоагентных системах, стр. 33-51[мертвая ссылка ].
  7. ^ Кеннет Боулдинг; Элиас Халил (2002). Эволюция, порядок и сложность. Рутледж. ISBN  9780203013151. п. 9
  8. ^ Вегас, С. (2009). «Зрелые знания программной инженерии через классификации: тематическое исследование по методам модульного тестирования». IEEE Transactions по разработке программного обеспечения. 35 (4): 551–565. CiteSeerX  10.1.1.221.7589. Дои:10.1109 / TSE.2009.13. S2CID  574495.
  9. ^ Руд, С. (2014). «Таксономия критических факторов успеха для развертывания программного процесса». Журнал качества программного обеспечения. 22 (1): 21–48. Дои:10.1007 / s11219-012-9190-у. S2CID  18047921.
  10. ^ Уттинг, Марк (2012). «Таксономия подходов к тестированию на основе моделей». Тестирование, проверка и надежность программного обеспечения. 22 (5): 297–312. Дои:10.1002 / stvr.456. S2CID  6782211.
  11. ^ Новак, Ерней. «Таксономия инструментов статического анализа кода». Материалы 33-й Международной конвенции MIPRO: 418–422.
  12. ^ Энгстрём, Эмели (2016). «SERP-тест: таксономия для поддержки коммуникации между отраслью и академическим сообществом». Журнал качества программного обеспечения. 25 (4): 1269–1305. Дои:10.1007 / s11219-016-9322-х. S2CID  34795073.
  13. ^ «SERP-подключение».
  14. ^ Энгстрем, Эмели. "SERP-подключение бэкэнд".
  15. ^ а б Бренд, Эми; Аллен, Лиз; Альтман, Мика; Хлава, Марджори; Скотт, Джо (1 апреля 2015 г.). «Помимо авторства: авторство, вклад, сотрудничество и кредит». Learned Publishing. 28 (2): 151–155. Дои:10.1087/20150211. S2CID  45167271.
  16. ^ а б c "CRediT". КАСРАЙ. КАСРАЙ. 2 мая 2018. Архивировано с оригинал (онлайн) 12 июня 2018 г.. Получено 13 июн 2018.
  17. ^ «Прозрачность вклада авторов в науку (TACS)» (онлайн). Национальная Академия Наук. Национальная академия наук. 2018 г.. Получено 13 июн 2018.
  18. ^ «OpenStand». OpenStand. Получено 13 июн 2018.
  19. ^ а б c Питер., Морвилл (2007). Информационная архитектура для всемирной паутины. Розенфельд, Луис., Розенфельд, Луи. (3-е изд.). Севастополь, Калифорния: О'Рейли. ISBN  9780596527341. OCLC  86110226.
  20. ^ Рональд Дж. Брахман; Что такое IS-A, а что нет. Анализ таксономических связей в семантических сетях. IEEE Computer, 16 (10); Октябрь 1983 г.
  21. ^ Брахман, Рональд (октябрь 1983 г.). «Что такое IS-A, а что нет. Анализ таксономических связей в семантических сетях». IEEE Computer. 16 (10): 30–36. Дои:10.1109 / MC.1983.1654194. S2CID  16650410.

Рекомендации

внешняя ссылка