OntoClean - OntoClean

OntoClean это методология анализа онтологии на основе формальных, независимых от предметной области свойств классов (метасвойств), разработанных Никола Гуарино и Крис Велти.

Обзор и история

OntoClean был первой попыткой формализовать понятия онтологического анализа для информационных систем. Идея заключалась в том, чтобы обосновать типы решений, которые принимают опытные строители онтологий, и объяснить типичные ошибки неопытных. Алан Ректор, во время дебатов на конференции КР-2002 в г. Тулуза, сказал: «Что вы сделали, так это уменьшили количество времени, которое я трачу на споры с медиками».

Идеи, на которых сосредоточились Гуарино и Велти, были взяты из философской онтологии. Их интересовали не кажущиеся бесконечными споры о том, что такое правильная онтология вселенной, а скорее методы, которые используют эти философы для анализа, поддержки и критики аргументов друг друга. Эти методы очень мало связаны с конкретной онтологией, если вообще не связаны, вместо этого они выявляют то, что часто является очень тонким различием.

Идеи, лежащие в основе OntoClean, впервые появились в литературе в серии из трех статей, опубликованных в 2000 году.[1][2][3] Название OntoClean не появлялся в литературе до 2002 г.[4] Согласно Thompson-ISI, работа над OntoClean была самой цитируемой из академических работ по онтологии.[5] OntoClean был важен, поскольку это была первая формальная методология для онтологическая инженерия, применяя научные принципы в области, практикой которой было в основном искусство.

Примечание по терминологии

В логике свойство - это унарный предикат в намерении, другими словами, свойство есть что это значит быть членом класса. Например, мы говорим, что экземпляры класса Person обладают свойством «быть личностью». В семантической сети свойство - это бинарное отношение.

Различие между свойством и классом тонкое и, вероятно, не критично для понимания OntoClean, однако эта статья следует за публикациями OntoClean и последовательно использует «свойство» в соответствии с его исходным значением, и можно рассматривать «свойство» и «класс» как синонимы. . Таким образом, метасвойство - это свойство свойства или класса.

Метасвойства

В основе OntoClean лежат независимые от предметной области свойства классов, метасвойства OntoClean: идентичность, единство, жесткость и зависимость. Позже работы Велти и Андерсена[6] добавил еще два метасвойства: постоянство и актуальность.

Личность

Идентичность является фундаментальной для онтологии, и особенно для онтологий информационных систем. Идентичность хорошо известна в метафизике и в концептуальном моделировании баз данных. В последнем случае рекомендуется указывать первичный ключ для строк в таблице. Если «две» строки имеют одинаковые первичные ключи, они считаются одной и той же строкой.

Более важными для онтологии являются вопросы идентичности, раскрывающие существование или, по крайней мере, необходимость представления других сущностей. Здесь вопрос заключается в том, чтобы найти условия, при которых предлагаемый объект будет и таким же, и другим. Классический пример - это кусок глины, который превращается в статую. Если вы используете одно и тоже глину, но преобразовать ее в разные статуя, это одно и то же? Если да, то как это могло быть разные? Если нет, то как это могло быть одинаковый. В концептуальном моделировании подразумевается, что когда возникает такая неоднозначность, следует рассматривать ее как два разных объекта, чтобы учесть ситуацию, когда одна изменяется, а другая остается неизменной.

В OntoClean, критерии идентичности связаны или переносятся некоторыми классами объектов, называемыми сортировки. Сортировка - это класс, все экземпляры которого идентифицируются одинаково. В информационных системах эти критерии часто являются внешними, например, номер социального страхования или универсальный уникальный идентификатор, что не представляет интереса с онтологической точки зрения. Критерии идентичности должны быть информативный, они должны помочь нам и другим понять, что такое класс. Например, треугольник можно идентифицировать по длине трех его сторон или по двум сторонам и внутреннему углу и т. Д. Это многое говорит о том, что есть предназначены классом треугольника здесь, например один и тот же треугольник может быть во многих местах одновременно. У кого-то еще может быть онтология, в которой класс треугольника имеет разные критерии идентичности, так что разные рисунки всегда являются разными треугольниками, даже если они одного размера. Критерии идентичности (и OntoClean, если на то пошло) не говорят вам, что одно из этих определений треугольника является правильным или неправильным, просто они разные и, следовательно, разные классы.

Критерии идентичности и сортировки интуитивно предназначены для учета лингвистической привычки ассоциировать идентичность с определенными классами. В примере с классической статуей и глиной мы, естественно, говорим "то же самое глина"или" то же самое статуя", указывая на то, что существуют критерии идентичности, свойственные каждому классу.

Будучи сортовой является первым метасвойством OntoClean, обозначенным + Я надстрочный индекс ( для несорталий) на классе в исходной записи. + Я (но нет ) наследуется вниз по иерархии классов, если класс является сортировкой, то наследуются и все его подклассы.

Единство

Есть определенные свойства, которыми обладают только те лица, которые целые. В формальной онтологии целые часто отличаются от простые суммы, которые являются индивидами, границы которых в некотором смысле произвольны. Например, рассмотрим класс глина. Экземпляр этого класса может быть некоторым количеством материала (это, конечно, только одно возможное значение), так что любая (фактически, каждая) произвольная часть суммы будет другим экземпляром того же класса. Напротив, экземпляры класса Person, как правило, не разлагаемы таким образом.

Для целей OntoClean целое - это люди, все части которых связаны друг с другом и только друг с другом посредством определенных отношений. Это отношение можно рассматривать как обобщенная связь связь. Простые суммы не имеют такого отношения, поскольку любое разложение простой суммы связано с любой большей суммой, которая не является одной из ее частей, тем же отношением.

Единство - это метасвойство, обозначенное + U, классов, все индивиды которых являются целым в одном отношении. Как и идентичность, OntoClean не требует, чтобы само отношение было указано, часто достаточно знать, что отношение существует. Интуитивно класс имеет единство, если все его экземпляры являются одним и тем же типом целого, и обычно это верно для классов естественных объектов. Неединство, обозначенное -U, является метасвойством классов, чьи экземпляры не все целые или не все целые по одному и тому же отношению. Дальнейшее и более полезное уточнение неединства - это антиединство, обозначенное ~ U, метасвойство классов, все экземпляры которых не являются целыми, например классы простых сумм. + U и ~ U (но нет -U) наследуются по иерархии классов.

Жесткость

Закон Лейбница имеет смысл при первом рассмотрении, однако не нужно много времени, чтобы увидеть, как соображения времени вызывают проблемы между большинством онтологий (особенно онтологий семантической сети) и Закон Лейбница. Например, у меня может быть борода в один день и сбривать ее на следующий день, но в оба раза я остаюсь одним и тем же лицом. Как я могу быть одно и тоже если у меня есть измененный?

Есть много логических подходов к этой классической дилемме (в том числе простое игнорирование ее), наиболее распространенным является рассмотрение некоторых свойств как существенный; Существенное свойство (и, по терминологии выше, свойства являются унарными предикатами) сущности - это свойство, которое не может измениться, и это свойства, для которых Закон Лейбница держит. Другие свойства объекта, которые могут изменяться, несущественны и не могут быть вовлечены в идентичность.

Некоторые свойства необходимы для всех их экземпляров. Подумайте о собственности быть человеком, обычно представленный классом Person. Для каждой сущности, обладающей этим свойством, это свойство необходимо. Так что, по крайней мере, одно из свойств, которое не изменилось во мне, когда я брею бороду, - это то, что я человек. Эти свойства, существенные для всех их экземпляров, жесткие свойства.

Жесткие свойства обозначаются + R, и свойства, которые не являются жесткими . Важной специализацией нежестких свойств являются антижесткий характеристики (~ R), которые должны быть изменены. Думать о будучи студентом - все студенты не должны быть студентами. ~ R (но нет или же + R) наследуется вниз по иерархии классов.

Обратите внимание, что это всего лишь примеры - безусловно, возможна онтология, в которой Person является антижестким. Представьте, например, онтологию мистических верований, в которой сущность после смерти меняется от Личности к Духу. Чтобы человек оставался одинаковым во время этого изменения, быть человеком не должно быть существенным, а, кроме того, оно должно быть изменчивым (т. Е. Антижестким).

Не следует путать жесткость с представлением Крипке о Жесткие обозначения, которые являются подробностями. Термин «жесткий» в OntoClean предназначен для описания связи instanceOf между индивидуумом и жестким классом - ее нельзя разорвать.

Зависимость

Зависимость - понятие разнообразное. В основных статьях OntoClean Гуарино и Велти использовали своего рода зависимость, которая отражает метасвойство определенных реляционных ролей. Свойство является зависимым, если каждый его экземпляр подразумевает существование другой сущности. Например, свойство Student является зависимым, поскольку для того, чтобы быть учеником, должен быть учитель; для каждого экземпляра ученика есть как минимум один экземпляр учитель. В более поздних работах для [Dolce] было отмечено два вида имущественной зависимости: специфический постоянная зависимость и общий постоянная зависимость. Первый учитывает зависимость от конкретных объектов, например каждый человек зависит от наличия определенного мозга. Последнее относится к случаю Student / Teacher, где подойдет любой экземпляр Teacher.

Есть много других видов зависимости, см. [Fine and Smith, 1983] и особенно [Simons, 1987][7]. Адаптировать их во фреймворк OntoClean - открытая проблема.

Зависимость обозначается + D, будучи независимым с -D. + D (но нет -D) наследуется вниз по иерархии классов.

Рекомендации

  1. ^ Гуарино, Никола и Крис Велти. 2000. Онтологический анализ таксономических отношений. In, Laender, A. и Storey, V., edds, Proceedings of ER-2000: The 19 International Conference on Conceptual Modeling. Springer-Verlag. Октябрь 2000 г.
  2. ^ Гуарино, Никола и Крис Велти. 2000. Формальная онтология свойств. In, Dieng, R., and Corby, O., eds, Труды EKAW-2000: 12-я Международная конференция по инженерии знаний и управлению знаниями. Берлин: Springer LNCS Vol. 1937/2000. Стр. 97-112. Октябрь 2000 г.
  3. ^ Гуарино, Никола и Крис Велти. 2000. Идентичность, единство и индивидуация: к формальному набору инструментов для онтологического анализа. В У. Хорн, ред., Труды ECAI-2000: Европейская конференция по искусственному интеллекту. Амстердам: IOS Press. Стр. 219-223. Август 2000 г.
  4. ^ Гуарино, Никола и Крис Велти. 2002. Оценка онтологических решений с помощью OntoClean. Коммуникации ACM. 45 (2): 61-65. Нью-Йорк: ACM Press
  5. ^ Томпсон. «Новые направления исследований: онтологии».
  6. ^ Велти и Андерсен, 2005. На пути к OntoClean 2.0: основа для жесткости: https://dl.acm.org/doi/10.5555/2351604.2351611
  7. ^ Саймонс, П., 1987, Части: Исследование онтологии, Оксфорд: Clarendon Press.