Неуверенный вывод - Uncertain inference
Неуверенный вывод был впервые описан К. Дж. Ван Рейсберген[1] как способ формального определения отношения запроса и документа в Поиск информации. Эта формализация представляет собой логическое следствие с приложенной мерой неопределенности.
Определения
Райсберген предлагает, чтобы мера неуверенность документа d на запрос q быть вероятностью его логического следствия, то есть:
Запрос пользователя можно интерпретировать как набор утверждений о желаемом документе. Задача системы - сделать вывод для конкретного документа, если утверждения запроса верны. Если да, то документ извлекается. Во многих случаях содержимого документов недостаточно для подтверждения запросов. А база знаний фактов и правил, но некоторые из них могут быть неопределенными, потому что с их использованием для вывода может быть связана вероятность. Поэтому мы также можем называть это правдоподобный вывод. В правдоподобие заключения является функцией правдоподобия каждого утверждения запроса. Вместо того, чтобы извлекать документ, который точно соответствует запросу, мы должны ранжировать документы на основе их правдоподобия в отношении этого запроса. d и q оба генерируются пользователями, они подвержены ошибкам; таким образом неопределенно. Это повлияет на достоверность данного запроса.
Делая это, он выполняет две задачи:
- Отделите процессы проверки вероятностей от логики
- Отделяйте обработку релевантности от обработки запросов
Мультимедиа документы, такие как изображения или видео, имеют разные свойства вывода для каждого типа данных. Они также отличаются от свойств текстового документа. Структура правдоподобного вывода позволяет нам измерять и комбинировать вероятности, исходящие из этих различных свойств.
Неопределенный вывод обобщает понятия аутоэпистемическая логика, где значения истинности известны или неизвестны, а когда известны, они истинны или ложны.
Пример
Если у нас есть запрос формы:
где A, B и C - утверждения запроса, тогда для документа D нам нужна вероятность:
Если мы превратим это в условная возможность и если утверждения запроса независимы, мы можем вычислить общую вероятность импликации как произведение вероятностей отдельных утверждений.
Дальнейшая работа
Крофт и Кровец[2] применили неопределенный вывод к системе поиска информации для офисных документов, которые они называли ОФИЦЕР. В офисных документах допущение независимости справедливо, поскольку запрос будет сосредоточен на их индивидуальных атрибутах. Помимо анализа содержания документов, можно также запросить, например, об авторе, размере, теме или коллекции. Они разработали методы для сравнения атрибутов документов и запросов, определения их правдоподобия и объединения их в общую оценку для каждого документа. Помимо этой неопределенности в содержании документов и запросов, также необходимо было устранить эту проблему.
Вероятностно-логические сети система для выполнения неопределенного вывода; четкие истинные / ложные значения истинности заменяются не только вероятностью, но и уровнем достоверности, указывающим на достоверность вероятности.
Марковские логические сети позволить сделать неопределенный вывод; неопределенности вычисляются с использованием принцип максимальной энтропии, по аналогии с тем, как Цепи Маркова описать неопределенность конечные автоматы.
Смотрите также
Рекомендации
- ^ К. Дж. Ван Рейсберген (1986), Неклассическая логика поиска информации (PDF), The Computer Journal, стр. 481–485.
- ^ В. Б. Крофт; Р. Кровец (1988), «Интерактивный поиск документов», Конференция по офисным информационным системам, спонсируемая ACM SIGOIS и IEEECS TC-OA -, стр. 228–235, Дои:10.1145/45410.45435, ISBN 0897912616