Фонетический алгоритм - Phonetic algorithm

А фонетический алгоритм является алгоритм за индексация из слова по их произношение. Большинство фонетических алгоритмов были разработаны для использования с английский язык[нужна цитата ]; следовательно, применение правил к словам на других языках может не дать значимого результата.

Они обязательно[нужна цитата ] сложные алгоритмы со множеством правил и исключений, потому что английский написание и произношение осложняется историческими изменениями произношения и слов одолженный от многих языки.

Алгоритмы

Среди наиболее известных фонетических алгоритмов:

  • Soundex, который был разработан для кодирования фамилий для использования при переписи населения. Коды Soundex представляют собой четырехсимвольные строки, состоящие из одной буквы, за которой следуют три цифры.
  • Daitch – Mokotoff Soundex, который является усовершенствованием Soundex, предназначенным для лучшего соответствия фамилий славянского и германского происхождения. Коды Daitch – Mokotoff Soundex представляют собой строки, состоящие из шести цифр.
  • Кельнская фонетика: Это похоже на Soundex, но больше подходит для немецких слов.
  • Метафон и Двойной метафон которые подходят для использования с большинством английских слов, а не только с именами. Алгоритмы метафона являются основой многих популярных средства проверки правописания.
  • Система идентификации и разведки штата Нью-Йорк (NYSIIS), который отображает похожие фонемы к тому же письму. В результате получается строка, которую читатель может произнести без декодирования.
  • Подход к оценке матча разработанный Western Airlines в 1977 году - этот алгоритм имеет методику кодирования и сравнения диапазонов.
  • Caverphone, созданный для помощи в сопоставлении данных между списками избирателей конца 19-го и начала 20-го веков, оптимизированный для акцентов, присутствующих в некоторых частях Новой Зеландии.

Общее использование

  • Проверка орфографии часто может содержать фонетические алгоритмы. В Метафон алгоритм, например, может взять неправильно написанное слово и создать код. Затем код ищется в каталоге для слов с таким же или похожим Метафоном. Слова, имеющие одинаковый или похожий Метафон, становятся возможными альтернативными вариантами написания.
  • Поиск функциональные возможности часто используют фонетические алгоритмы для поиска результатов, которые не соответствуют в точности термину (терминам), используемым в поиске. Поиск имен может быть трудным, поскольку часто существует несколько альтернативных вариантов написания имен. Примером может служить название Клэр. У него есть две альтернативы, Clare / Clair, которые произносятся одинаково. Поиск одного написания не даст результатов для двух других. С помощью Soundex все три варианта производят один и тот же код Soundex, C460. При поиске имен на основе кода Soundex будут возвращены все три варианта.

Смотрите также

Рекомендации

  • Эта статья включает материалы общественного достояния отNIST документ:Блэк, Пол Э. "фонетическое кодирование". Словарь алгоритмов и структур данных.

внешняя ссылка