Орфография хиндустани - Hindustani orthography

Хиндустани (стандартизированный хинди и стандартизированные Урду ) был написан на нескольких разных скриптах. Большинство текстов на хинди написано на Сценарий деванагари, который получается из Брахманское письмо из Древняя Индия. Большинство текстов на урду написано на Урду алфавит, который исходит из Персидский алфавит. Оба сценария написаны на хиндустани. В последние годы Латинский шрифт был использован в этих языках по технологическим причинам или причинам интернационализации. Исторически, Кайтхи сценарий также использовался.

Сценарий деванагари

Сценарий Деванагари - это Abugida, так как письменным согласным присуща гласная, которая на стандартном хинди Schwa. В определенных контекстах, например, в конце слова, нет гласной, это явление называется шва синкопе.[1] Остальные гласные пишутся с диакритическим знаком на согласной букве. Деванагари пишется слева направо, причем верхняя полоса соединяет буквы вместе.

əаːɪяʊuɛːɔː
ख़ग़
kИксɡɣɡʱŋ
ज़झ़
t͡ʃt͡ʃʰd͡ʒzd͡ʒʱʒп
ड़ढ़
ʈʈʰɖɽɖʱɽʱɳ
t̪ʰd̪ʱп
फ़
ппжбм
jрлʋʃʂsɦ

Неправильные лигатуры:

Удаление Schwa

Шва (अ или «ə», иногда пишется как «а»), подразумеваемое в каждом согласном письме Деванагри, «обязательно удаляется» на хинди в конце слов и в некоторых других контекстах.[2] Это явление получило название "Правило обморока Schwa" или "правило удаления schwa"хинди.[1][2] Одна формализация этого правила была резюмирована как ə -> ø | VC_CV. Другими словами, когда за согласным, которому предшествуют гласные, следует согласный звук после гласных, шва, присущая первому согласному звуку, удаляется.[1][3] Однако эта формализация является неточной и неполной (т.е. иногда удаляет schwa, когда она не должна, или, в других случаях, не может удалить ее, когда это необходимо), и может привести к ошибкам. Удаление Schwa важно с вычислительной точки зрения, потому что оно необходимо для построения текст в речь программное обеспечение для хинди.[3][4]

В результате обморока шва правильное произношение многих слов на хинди отличается от того, что ожидается от буквального перевода деванагари. Например, राम - это Баран (неверно: Рама), रचना есть Рахна (неверно: Рачана), वेद есть Véd (неверно: Véda) и नमकीन есть Намкин (неверный Намакина).[3][4]

Персидский шрифт

Алфавит урду основан на Персидский, что является Арабский алфавит. Урду пишется справа налево, и большинство букв связаны друг с другом. Это приводит к вариациям формы буквы в зависимости от ее положения в слове. Наиболее гласные опущены в общих текстах, хотя они могут быть написаны для устранения неоднозначности или в педагогических целях. Урду в основном пишется на каллиграфический стиль сценария называется Насталик.

ПисьмоНасталикНазвание письмаТранскрипцияIPA
ا ا алиф--
ب ب бытьб/ b /
پ پ peп/п/
ت ت teт/ t̪ /
ٹ ٹ ṭe/ ʈ /
ث ث ses/ с /
ج ج Джимj/ d͡ʒ /
چ چ чеch/ t͡ʃ /
ح ح бани ончас/час/
خ خ кхекх/Икс/
د د dāld/ d̪ /
ڈ ڈ āl/ ɖ /
ذ ذ залdh/ z /
ر ر повторнор/р/
ڑ ڑ ṛeр/ ɽ /
ز ز зеz/ z /
ژ ژ чжеж/ ʒ /
س س синs/ с /
ش ش шинш/ ʃ /
ص ص суад/ с /
ض ض зуад/ z /
ط ط палецт/ т /
ظ ظ Zo'e/ z /
ع ع ‘Ain'/ ʔ / [5]
غ غ Ghaingh/ ɣ /
ف ف feж/ f /
ق ق кафq/ q /
ک ک кафk/ k /
گ گ gāfграмм/ ɡ /
ل ل Ламл/ л /
م م мимм/ м /
ن ن нунп/ п /
و و ва'оv, o или ū/ ʋ /, / oː /, / ɔ / или же / uː /
ہ, ﮩ, ﮨ ہ Choṭī ончас/час/
ھ ھ делать chashmī ончас/ ʰ /
ء ء хамза'/ ʔ /[нужна цитата ]
ی ی выу, я/ j / или же /я/
ے ے Бари Йеai или e/ ɛː /, или же / eː /

Латинский алфавит

В Латинский алфавит использовался для написания хиндустани по технологическим причинам или по причинам интернационализации. Роман хинди и Римский урду использует основной латинский алфавит. Чаще всего он используется молодыми носителями языка для технологических приложений, таких как чат, электронные письма и SMS.

ITRANS, ISCII, IAST (и почти идентичный ISO 15919 ), и Гарвард-Киото Схемы латинизации использовались в первую очередь для людей, для которых английский язык не является родным и которые более знакомы с латинским алфавитом.

Транслитерация

Транслитерация между тремя шрифтами может быть сложной, особенно при транслитерации между деванагари и персидским шрифтом.[6] Одним из препятствий для этого является то, что несколько разных букв в одном сценарии часто соответствуют одной и той же букве в другом сценарии.[6] Таким образом, простая замена часто не дает правильного написания.

Буквы урду с похожими звуками

Некоторые наборы букв урду имеют одинаковые звуки.[6][7]

  • 4 буквы ز ذ ض ظ все ≈ Z [6][7]
  • 3 буквы س ص ث все ≈ S [6][7]
  • 2 буквы ت ط оба ≈ T [6][7] (третье письмо ٹ также часто обозначается английской буквой T, но отличается от двух других букв урду, см. # ретрофлексные согласные ниже.)
  • 2 буквы ہ ح оба ≈ H [7] но иногда рассматриваются как отдельные.

Шрифт Брайля

Используются три алфавита Брайля: хинди и Урду шрифт Брайля в Индии на основе Бхарати Брайля условности и Урду Брайля в Пакистане, на основе Персидский шрифт Брайля условности. Хинди Брайль - это алфавит с а не пишется в некоторых средах, в то время как для урду Брайля в Пакистане, кажется, что гласные могут быть необязательными, поскольку они печатаются.

Смотрите также

Рекомендации

  1. ^ а б c Тедж К. Бхатия (1987), История грамматической традиции хинди: грамматика хинди-хиндустани, грамматики, история и проблемы, БРИЛЛ, ISBN  90-04-07924-6, ... Литература на хинди не может служить надежным индикатором фактического произношения, потому что она написана письмом деванагари ... правилом обморока шва, которое действует на хинди ...
  2. ^ а б Ларри М. Хайман; Виктория Фромкина; Чарльз Н. Ли (1988 (том 1988, часть 2)), Язык, речь и разум, Тейлор и Фрэнсис, ISBN  0-415-00311-3, ... Неявное / a / не читается, когда символ появляется в конце слова или в некоторых других контекстах, где он обязательно удаляется (с помощью так называемого правила удаления шва, которое играет решающую роль в фонологии слов на хинди. .. Проверить значения даты в: | дата = (помощь)
  3. ^ а б c Моноджит Чоудхури; Анупам Басу; Судешна Саркар (июль 2004 г.), "Диахронический подход к удалению Schwa в индоарийских языках" (PDF), Материалы семинара специальной группы ACL по компьютерной фонологии (SIGPHON), Ассоциация компьютерной лингвистики, ... Удаление schwa - важная проблема для преобразования IAL из графемы в фонему, что, в свою очередь, необходимо для хорошего синтезатора текста в речь ...
  4. ^ а б Наим Р. Тайсон; Ила Нагар (2009 (12: 15-25)), «Просодические правила для удаления шва в синтезе текста в речь на хинди», Международный журнал речевых технологий, 12: 15–25, Дои:10.1007 / s10772-009-9040-х, ... Без соответствующего удаления schwas любой речевой вывод звучал бы неестественно. Поскольку орфографическое представление деванагари дает мало указаний на сайты удаления, современные системы TTS для хинди реализовали правила удаления шва на основе сегментарного контекста, в котором появляется шва ... Проверить значения даты в: | дата = (помощь)
  5. ^ "Фонетический инвентарь урду" (PDF). www.cle.org.pk. Центр языковой инженерии. Получено 19 мая 2020.
  6. ^ а б c d е ж Джавайд, Бушра; Ахмед, Тафсир (2009). «Преобразование хинди в урду: помимо простой транслитерации» (PDF). Материалы конференции по языкам и технологиям 2009 г.. Получено 19 мая 2020.
  7. ^ а б c d е Bhatia, Tej K .; Хоул, Ашок; Коул, Ашок (27 августа 2015 г.). «Разговорный урду: полный курс для начинающих». Рутледж. Получено 19 мая 2020.