Романизация армянского - Romanization of Armenian

Существуют различные системы романизация из Армянский алфавит.

Системы транслитерации

Hübschmann-Meillet (1913)

В лингвистической литературе по классическому армянскому языку обычно используется транслитерация это работа Хюбшмана-Мейе (1913). Он использует комбинирование точка выше отметьте U + 0307, ​​чтобы выразить стремление, ṫ, cḣ, č̇, ṗ, k̇. Некоторые документы были опубликованы с использованием аналогичной латыни. дасия диакритический знак U + 0314, перевернутая запятая над буквой, которую легче различить визуально в t̔, ch̔, č̔, p̔, k.

Однако правильная поддержка этих комбинированных диакритических знаков долгое время была плохой в прошлом и не была очень распространена во многих обычных приложениях, компьютерных шрифтах или системах рендеринга, поэтому некоторые документы были опубликованы с использованием в качестве возможных резервных вариантов их вариантов интервалов, таких как буква-модификатор точка над буквой ˙ U + 02D9, написанная после буквы, а не над ней, или перевернутая запятая ʻU + 02BB, написанная после буквы, а не над ней - или иногда пробел греческого spiritus asper ῾ U + 1FFE, или интервал серьезный акцент ˋ U + 02CB, даже если он слишком плоский, или даже обратная кавычка ASCII `U + 0060, или апостроф-кавычка ASCII 'U + 0027, когда путаницы не было.

Но сегодня предпочтительным символом является буква-модификатор левого полукольца ʿ U + 02BF, или буква-модификатор ʻU + 02BB или ʽ U + 02BD, что является вариантом интервала между дасия диакритический знак (это также исторически правильная адаптация к латинскому письму греческого Spiritus Asper, видеть грубое дыхание ) с тем преимуществом, что имеет отличную поддержку многих латинских шрифтов, потому что это также простой перевернутый.

Также не были решены некоторые двусмысленности при работе с современным армянским языком, который имеет два диалекта, причем оба используют две возможные орфографии (кроме того, в современных публикациях для классического армянского языка используется современная орфография).

BGN / PCGN (1981)

Латинизация BGN / PCGN (1981) использует правая одинарная кавычка выразить стремление, t ’, ch’, ts ’, p’, k ’, противоположность оригиналу грубое дыхание диакритический.[1]

Эта латинизация была принята ISO (1996) и считается устаревшей. Эта система является свободной транскрипцией и необратима (без использования словарного поиска), особенно для отдельных армянских букв, латинизированных в диграфы. (эти необратимые или неоднозначные латинизации показаны в красной ячейке в таблице ниже).

Некоторые армянские буквы имеют несколько латинизации в зависимости от контекста:

  • армянская гласная буква Ե / ե должна быть латинизирована как вы сначала или после гласных символов Ե / ե, Է / է, Ը / ը, Ի / ի, Ո / ո, ՈՒ / ու и Օ / օ; во всех остальных случаях его следует романизировать как е;
  • армянская гласная буква Ո / ո должна быть латинизирована как vo изначально, за исключением слова եո, где оно должно быть латинизировано как ов; во всех остальных случаях его следует романизировать как о;
  • армянская согласная буква Վ / վ должна быть латинизирована yev первоначально, изолированно или после гласных символов Ե / ե, Է / է, Ը / ը, Ի / ի, Ո / ո, ՈՒ / ու и Օ / օ; во всех остальных случаях его следует романизировать как ev.

ISO 9985 (1996)

ISO 9985 (1996) - международный стандарт транслитерации современного армянского алфавита. Как и в случае латинизации BGN / PCGN, правая одинарная кавычка используется для обозначения большинства аспиратов.

Эта система обратима, потому что она избегает использования диграфов и возвращается к Hübschmann-Meillet (однако некоторые диакритические знаки для гласных также изменены).

Серия аспиратов не рассматривается последовательно в ISO 9985: в то время как pʼ, tʼ, cʼ, kʼ латинизированы знаком апострофа, с придыханием չ č нет, и вместо этого транскрибируется его безнаддувный аналог ճ č с андердотом, который больше нигде в системе не появляется. Обратите внимание, что на этой схеме č (означающее ides) противоречит транслитерации Хюбшмана-Мейе (где это означает ճ).

Эта система рекомендуется для международного обмена библиографическими текстами (она также является базой для упрощенных латинизаций, найденных для локализации армянской топономии транслитерации человеческих имен), где она очень хорошо работает с общими ИСО / МЭК 8859-2 Латинская кодировка используется в Центральной Европе.

ALA-LC (1997)

Романизация ALA-LC (1997) в значительной степени совместим с BGN / PCGN, но возвращается к сцеживанию аспиратов с левая одинарная кавычка (на самом деле буква-модификатор левое полукольцо ʿ U + 02BF, шестнадцатеричный код US-MARC B0, который также используется для обозначения айин на арабском языке, поэтому некоторые документы могут содержать либо предпочтительное левое полукольцо, либо иногда обратную кавычку ASCII `U + 0060).

Этот стандарт изменяет схему транслитерации, используемую между классическим / восточноармянским и западноармянским языками для армянских согласных звуков, представленных заменой пар б против. п, грамм против. k, d против. т, дз против. ts и ch против. j.

Во всех случаях и чтобы сделать эту латинизацию менее двусмысленной и обратимой,

  • мягкий знак (штрих, шестнадцатеричный код US-MARC A7) вставляется между двумя отдельными буквами, которые в противном случае интерпретировались бы как орграф (красным в таблице ниже); в романизированных орграфах нет штриха ж, кх, ts, дз, gh и ch представляющий одну армянскую букву;
  • только в классической армянской орфографии гласная, представленная е будет представлен у вместо этого, когда он стоит в начальной позиции имени и за ним следует другая гласная; эта трудность исчезла в современном армянском языке с реформированной орфографией, которая изменила исходное армянское письмо в этом случае;
  • только в классической армянской орфографии гласная, представленная у будет представлен час вместо этого, когда он стоит в начальной позиции слова или радикала в составном слове; эта трудность исчезла в современном армянском языке с реформированной орфографией, которая изменила исходное армянское письмо в этом случае.

Методы ввода только в формате ASCII

На различных армянских сайтах появились нестандартные транслитераторы, позволяющие вводить современный западноармянский или восточноармянский текст, используя только символы ASCII. Это неправильный транслитератор, но он может быть удобен для пользователей, у которых нет армянской клавиатуры.

Несмотря на то, что эти методы ввода широко используются, они не подчиняются каким-либо утвержденным международным или армянским стандартам, поэтому не рекомендуются для латинизации армянского языка. Обратите внимание, что методы ввода распознают латинские диграфы. zh, dz, gh, tw, sh, vo, ch, rr для классического или восточноармянского языка, и zh, dz, tz, gh, vo, ch, rr для западноармянского языка, но не предлагают способа устранения неоднозначности слов, в которых не должны распознаваться диграфы.

Некоторые армянские буквы вводятся как латинские диграфы, за ними также может следовать одинарная кавычка ASCII (которая действует как единственный распознаваемый буквенный модификатор), но эта цитата не всегда означает, что предполагаемая армянская буква должна быть с придыханием (это может быть обратным для ввода ch '), он также используется как модификатор гласной. Из-за неоднозначности тексты необходимо исправлять, вводя промежуточный фиктивный символ перед вводом второй латинской буквы или кавычки, а затем удаляя фиктивный символ, чтобы автоматический преобразователь ввода сохранял различимость армянских букв.

Таблицы транслитерации

Некоторые армянские буквы имеют очень разные фонетические звуки между классическим или восточноармянским и западноармянским, поэтому использование армянских букв в двух подветвях языка различно.

Это видно в таблице ниже, раскрашивая транслитерации, характерные для классического или восточноармянского языка, на зеленом фоне, а транслитерации для западноармянского языка - на синем. Остальные буквы транслитерируются независимо от языковой ветви. Тем не менее, ячейки с красным фоном содержат транслитерации, которые зависят от контекста (и могут в некоторых случаях создавать двусмысленность, только романизации ISO 9985 и Hübschmann-Meillet не используют никаких контекстно-зависимых неоднозначных диграфов для транскрибирования простых армянских букв, которые не являются лигатурами, но первый несовместим с его представлением придыхательных согласных и несовместим со всеми другими системами для пары букв).

Армянская письменностькапиталԱԲԳԴԵԶԷԸԹԺԻԼԽԾԿՀՁՂՃՄ
053105320533053405350536053705380539053A053B053C053D053E053F05400541054205430544
крошечныйաբգդեզէըթժիլխծկհձղճմ
056105620563056405650566056705680569056A057B056C056D056E057F05700571057205730574
Романизация классического или восточноармянского языкаASCII Входабграммdеzе 'y 'т 'жялИксc 'kчасдзghtwм
Hübschmann-Meilletêət̔, ṫžcjłč
ISO 9985ēëт 'çграммč
BGN / PCGNглазеужкхtsдзghch
ALA-LCе, уēětʿ
Романизация западноармянского языкаALA-LCпkтдзграммtsj
ASCII Входее 'ут 'Иксtz
 
Армянская письменностькапиталՅՆՇՈՉՊՋՌՍՎՏՐՑՒՓՔՕՖՈՒ 
05450546054705480549054A054B054C054D054E054F05500551055205530554055505560548
0552
крошечныйյնշոչպջռսվտրցւփքօֆուև (եւ)
05750576057705780579057A057B057C057D057E057F05800581058205830584058505860578
0582
0587
Романизация классического или восточноармянского языкаASCII Входупшvochпjrrsvтрcшп'k ', qожтыev
Hübschmann-Meilletšоč̔, č̇ǰрc̔, ċp̔, ṗk̔, kô
ISO 9985čрc ’п'k ’òойфу
BGN / PCGNшо, воch ’jrrts ’отыев, ев
ALA-LCг, чочʿрtsʿпkʿōфу, ев
Романизация западноармянского языкаALA-LCбchd
ASCII Входчас'vochch 'rrcп'k ', qоev

Обратите внимание, что в приведенной выше таблице последние два столбца относятся к орграфам, а не к отдельным буквам (однако они считаются буквами в реформатской орфографии). Однако последний столбец отображает лигатуру, которая используется в классической орфографии только как отдельный символ для короткого армянского слова. фу (смысл и) и его производные аналогично амперсанду (&) в латинском шрифте (в реформатской орфографии он также используется в середине и конце слов вместо եվ); та же транслитерация на фу (классический армянский) или ev (реформированная орфография) будет использоваться для букв, которые представляет эта лигатура, когда они используются в качестве диграфов: она использовалась для обозначения ш согласный, теперь он относится к v согласный звук.

Армянский сценарий также использует некоторые другие диграфы, которые часто записываются как необязательные лигатуры, только в нижнем регистре (пять из них закодированы в Unicode только для полной двусторонней совместимости с некоторыми устаревшими кодировками); если они присутствуют, эти лигатуры (которые являются чисто типографскими и не имеют семантических различий в обычных армянских текстах) должны быть латинизированы путем разложения составляющих их букв.

Смотрите также

Рекомендации

  • Антуан Мейе и Генрих Хюбшманн, Altarmenisches Elementarbuch, Гейдельберг, 1913 г. (2-е издание, 1980 г.).

внешняя ссылка

  • Конвертер армянской транслитерации Поддерживает восточное и западное произношение армянского языка, включает проверку орфографии.
  • Транслитерация армянского Томас Т. Педерсен, в KNAB (Kohanimeandmebaas, База данных географических названий) Eesti Keele Instituut (Институт эстонского языка).
  • Готовый макрос для Visual Basic в текстовом редакторе Microsoft Word, позволяющий автоматически заменять армянские буквы на латинские, используя опцию Универсальный выше для восточно-армянского языка.