ARPABET - ARPABET

ARPABET (также пишется ARPAbet) представляет собой набор фонетическая транскрипция коды, разработанные Агентство перспективных исследовательских проектов (ARPA) как часть их Исследование понимания речи проект 1970-х гг. Это представляет фонемы и аллофоны из Общий американский английский с различными последовательностями ASCII символы. Две системы, каждая из которых представляет сегмент с одним символом (чередование прописных и строчных букв) и другим с одним или двумя (без учета регистра), последний получил гораздо большее распространение.[1]

ARPABET использовался в нескольких синтезаторы речи, включая Computalker для системы S-100, SAM для Коммодор 64, СКАЖИТЕ за Amiga, TextAssist для ПК и Speakeasy от Intelligent Artefacts, которые использовали Вотракс Микросхема синтезатора речи SC-01. Он также используется в Словарь произношения CMU. Обновленная версия ARPABET используется в ТИМИТ корпус.[1]

Символы

Стресс обозначается цифрой сразу после гласной. Вспомогательные символы идентичны в одно- и двухбуквенных кодах. В двухбуквенном обозначении сегменты разделяются пробелом.

Гласные[2]
ARPABETIPAПримеры)
1 буква2-буквенный
аAAɑбальм, бот
@AEæбат
АAHʌбтытт
cАОɔулоry
WAWаʊбОУт
ИксТОПОРəкомма
Нет данныхAXR[3]ɚлатышэ
YAYаɪбяte
EEHɛбет
рERɝбird
еEYбайт
яIHɪбят
ИксIXɨrosеs, кроликят
яIYябеат
оOWбоат
ОOYɔɪбой
UЭМ-М-Мʊбооk
тыUWтыбоот
Нет данныхUX[3]ʉdтыде
Согласные[2]
ARPABETIPAПример
1 буква2-буквенный
бBббуу
CCHChв
dDddт.е.
DDHðthу
FDXɾбуттэ
LELдноле
MЭМм̩ритмм
NENnзадницана
жFжжправо
граммграммɡграммуу
часHH или же ЧАС[3]часчаскайф
JJHjя
kKkkите
лLллт.е.
мMмму
пNппкайф
граммNX или же NG[3]ŋсинг
Нет данныхNX[3]ɾ̃winnэ
ппппт.е.
QQʔЭм-м-м-ой
ррɹрвы
sSssкайф
SSHʃшу
тТттт.е.
ТTHθthкайф
vVvvт.е.
шWшшise
ЧАСWHʍwhу
уYjуахт
zZzzоо
ZZHʒмольбаsуре
Ударные и вспомогательные символы[2]
ABОписание
0Нет стресса
1Первичный стресс
2Вторичный стресс
3...Третичный и дальнейший стресс
-Тишина
!Неречевой сегмент
+Морфема граница
/Граница слова
#Высказывание граница
:Группа тонов граница
:1 или же .Падение или снижение соединение
:2 или же ?Рост или внутреннее соединение
:3 или же .Падение-подъем или нетерминальное соединение

ТИМИТ

В ТИМИТ, помимо перечисленных выше используются следующие символы:[4]

СимволIPAПримерОписание
AX-Hə̥sтыспектрПосвященный / ə /
BCLобtain[b] закрытие
DCLwidth[d] закрытие
ENGŋ̍СтиркаingтоннаСлоговое письмо [ŋ]
GCLɡ̚делатьграммзуб[ɡ] закрытие
HVɦачасeadОзвучен /час/
KCLделатьcтор[k] закрытие
PCLпприниматьпт[п] закрытие
TCLоктущипнуть[т] закрытие
PAUНет данныхНет данныхПауза
EPIНет данныхНет данныхМимолетная тишина
ЧАС#Нет данныхНет данныхМаркер начала / конца

Смотрите также

Рекомендации

  1. ^ а б Клаутау, Альдебаро (2001). «ARPABET и алфавит TIMIT» (PDF). Архивировано из оригинал (PDF) 3 июня 2016 г.. Получено 8 сентября, 2017.
  2. ^ а б c Райс, Ллойд (апрель 1976 г.). «Аппаратное и программное обеспечение для синтеза речи». Журнал доктора Добба по компьютерной гимнастике и ортодонтии. 1 (4): 6–8.
  3. ^ а б c d е Юрафски, Даниэль; Мартин, Джеймс Х. (2000). Обработка речи и языка: введение в обработку естественного языка, компьютерную лингвистику и распознавание речи. Прентис Холл. С. 94–5. ISBN  0-1309-5069-6.
  4. ^ «Таблица всех фонематических и фонетических символов, используемых в лексиконе TIMIT». Консорциум лингвистических данных. 12 октября 1990 г.. Получено 8 сентября, 2017.

внешняя ссылка