База данных неродной речи - Non-native speech database
А база данных неродной речи это речевая база данных из неродное произношение английского языка. Такие базы данных необходимы для постоянного развития многоязычных автоматических распознавание речи системы, текст в речь системы, тренажеры произношения или даже полнофункциональные системы изучения второго языка. Однако из-за сравнительно небольшого размера баз данных многие из них недоступны через обычных распространителей речевых баз данных. Это приводит к тому, что исследователям в области распознавания речи трудно следить за тем, какие базы данных уже собраны, а для каких целей еще нет коллекций.[1]
Легенда
В таблице неродных баз данных используются сокращения названий языков. Они перечислены в Таблице 1. Таблица 2 дает следующую информацию о каждом корпусе: название корпуса, учреждение, в котором можно получить корпус, или, по крайней мере, должна быть доступна дополнительная информация, язык, на котором фактически говорили носители. , количество носителей, родной язык носителей, общее количество неродных высказываний, содержащихся в корпусе, продолжительность в часах неродной части, дата первой публичной ссылки на этот корпус, некоторый произвольный текст выделение особых аспектов этой базы данных и ссылка на другую публикацию. Ссылка в последнем поле в большинстве случаев относится к статье, специально посвященной описанию этого корпуса первоначальными коллекционерами. В некоторых случаях идентифицировать такую бумагу не удавалось. В этих случаях делается ссылка на статью, в которой используется этот корпус.
Некоторые записи оставлены пустыми, а другие помечены как неизвестные. Разница здесь в том, что пустые записи относятся к атрибутам, значение которых просто неизвестно. Однако неизвестные записи указывают на то, что в самой базе данных нет информации об этом атрибуте. Например, в базе данных погоды Юпитера[2] никаких сведений о происхождении динамиков не приводится. Поэтому эти данные будут менее полезны для проверки обнаружения акцента или аналогичных проблем.
По возможности, имя является стандартным именем корпуса, однако для некоторых меньших корпусов не существовало установленного имени, и, следовательно, необходимо было создать идентификатор. В таких случаях используется комбинация учреждения и сборщика базы данных.
В случае, когда базы данных содержат родную и неродную речь, перечисляются только атрибуты неродной части корпуса. Большинство корпусов представляют собой сборники прочитанной речи. Если корпус вместо этого состоит частично или полностью из спонтанных высказываний, это указывается в столбце «Особые».
Обзор неродных баз данных
|
Фактическая таблица с информацией о различных базах данных показана в таблице 2.
|
Рекомендации
- ^ М. Рааб, Р. Грун и Э. Нут, Базы данных неродной речи, в Proc. ASRU, Киото, Япония, 2007.
- ^ К. Ливеску, Анализ и моделирование неродной речи для автоматического распознавания речи, РС. диссертация, Массачусетский технологический институт, Кембридж, Массачусетс, 1999.
- ^ Проект AMI, "AMI Meeting Corpus" [1].
- ^ Р. Грун, Т. Чинкарек и С. Накамура, «База данных нематериального английского языка с несколькими акцентами», в ASJ, 2004.
- ^ Университет Мюнхена, «Баварский архив речевых сигналов странного корпуса», [2].
- ^ Джурафски и др., "Ресторанный проект Беркли", Proc. ICSLP 1994.
- ^ Л. Томокиё, Распознавание неродной речи: характеристика неродной речи и адаптация к ней при распознавании речи, Кандидат наук. Диссертация, Университет Карнеги-Меллона, Пенсильвания, 2001.
- ^ С. Витт, Использование распознавания речи в компьютерном обучении языку, Кандидат наук. дипломная работа, инженерный факультет Кембриджского университета, Великобритания, 1999 г.
- ^ Х. Е и С. Янг, Повышение эффективности распознавания речи новичков в разговорной речи при изучении языка, в Proc. Interspeech, Лиссабон, Португалия, 2005 г.
- ^ Л. Томокиё, Распознавание неродной речи: характеристика неродной речи и адаптация к ней при распознавании речи, Кандидат наук. диссертация, Университет Карнеги-Меллона, Пенсильвания, 2001.
- ^ Т. П. Тан и Л. Безасье, Корпус французского языка для автоматического распознавания речи, в LREC, Генуя, Италия, 2006.
- ^ Т. Ландер, CSLU: Версия 1.2 на английском языке с иностранным акцентом, Тех. Респ., LDC, Филадельфия, Пенсильвания, 2007.
- ^ З. Ван, Т. Шульц и А. Вайбель, Сравнение методов адаптации акустической модели на неродной речи, в Proc. ICASSP, 2003.
- ^ С. Шаден, Regelbasierte Modellierung fremdsprachlich akzentbehafteter Aussprachevarianten, Кандидат наук. диссертация, Университет Дуйсбург-Эссен, 2006.
- ^ Л. М. Арслан и Дж. Х. Хансен, Частотные характеристики иноязычной акцентированной речи, в Proc. из ICASSP, Мюнхен, Германия, 1997, стр. 1123-1126.
- ^ N. Minematsu et al., Разработка базы данных англоязычной речи японцев для поддержки исследований CALL, ICA, Киото, Япония, 2004 г., стр. 577-560.
- ^ Кристофер Сиери, Дэвид Миллер, Кевин Уокер, Корпус Fisher: ресурс для следующих поколений преобразования речи в текст, Proc. LREC 2004
- ^ С. Фитт, Произношение незнакомых названий родных и чужих городов, в Proc. of Eurospeech, 1995, стр. 2227-2230.
- ^ Г. Штеммер, Э. Ноэт и Х. Ниманн, Акустическое моделирование иностранных слов в системе распознавания немецкой речи, в Proc. Eurospeech, П. Далсгаард, Б. Линдберг и Х. Беннер, ред., 2001, т. 4. С. 2745-2748.
- ^ В. Бирн, Э. Кнодт, С. Худанпур и Дж. Бернштейн, Готово ли автоматическое распознавание речи для неродной речи? Сбор данных и первые эксперименты по моделированию разговорного латиноамериканского английского, в STiLL, Мархольмен, Швеция, 1998, стр. 37-40.
- ^ Ю. Ли, П. Фунг, П. Сюй и Ю. Лю, Асимметричное акустическое моделирование для распознавания смешанной речи, в ICASSP, Прага, Чехия, 2011 г., стр. 37-40.
- ^ В. Фишер, Э. Янке и С. Кунцманн, Недавний прогресс в декодировании неродной речи с помощью многоязычных акустических моделей, в Proc. Eurospeech, 2003, стр. 3105-3108.
- ^ Нэнси Ф. Чен, Ронг Тонг, Даррен Ви, Пейсуан Ли, Бин Ма, Хайчжоу Ли, Корпус iCALL: мандаринский диалект, на котором говорят лица европейского происхождения, не являющиеся носителями языка, в Proc. компании Interspeech, 2015.
- ^ Нэнси Ф. Чен, Виваек Шивакумар, Махеш Харикумар, Бин Ма, Хайчжоу Ли. Широкомасштабная характеристика ошибок произношения мандаринского языка, совершаемых носителями европейских языков, в Proc. Интерспич, 2013.
- ^ У. Мензель, Э. Этвелл, П. Бонавентура, Д. Херрон, П. Ховарт, Р. Мортон и К. Саутер, Корпус ISLE разговорного английского языка, в LREC, Афины, Греция, 2000, стр. 957-963.
- ^ К. Ливеску, Анализ и моделирование неродной речи для автоматического распознавания речи, РС. диссертация, Массачусетский технологический институт, Кембридж, Массачусетс, 1999.
- ^ S-C. Ри и С.Х. Ли и С.К. Канг и И-Дж. Ли, Разработка и создание корпуса корейскоязычного английского языка (K-SEC), Proc. ICSLP 2004
- ^ Л. Томокиё, Распознавание неродной речи: характеристика неродной речи и адаптация к ней при распознавании речи, Кандидат наук. Диссертация, Университет Карнеги-Меллона, Пенсильвания, 2001.
- ^ Гут, У., Неродная речь. Анализ фонологических и фонетических свойств английского и немецкого языков L2 на основе корпуса, Франкфурт-на-Майне: Питер Ланг, 2009.
- ^ TNO Научно-исследовательский институт человеческого фактора, Многоязычная совместимость Mist в базе данных речевых технологий, Тех. Респ., ELRA, Париж, Франция, 2007 г., каталожный номер ELRA S0238.
- ^ J.C. Segura et al., База данных HIWIRE, шумный и неродной английский речевой корпус для общения в кабине., 2007, [3].
- ^ С. Пиджен, В. Шен и Д. ван Левен, Разработка и описание чужой базы данных военной связи воздушного движения, в ICSLP, Антверпен, Бельгия, 2007.
- ^ Л. Бенарусс и др., Корпус натовской и неродной речи (n4), в Proc. семинара MIST (ESCA-NATO), Леусден, сентябрь 1999 г.
- ^ Консорциум Onomastica, Лексика межъязыкового произношения ONOMASTICA, в Proc. Eurospeech, Мадрид, Испания, 1995, стр. 829-832.
- ^ К. Хакер, Т. Чинкарек, А. Майер, А. Хесслер и Э. Нут, Усиление просодических и произношений для выявления неправильного произношения детей неродного происхождения, в Proc. ICASSP, Гонолулу, Гавай, 2007, стр. 197-200.
- ^ К. Тейшейра, И. Транкозу и А. Серральхейро, Распознавание неродных акцентов, в Proc. Eurospeech, Родос, Греция, 1997 г., стр. 2375-2378.
- ^ Х. Хеувел, К. Чукри, К. Голлан, А. Морено и Д. Мостефа, TC-STAR: новые языковые ресурсы для ASR и SLT, в LREC, Генуя, 2006, стр. 2570-2573.
- ^ Л. Ф. Ламель, Ф. Шиль, А. Фурсен, Дж. Мариани и Х. Тильман, Англоязычная база данных TED, в ICSLP, Иокогама, Япония, сентябрь 1994 г.
- ^ Н. Моте, Л. Джонсон, А. Сетхи, Дж. Сильва и С. Нараянан, Обнаружение тактического языка и моделирование речевых ошибок учащихся: пример обучения тактическому языку арабскому языку для носителей американского английского, в Proc. ИнСТИЛ, июнь 2004 г.
- ^ К. Нишина, Разработка базы данных японской речи, прочитанной не носителями языка, для построения системы CALLв ICA, Киото, Япония, 2004 г., стр. 561-564.
- ^ Университет Мюнхена, Проект Вербмобиль, [4].
- ^ И. Транкозу, К. Виана, И. Маскареньяс и К. Тейшейра, О выводе правил для естественного произношения в навигационных запросах, в Proc. Eurospeech, 1999.
- ^ А. ЛаРокка и Р. Чуайри, Корпус арабской речи вест-пойнт, Тех. Респ., LDC, Филадельфия, Пенсильвания, 2002.
- ^ А. ЛаРокка и К. Томей, Корпус русской речи вест пойнт, Тех. Респ., LDC, Филадельфия, Пенсильвания, 2003 г.
- ^ Дж. Морган, Вест-пойнт героическая испанская речь, Тех. Респ., LDC, Филадельфия, Пенсильвания, 2006 г.
- ^ И. Амдал, Ф. Коркмазский, А. К. Сурендран, Совместное моделирование произношения не носителей языка с использованием методов на основе данных, в ICSLP, Пекин, Китай, 2000, стр. 622-625.