Cambridge English Corpus - Cambridge English Corpus

Кембриджский корпус английского языка (ранее Cambridge International Corpus) - это многомиллиардный свод слов английский язык (содержащий как текстовый корпус и устные данные корпуса). Cambridge English Corpus (CEC) содержит данные из ряда источников, включая письменный и устный, британский и американский английский. CEC также содержит Cambridge Learner Corpus, корпус из 40 миллионов слов, составленный из ответов на экзамены по английскому, написанных изучающими английский язык.

Cambridge English Corpus используется для информирования Cambridge University Press Преподавание английского языка публикаций, а также для исследований в корпусная лингвистика. Доступ в настоящее время ограничен авторами и исследователями, работающими над проектами и публикациями для Издательство Кембриджского университета, и исследователи из Кембриджский экзамен по английскому языку.[1]

Письменные данные

Cambridge English Corpus содержит образцы современного письменного английского языка, взятые из газет, журналов, романов, писем, электронных писем, учебников, веб-сайтов и многих других источников.

Разговорные данные

Cambridge English Corpus содержит широкий спектр разговорного английского языка, взятый из множества источников, включая повседневные разговоры, телефонные звонки, радиопередачи, презентации, выступления, встречи, телепрограммы и лекции.

Cambridge Learner Corpus

Cambridge Learner Corpus (CLC) - это собрание сценариев экзаменов, написанных студентами, изучающими английский язык, созданных в сотрудничестве с Cambridge English Language Assessment. CLC содержит сценарии более 180 000 студентов из примерно 200 стран, говорящих на 138 разных языках. первые языки и все время растет.[2] В настоящее время включены следующие экзамены:

Уникальной особенностью Cambridge Learner Corpus является его система кодирования ошибок. Специалисты по языкам выявляют и комментируют ошибки в сценариях экзамена. Это означает, что Корпус можно использовать для выяснения частоты различных типов ошибок, контекстов, в которых они совершаются, и групп учащихся, которые считают определенные языковые области трудными.[3]

Авторы Кембриджа Преподавание английского языка ресурсы могут использовать эту информацию для выявления распространенных ошибок - например, Cambridge Advanced Learner’s Dictionary содержит функции «Распространенные ошибки», которые выделяют частые ошибки учащихся.

И наоборот, система кодирования ошибок также показывает, чего студенты могут достичь на каждом уровне. Это центральное место в работе Английский Профиль, совместная программа для улучшения изучения, преподавания и оценки английского языка во всем мире.[4] Партнерами-учредителями являются Издательство Кембриджского университета, Кембриджский экзамен по английскому языку, то Кембриджский университет, то Университет Бедфордшира, то британский совет и английский Великобритания.[5] Цель проекта - описать, что учащиеся знают и могут делать на английском языке на каждом уровне Общеевропейские компетенции (CEFR).[6]

Специализированные корпуса

Cambridge English Corpus состоит из ряда специализированных корпусов:

Кембриджский корпус делового английского

Cambridge Business English Corpus - это большая коллекция британского и американского делового языка, включая отчеты и документы, книги, касающиеся различных аспектов бизнеса, а также бизнес-разделы из многих национальных газет.

Корпус Cambridge Business English Corpus также включает Корпус разговорного делового английского в Кембридже и Ноттингеме (CANBEC), результат совместного проекта Издательство Кембриджского университета и Ноттингемский университет. Это собрание записей на английском языке от компаний любого размера, от крупных транснациональных компаний до небольших партнерств. Он содержит официальные и неформальные встречи, презентации, телефонные разговоры, разговоры в обеденное время и разговорный язык из других деловых ситуаций.

Кембриджский корпус юридического английского языка

Cambridge Legal English Corpus содержит книги, журналы и газетные статьи, относящиеся к праву и судебным процессам.

Cambridge Financial English Corpus

Корпус Cambridge Financial English Corpus содержит тексты по экономике и финансам, включая ведущие финансовые журналы и газеты.

Кембриджский академический английский корпус

Корпус Cambridge Academic English Corpus содержит письменный и устный академический язык для студентов и аспирантов из ряда учреждений США и Великобритании, включая лекции, семинары, студенческие презентации, журналы, эссе и учебники.

CANCODE

Кембриджский и Ноттингемский корпус дискурса на английском языке (CANCODE) - это собрание разговорной речи на английском языке, записанное в сотнях мест на Британских островах в самых разных ситуациях (например, случайный разговор, общение, поиск информации и обсуждения). Корпус CANCODE является результатом совместного проекта между Издательство Кембриджского университета и Ноттингемский университет.

В корпусе CANCODE около пяти миллионов слов, и это очень богатый ресурс для исследователей разговорного английского языка. Однако у данных есть некоторые ограничения. Большинство людей знали, что их записывают, и болтают в неформальной обстановке, например, отдыхая дома с другими людьми с довольно равным социальным статусом. Это означает, что взаимодействия, как правило, носят согласованный и совместный характер, поэтому в корпусе есть минимальные доказательства конфликта или враждебных обменов.[7]

Кембриджско-Корнельский корпус разговорного североамериканского английского

Cambridge University Press / Cornell Corpus - это большая коллекция неформальных, интерактивных, многосторонних бесед между семьей / друзьями в Северной Америке. Корпус Cambridge-Cornell является результатом совместного проекта между Издательство Кембриджского университета и Корнелл Университет.

КАМСНА

Кембриджский корпус разговорного североамериканского английского (CAMSNAE) - это большая коллекция разговорного американского английского. Он включает в себя записи людей, занимающихся повседневной жизнью - на работе, дома со своими семьями, ходя по магазинам, обедая и т.

Смотрите также

Рекомендации

  1. ^ Кембриджский международный корпус, http://www.cambridge.org/us/esl/catalog/subject/custom/item3637700/Cambridge-International-Corpus-Cambridge-International-Corpus/?site_locale=en_US
  2. ^ Cambridge Learner Corpus, http://www.cambridge.org/us/esl/catalog/subject/custom/item3646603/Cambridge-International-Corpus-Cambridge-Learner-Corpus/?site_locale=en_US
  3. ^ Дайан Николлс, http://ucrel.lancs.ac.uk/publications/CL2003/papers/nicholls.pdf
  4. ^ Английский профиль проект, http://www.englishprofile.org/index.php?option=com_content&view=article&id=11&Itemid=2 В архиве 2011-09-14 на Wayback Machine
  5. ^ Английский профиль, http://www.englishprofile.org/index.php?option=com_content&view=article&id=24&Itemid=22 В архиве 2011-05-07 на Wayback Machine
  6. ^ Совет Европы, уровни CEFR,«Архивная копия». Архивировано из оригинал на 2009-10-30. Получено 2009-11-05.CS1 maint: заархивированная копия как заголовок (связь)
  7. ^ Картер (2004) Язык и творчество: искусство общего разговора. Лондон: Рутледж.

внешняя ссылка