Китайский текстовый проект - Chinese Text Project

Китайский текстовый проект
Китайский текст Project.jpg
Тип сайта
Цифровая библиотека
Доступно ванглийский и Китайский
ВладелецДональд Стерджен
СделаноДональд Стерджен
URLctext.org
Постановка на учеттребуется внести
Запущен2006; 14 лет назад (2006)
Текущее состояниеактивный
Китайский текстовый проект
Традиционный китайский中國 哲學 書 電子 化 計劃
Упрощенный китайский中国 哲学 书 电子 化 计划
Буквальное значениеПроект оцифровки китайских философских книг

В Китайский текстовый проект (ОСАГО; Китайский : 中國 哲學 書 電子 化 計劃) это цифровая библиотека проект, собирающий коллекции ранние китайские тексты. Название проекта на китайском языке буквально означает «Проект оцифровки китайских философских книг», что свидетельствует о его ориентации на книги, связанные с Китайская философия. Он направлен на предоставление доступных и точных версий широкого спектра текстов,[1] особенно те, которые относятся к китайской философии, и этому сайту приписывают одну из самых полных и точных коллекций классических китайских текстов в Интернете,[2][3] а также является одной из самых полезных текстовых баз данных для исследователей ранних китайских текстов.[4][5]

Содержание сайта

Тексты делятся на тексты до цинь и хань и тексты после хань, причем первые классифицируются по школа мысли и последний династия. Древний (до Цинь и Хань) раздел базы данных содержит более 5 миллионов китайских иероглифов, пост-ханьская база данных - более 20 миллионов символов, а общедоступные редактируемые вики раздел более 5 миллиардов символов.[6] Многие тексты также имеют переводы на английский и китайский языки, которые сопряжены с исходным текстом параграф за параграфом, а также фраза за фразой для простоты сравнения; это позволяет использовать систему в качестве полезного инструмента научного исследования даже студентами, которые плохо знают китайский язык или совсем не знают его.[7]

Помимо предоставления настраиваемых функций поиска, подходящих для китайских текстов,[8][9] сайт также пытается использовать уникальный формат Интернета, чтобы предложить ряд функций, относящихся к китаеведы, включая интегрированный словарь, списки слов, информацию о параллельных отрывках,[10] отсканированные исходные тексты, данные соответствия и индексные данные,[11] система метаданных, отображение комментариев на китайском языке,[12] база данных опубликованных ресурсов и дискуссионный форум, на котором темы могут быть связаны с конкретными данными на сайте.[13][14] Раздел «Библиотека» сайта также включает сканированные копии более 25 миллионов страниц ранних китайских текстов,[15][6] построчно связаны с транскрипциями в полнотекстовой базе данных, многие из которых создаются с использованием оптического распознавания символов,[16] и редактируется и поддерживается с помощью онлайн-краудсорсинговой вики-системы.[17][18] Текстовые данные и метаданные также можно экспортировать с помощью Интерфейс прикладного программирования, позволяя интегрироваться с другими онлайн-инструментами, а также использовать в интеллектуальный анализ текста и цифровые гуманитарные науки проекты.[17][19]

Рекомендации

  1. ^ Эльман, Бенджамин А. «Классическая историография для истории Китая: базы данных и электронные тексты». Университет Принстона. Архивировано из оригинал 5 августа 2016 г.. Получено 3 июня, 2016.
  2. ^ «Ассоциация китайских философов Северной Америки (北美 中国 哲学 学者 协会)». Архивировано из оригинал на 2010-12-25. Получено 2010-09-25.
  3. ^ Крис Фрейзер, Факультет философии Гонконгского университета
  4. ^ http://warpweftandway.com/support-the-chinese-text-project/
  5. ^ http://languagehat.com/chinese-text-project/
  6. ^ а б http://ctext.org/system-statistics
  7. ^ Коннолли, Тим (2012). «Изучение китайской философии с комментариями». Преподавание философии. Центр философской документации. 35 (1): 1–18. Дои:10.5840 / learnphil20123511.
  8. ^ http://ctext.org/instructions/advanced-search
  9. ^ http://ctext.org/faq/normalization
  10. ^ Осетр, Дональд (2017). «Неконтролируемое определение повторного использования текста в ранней китайской литературе». Цифровая стипендия в области гуманитарных наук. Oxford University Press. Получено Двадцать первое ноября, 2017.
  11. ^ Сюй, Цзяцзинь (2015). «Корпусные китайские исследования: исторический обзор с 1920-х годов по настоящее время». Китайский язык и дискурс. Издательская компания Джона Бенджамина. 6 (2): 218–244. Дои:10.1075 / cld.6.2.06xu.
  12. ^ Адкинс, Марта А. (2016). "Веб-обзор: Интернет-ресурсы для изучения китайской религии и философии". Богословское библиотечное дело. Американская теологическая библиотечная ассоциация. 9 (2): 5–8. Дои:10.31046 / tl.v9i2.435.
  13. ^ Хольгер Шнайдер и Джефф Тарсен, http://disssmentreviews.org/archives/9213
  14. ^ http://ctext.org/introduction
  15. ^ http://ctext.org/library.pl?if=en
  16. ^ Осетр, Дональд (2017). Неконтролируемое извлечение обучающих данных для до-современного китайского OCR. Тридцатая Международная конференция Flairs. AAAI. Получено Двадцать первое ноября, 2017.
  17. ^ а б https://cpianalysis.org/2016/06/08/crowdsourcing-apis-and-a-digital-library-of-chinese/ В архиве 2017-03-20 в Wayback Machine, Институт политики Китая, Ноттингемский университет
  18. ^ http://ctext.org/instructions/ocr
  19. ^ http://ctext.org/tools/api

внешняя ссылка