Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Китайский текст проект (CTP, китайский :中國哲學書電子化計劃) является цифровой библиотекой проектом , который собирает коллекцию ранних китайских текстов . Название проекта на китайском языке буквально означает «Проект оцифровки китайских философских книг», что свидетельствует о его ориентации на книги, связанные с китайской философией . Он направлен на предоставление доступных и точных версий широкого спектра текстов [1], особенно тех, которые касаются китайской философии, и этому сайту приписывают одну из самых полных и точных коллекций классических китайских текстов в Интернете [2]. ] [3]а также является одной из самых полезных текстовых баз данных для исследователей ранних китайских текстов. [4] [5]

Содержание сайта [ править ]

Тексты делятся на тексты до Цинь и Хань и тексты после Хань, причем первые классифицируются по школам, а вторые - по династиям . Древний (до Цинь и Хань) раздел базы данных содержит более 5 миллионов китайских иероглифов, пост-ханьская база данных - более 20 миллионов символов, а общедоступный раздел вики - более 5 миллиардов символов. [6] Многие тексты также имеют переводы на английский и китайский языки, которые сочетаются с исходным текстом параграф за параграфом, а также фраза за фразой для простоты сравнения; это позволяет использовать систему в качестве полезного инструмента научного исследования даже студентами, которые плохо знают китайский язык или совсем не знают его. [7]

Помимо предоставления настраиваемых функций поиска, подходящих для китайских текстов, [8] [9] сайт также пытается использовать уникальный формат Интернета, чтобы предложить ряд функций, актуальных для китаеведов , включая интегрированный словарь, списки слов, информация о параллельном проходе, [10] отсканированные исходные тексты, соответствие и индексные данные, [11] система метаданных, отображение комментариев на китайском языке [12] , база данных опубликованных ресурсов и дискуссионный форум, на котором темы могут быть связаны с конкретными данными о сайт. [13] [14] Раздел «Библиотека» сайта также включает сканированные копии более 25 миллионов страниц ранних китайских текстов, [15] [6]построчно связаны с транскрипциями в полнотекстовой базе данных, многие из которых создаются с использованием оптического распознавания символов [16], редактируются и поддерживаются с помощью онлайн-краудсорсинговой вики-системы. [17] [18] Текстовые данные и метаданные также можно экспортировать с помощью интерфейса прикладного программирования , что позволяет интегрировать его с другими онлайн-инструментами, а также использовать в проектах интеллектуального анализа текста и цифровых гуманитарных наук . [17] [19]

Ссылки [ править ]

  1. ^ Эльман, Бенджамин А. "Классическая историография китайской истории: базы данных и электронные тексты" . Университет Принстона. Архивировано из оригинального 5 -го августа 2016 года . Проверено 3 июня 2016 года .
  2. ^ «Ассоциация китайских философов в Северной Америке (北美 中国 哲学 学者 协会)» . Архивировано из оригинала на 2010-12-25 . Проверено 25 сентября 2010 .
  3. ^ Крис Фрейзер , факультет философии Гонконгского университета
  4. ^ http://warpweftandway.com/support-the-chinese-text-project/
  5. ^ http://languagehat.com/chinese-text-project/
  6. ^ a b http://ctext.org/system-statistics
  7. ^ Коннолли, Тим (2012). «Изучение китайской философии с комментариями». Философия преподавания . Центр философской документации. 35 (1): 1–18. DOI : 10,5840 / teachphil20123511 .
  8. ^ http://ctext.org/instructions/advanced-search
  9. ^ http://ctext.org/faq/normalization
  10. ^ Осетр, Дональд (2017). «Неконтролируемая идентификация повторного использования текста в ранней китайской литературе» . Цифровая стипендия в гуманитарных науках . Издательство Оксфордского университета . Проверено 21 ноября 2017 года .
  11. ^ Сюй, Цзяцзинь (2015). «Корпусные китайские исследования: исторический обзор с 1920-х годов по настоящее время». Китайский язык и дискурс . Издательская компания Джона Бенджамина. 6 (2): 218–244. DOI : 10,1075 / cld.6.2.06xu .
  12. ^ Адкинс, Марта А. (2016). «Веб-обзор: Интернет-ресурсы для изучения китайской религии и философии» . Богословское библиотечное дело . Американская теологическая библиотечная ассоциация. 9 (2): 5–8. DOI : 10.31046 / tl.v9i2.435 .
  13. ^ Хольгер Шнайдер и Джефф Тарсен, http://disssmentreviews.org/archives/9213
  14. ^ http://ctext.org/introduction
  15. ^ http://ctext.org/library.pl?if=en
  16. ^ Осетр, Дональд (2017). Неконтролируемое извлечение обучающих данных для до-современного китайского OCR . Тридцатая Международная конференция Flairs. AAAI . Проверено 21 ноября 2017 года .
  17. ^ a b https://cpianalysis.org/2016/06/08/crowdsourcing-apis-and-a-digital-library-of-chinese/ Архивировано 20 марта 2017 г. в Wayback Machine , Институт политики Китая, Университет Ноттингем
  18. ^ http://ctext.org/instructions/ocr
  19. ^ http://ctext.org/tools/api

Внешние ссылки [ править ]

  • Китайский текстовый проект
  • 中國 哲學 書 電子 化 計劃 (на китайском языке)
  • Китайский текстовый проект в Douban (на китайском языке)