Корпуса в переводческих исследованиях

Эта статья поднимает множество проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалить эти сообщения-шаблоны )

Эта статья написана как личное размышление, личное эссе или аргументированное эссе , в котором излагаются личные чувства редактора Википедии или представлены оригинальные аргументы по теме. Пожалуйста, помогите улучшить его , переписав в энциклопедическом стиле . ( Февраль 2013 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения )

Эта статья включает в себя список литературы , связанной литературы или внешних ссылок , но ее источники остаются неясными, поскольку в ней отсутствуют встроенные цитаты . Пожалуйста, помогите улучшить эту статью, добавив более точные цитаты. ( Февраль 2013 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения )

Эта статья - сирота , так как никакие другие статьи не ссылаются на нее . Пожалуйста, введите ссылки на эту страницу из связанных статей ; попробуйте инструмент "Найти ссылку", чтобы получить предложения. ( Октябрь 2012 г. )

( Узнайте, как и когда удалить этот шаблон сообщения )

Корпуса в переводческой науке. Постепенно рабочее место переводчика изменилось за последние десять лет. Персональные компьютеры теперь могут обрабатывать информацию проще и быстрее, чем когда-либо прежде, и поэтому сегодняшний компьютер может считаться важным или даже незаменимым инструментом перевода. Однако при использовании компьютеров для перевода возникают проблемы, поскольку компьютер не заменяет традиционные инструменты, такие как одноязычные и двуязычные словари , терминологию и энциклопедии на бумаге или в цифровом формате, и хотя мы можем легко получить доступ к большому количеству информации, мы нужно найти нужную и достоверную информацию.

Здесь корпуса и программное обеспечение согласования играют важную роль, поскольку они получают доступ к информации о языке, содержании и методах перевода, которая была недоступна переводчикам до нынешнего этапа развития ИКТ.

Машинный перевод на основе Corpus [ править ]

Машинный перевод из корпусной лингвистики основан на анализе реальных образцов с собственными переводами. Среди различных устройств, использующих корпус, есть статистические методы и основанные на примерах.

Статистические методы [ править ]

Основная цель статистического машинного перевода - генерировать переводы с помощью статистических методов, основанных на корпусе двуязычных текстов. Например, протоколы Европейского парламента составляются на всех официальных языках ЕС ( Европейского Союза ). Если бы этого корпуса было больше, мы бы получили отличные результаты перевода текстов на эти темы. Первой программой статистического машинного перевода была CANDIDE от IBM .

На основе примеров [ править ]

Машинный перевод, основанный на примерах, хорошо известен тем, что в качестве основного источника знаний использует двуязычный корпус. По сути, это аналогичный перевод и может быть истолкован как практика рассуждения кейсов, используемая в автоматическом обучении, которое заключается в решении проблемы на основе решений других подобных задач.

Корпорация и перевод [ править ]

Типология перевода [ править ]

Согласно EAGLES, мы можем провести общее различие между одноязычными и многоязычными корпусами. В то же время в многоязычных корпусах мы можем различать сопоставимые корпуса и корпуса, составленные с использованием аналогичных критериев проектирования, но не являющиеся переводами.

Параллельные или переводческие корпуса - это тексты на одном языке, выровненные с их переводом на другой. Мы должны учитывать несколько переменных, таких как прямота перевода, количество языков и т. Д.

Существует множество одноязычных сопоставимых корпусов (корпус, состоящий из двух подразделов, один из оригинальных текстов на одном языке, а другие тексты переведены на тот же язык). Это полезно для теоретиков перевода и исследователей, но профессиональные технические переводчики используют память переводов.

Определение памяти переводов [ править ]

Память переводов - это очень специфический тип параллельного корпуса, в котором:

Это «собственность»: TM создаются индивидуально или коллективно на основе конкретных переводческих проектов.
TM имеют тенденцию быть закрытыми. Они стандартизированы и имеют ограниченный набор языковых возможностей.

Инструментальные средства перевода и TM можно считать наиболее успешным инструментом перевода; однако он ограничен определенными типами текста.

Корпоративные помощники в переводе [ править ]

Предыдущие виды корпусов можно комбинировать с другими инструментами, например, со словарем. Корпуса могут функционировать как общие или специализированные словари. Таким образом, сопоставимые корпуса можно рассматривать как одноязычный словарь, а параллельные корпуса можно сравнить с двуязычным словарем .

Ресурсы корпуса для переводчиков [ править ]

Не все словари одинаковы, как и все корпуса. Помимо памяти переводов, ресурсы корпуса, которые могут быть использованы профессиональными переводчиками, могут быть классифицированы от «надежных» до «виртуальных».

Некоторыми примерами корпусов могут быть BNC ( Британский национальный корпус ), испанский корпус CREA, итальянский CORIS и т. Д.

Важно отметить различие корпусной лингвистики между корпусами и архивами электронных текстов; второй - всего лишь набор электронных текстов. Создание корпуса веб-страниц подразумевает операцию по поиску информации , чтобы найти релевантные и надежные документы.

Во многих классах перевода студенты сами изготавливают корпуса из корпусов DIY (сделай сам). Основные преимущества корпусов DIY можно резюмировать следующим образом:

Их легко сделать.
Они являются отличным источником информации о содержании.
Это отличный источник терминологии и фразеологии.
Не все темы, не все типы и не все языки доступны.
Актуальность и надежность документов требует тщательной оценки.
Существующее программное обеспечение для согласования плохо оборудовано для файлов HTML или XML.

Наконец, преимущества «надежных» корпусов, которые мы видим перед «виртуальными» корпусами, заключаются в следующем:

Обычно они надежнее
Обычно они крупнее.
Их можно улучшить с помощью лингвистической и контекстной информации.

Ссылки [ править ]

Бейкер, М. (1993). «Корпусная лингвистика и исследования перевода.« Значение и приложения »в М. Бейкер, Дж. Фрэнсис и Э. Тоннини-Бонелли (ред.) Текст и технология . Филадельфия / Амстердам: Джон Бенджаминс, 232–252.

Скотт, М. (1996) Инструменты Вордсмита. Оксфорд: Oxford University Press.

Занеттин, Федерико. Корпуса в переводческой практике . Universitá per Stranieri di Perugia.

Внешние ссылки [ править ]

Traducción automatica basada en corpus
de Referencia del Español Актуально ^{[ постоянная мертвая ссылка ]}