Эта статья поднимает множество проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалить эти сообщения-шаблоны ) ( Узнайте, как и когда удалить этот шаблон сообщения )
|
Корпуса в переводческой науке. Постепенно рабочее место переводчика изменилось за последние десять лет. Персональные компьютеры теперь могут обрабатывать информацию проще и быстрее, чем когда-либо прежде, и поэтому сегодняшний компьютер может считаться важным или даже незаменимым инструментом перевода. Однако при использовании компьютеров для перевода возникают проблемы, поскольку компьютер не заменяет традиционные инструменты, такие как одноязычные и двуязычные словари , терминологию и энциклопедии на бумаге или в цифровом формате, и хотя мы можем легко получить доступ к большому количеству информации, мы нужно найти нужную и достоверную информацию.
Здесь корпуса и программное обеспечение согласования играют важную роль, поскольку они получают доступ к информации о языке, содержании и методах перевода, которая была недоступна переводчикам до нынешнего этапа развития ИКТ.
Машинный перевод на основе Corpus [ править ]
Машинный перевод из корпусной лингвистики основан на анализе реальных образцов с собственными переводами. Среди различных устройств, использующих корпус, есть статистические методы и основанные на примерах.
Статистические методы [ править ]
Основная цель статистического машинного перевода - генерировать переводы с помощью статистических методов, основанных на корпусе двуязычных текстов. Например, протоколы Европейского парламента составляются на всех официальных языках ЕС ( Европейского Союза ). Если бы этого корпуса было больше, мы бы получили отличные результаты перевода текстов на эти темы. Первой программой статистического машинного перевода была CANDIDE от IBM .
На основе примеров [ править ]
Машинный перевод, основанный на примерах, хорошо известен тем, что в качестве основного источника знаний использует двуязычный корпус. По сути, это аналогичный перевод и может быть истолкован как практика рассуждения кейсов, используемая в автоматическом обучении, которое заключается в решении проблемы на основе решений других подобных задач.
Корпорация и перевод [ править ]
Типология перевода [ править ]
Согласно EAGLES, мы можем провести общее различие между одноязычными и многоязычными корпусами. В то же время в многоязычных корпусах мы можем различать сопоставимые корпуса и корпуса, составленные с использованием аналогичных критериев проектирования, но не являющиеся переводами.
Параллельные или переводческие корпуса - это тексты на одном языке, выровненные с их переводом на другой. Мы должны учитывать несколько переменных, таких как прямота перевода, количество языков и т. Д.
Существует множество одноязычных сопоставимых корпусов (корпус, состоящий из двух подразделов, один из оригинальных текстов на одном языке, а другие тексты переведены на тот же язык). Это полезно для теоретиков перевода и исследователей, но профессиональные технические переводчики используют память переводов.
Определение памяти переводов [ править ]
Память переводов - это очень специфический тип параллельного корпуса, в котором:
- Это «собственность»: TM создаются индивидуально или коллективно на основе конкретных переводческих проектов.
- TM имеют тенденцию быть закрытыми. Они стандартизированы и имеют ограниченный набор языковых возможностей.
Инструментальные средства перевода и TM можно считать наиболее успешным инструментом перевода; однако он ограничен определенными типами текста.
Корпоративные помощники в переводе [ править ]
Предыдущие виды корпусов можно комбинировать с другими инструментами, например, со словарем. Корпуса могут функционировать как общие или специализированные словари. Таким образом, сопоставимые корпуса можно рассматривать как одноязычный словарь, а параллельные корпуса можно сравнить с двуязычным словарем .
Ресурсы корпуса для переводчиков [ править ]
Не все словари одинаковы, как и все корпуса. Помимо памяти переводов, ресурсы корпуса, которые могут быть использованы профессиональными переводчиками, могут быть классифицированы от «надежных» до «виртуальных».
Некоторыми примерами корпусов могут быть BNC ( Британский национальный корпус ), испанский корпус CREA, итальянский CORIS и т. Д.
Важно отметить различие корпусной лингвистики между корпусами и архивами электронных текстов; второй - всего лишь набор электронных текстов. Создание корпуса веб-страниц подразумевает операцию по поиску информации , чтобы найти релевантные и надежные документы.
Во многих классах перевода студенты сами изготавливают корпуса из корпусов DIY (сделай сам). Основные преимущества корпусов DIY можно резюмировать следующим образом:
- Их легко сделать.
- Они являются отличным источником информации о содержании.
- Это отличный источник терминологии и фразеологии.
- Не все темы, не все типы и не все языки доступны.
- Актуальность и надежность документов требует тщательной оценки.
- Существующее программное обеспечение для согласования плохо оборудовано для файлов HTML или XML.
Наконец, преимущества «надежных» корпусов, которые мы видим перед «виртуальными» корпусами, заключаются в следующем:
- Обычно они надежнее
- Обычно они крупнее.
- Их можно улучшить с помощью лингвистической и контекстной информации.
Ссылки [ править ]
Бейкер, М. (1993). «Корпусная лингвистика и исследования перевода.« Значение и приложения »в М. Бейкер, Дж. Фрэнсис и Э. Тоннини-Бонелли (ред.) Текст и технология . Филадельфия / Амстердам: Джон Бенджаминс, 232–252.
Скотт, М. (1996) Инструменты Вордсмита. Оксфорд: Oxford University Press.
Занеттин, Федерико. Корпуса в переводческой практике . Universitá per Stranieri di Perugia.
Внешние ссылки [ править ]
- Traducción automatica basada en corpus
- de Referencia del Español Актуально [ постоянная мертвая ссылка ]