В вычислительном , интернационализация и локализациях ( американская ) или интернационализации и локализации ( BRE ), часто сокращенно i18n и l10n, [1] является средством адаптации программного обеспечения к различным языкам, региональным особенностям и техническим требованиям целевого языка. [2] Интернационализация - это процесс разработки программного приложения, позволяющего адаптировать его к различным языкам и регионам без инженерных изменений. Локализация - это процесс адаптации интернационализированного программного обеспечения для определенного региона или языка путем перевода текста и добавления локали.-специфические компоненты. Локализация (которая потенциально выполняется несколько раз для разных языков) использует инфраструктуру или гибкость, обеспечиваемую интернационализацией (которая в идеале выполняется только один раз перед локализацией или как неотъемлемая часть текущей разработки). [3]
Именование
Термины часто сокращаются до числовых имен i18n (где 18 обозначает количество букв между первым i и последним n в слове « интернационализация» , использование было введено Digital Equipment Corporation в 1970-х или 1980-х годах) [4] [5] и L10n для локализации из-за длины слов. [1] [6] Некоторые авторы пишут последнюю аббревиатуру с заглавной буквы, чтобы помочь различить их. [7]
Некоторые компании, такие как IBM и Oracle , используют термин глобализация , g11n , для сочетания интернационализации и локализации. [8]
Microsoft определяет интернационализацию как сочетание готовности к миру и локализации. Мировая готовность - это задача разработчика, которая позволяет использовать продукт с несколькими скриптами и культурами (глобализация) и разделять ресурсы пользовательского интерфейса в локализуемом формате (локализуемость, сокращенно L12y ). [9] [10]
Hewlett-Packard и HP-UX создали систему под названием «Поддержка национальных языков» или «Поддержка национальных языков» (NLS) для производства локализуемого программного обеспечения. [2]
Сфера
Согласно « Программному обеспечению без границ» , аспекты дизайна, которые следует учитывать при интернационализации продукта, включают «кодирование данных, данные и документацию, создание программного обеспечения, поддержку аппаратных устройств, взаимодействие с пользователем»; в то время как ключевые области дизайна, которые следует учитывать при создании полностью интернационализированного продукта с нуля, - это «взаимодействие с пользователем, разработка алгоритмов и форматы данных, программные услуги, документация». [2]
Перевод обычно является наиболее трудоемким компонентом языковой локализации . [2] Это может включать:
- Для фильмов, видео и аудио - перевод произнесенных слов или музыкальных текстов, часто с использованием дублирования или субтитров.
- Перевод текста для печатных материалов, цифровых носителей (возможно, включая сообщения об ошибках и документацию)
- Возможное изменение изображений и логотипов, содержащих текст, с целью добавления переводов или общих значков [2]
- Различная длина перевода и различия в размерах символов (например, между буквами латинского алфавита и китайскими иероглифами ) могут привести к тому, что макеты, которые хорошо работают на одном языке, плохо работают на других [2]
- Учет различий в диалекте , регистре или разновидности [2]
- Правила написания, такие как:
- Форматирование чисел (особенно десятичный разделитель и группировка цифр )
- Формат даты и времени , возможно, включая использование разных календарей
Стандартные данные локали
Компьютерное программное обеспечение может сталкиваться с различиями, выходящими за рамки простого перевода слов и фраз, поскольку компьютерные программы могут динамически генерировать контент. Эти различия, возможно, необходимо будет учесть в процессе интернационализации при подготовке к переводу. Многие из этих различий настолько регулярны, что преобразование между языками можно легко автоматизировать. Общий Locale хранилище данных с помощью Unicode обеспечивает сбор таких различий. Его данные используются основными операционными системами , включая Microsoft Windows , macOS и Debian , а также крупными интернет-компаниями или проектами, такими как Google и Wikimedia Foundation . Примеры таких различий включают:
- В разных «сценариях» в разных системах письма используются разные символы - разный набор букв, силлограмм, логограмм или символов. Современные системы используют стандарт Unicode для представления множества разных языков с помощью единой кодировки символов .
- Направление письма слева направо на большинстве европейских языков, справа налево на иврите и арабском языке или в обоих шрифтах в сценариях бустрофедона , и, возможно, вертикальное на некоторых азиатских языках. [2]
- Сложный макет текста для языков, где символы меняют форму в зависимости от контекста
- Использование заглавных букв присутствует в некоторых скриптах, но не в других
- Разные языки и системы письма имеют разные правила сортировки текста.
- В разных языках используются разные системы счисления , которые, возможно, потребуется поддерживать, если не используются западные арабские цифры.
- Разные языки имеют разные правила плюрализации, что может усложнять программы, динамически отображающие числовое содержимое. [11] Другие грамматические правила также могут отличаться, например, родительный падеж .
- В разных языках используются разные знаки препинания (например, текст цитируется в двойные кавычки («»), как на английском языке, или гильеметы («»), как на французском языке).
- Сочетания клавиш могут использовать только кнопки на раскладке клавиатуры, для которой выполняется локализация. Если ярлык соответствует слову на определенном языке (например, Ctrl-s означает «сохранить» на английском языке), возможно, его необходимо изменить. [12]
Национальные съезды
В разных странах существуют разные экономические соглашения, в том числе разные:
- Форматы бумаги
- Системы телевещания и популярные носители информации
- Форматы телефонных номеров
- Форматы почтовых адресов , почтовые индексы и выбор служб доставки
- Валюта ( символы , положение маркеров валют и разумные суммы из-за различных историй инфляции ) - коды ISO 4217 часто используются для интернационализации.
- Система измерения
- Размеры батарей
- Стандарты напряжения и тока
В частности, США и Европа различаются по большинству этих случаев. Другие области часто следуют за одним из них.
Конкретные сторонние сервисы, такие как онлайн-карты, прогнозы погоды или поставщики платежных услуг , могут быть недоступны по всему миру у одних и тех же операторов связи или вообще.
Часовые пояса в мире различаются, и это необходимо учитывать, если изначально продукт взаимодействовал с людьми только в одном часовом поясе. Для интернационализации UTC часто используется для внутреннего использования, а затем преобразуется в местный часовой пояс для отображения.
В разных странах действуют разные юридические требования, например:
- Соответствие нормативным требованиям может потребовать настройки для конкретной юрисдикции или изменения продукта в целом, например:
- Соблюдение закона о конфиденциальности
- Дополнительные заявления об отказе от ответственности на веб-сайте или на упаковке
- Различные требования к маркировке потребителей
- Соблюдение экспортных ограничений и правил шифрования
- Соблюдение режима цензуры в Интернете или процедуры повестки в суд
- Требования к доступности
- Сбор различных налогов, такие как налог с продаж , налог на добавленную стоимость , или таможенные пошлины
- Чувствительность к различным политическим вопросам, таким как споры о географических названиях и оспариваемые границы, показанные на картах (например, Индия предложила законопроект, согласно которому отказ от показа Кашмира и других территорий, как задумано правительством, является преступлением [13] [14] [15] )
- Номера, присвоенные государством, имеют разные форматы (например, паспорта, номера социального страхования и другие национальные идентификационные номера ).
При локализации также могут учитываться культурные различия, например:
- Местные праздники
- Соглашения о личном имени и титуле
- Эстетика
- Понятность и культурная уместность изображений и цветовой символики
- Этническая принадлежность , одежда и социально-экономический статус людей и архитектура изображенных мест
- Местные обычаи и соглашение , такие как социальные табу, популярные местные религии или суеверия , такие как типы крови в японской культуре против астрологических знаков в других культурах
Бизнес-процесс интернационализации программного обеспечения
Чтобы сделать продукт интернационализированным , важно посмотреть на множество рынков, на которые продукт может выйти. [2] Подробная информация, такая как длина поля для почтовых адресов, уникальный формат адреса, возможность сделать поле почтового индекса необязательным для адресации стран, у которых нет почтовых индексов, или поле штата для стран, у которых нет штатов, а также введение новых регистрационных потоков, соответствующих местному законодательству, - это лишь некоторые из примеров, которые делают интернационализацию сложным проектом. [7] [16] Более широкий подход учитывает культурные факторы, касающиеся, например, адаптации логики бизнес-процесса или включения индивидуальных культурных (поведенческих) аспектов. [2] [17]
Уже в 1990-х годах такие компании, как Bull, широко использовали машинный перевод ( Systran ) для всей своей переводческой деятельности: переводчики-люди выполняли предварительное редактирование (делая вводимые данные машиночитаемыми) и постредактирование . [2]
Инженерное дело
Как при реинжиниринге существующего программного обеспечения, так и при разработке нового интернационализированного программного обеспечения первым шагом интернационализации является разделение каждой потенциально зависящей от локали части (будь то код, текст или данные) в отдельный модуль. [2] Затем каждый модуль может либо полагаться на стандартную библиотеку / зависимость, либо быть независимо заменен по мере необходимости для каждой локали.
В настоящее время преобладает практика, когда приложения помещают текст в строки ресурсов, которые загружаются во время выполнения программы по мере необходимости. [2] Эти строки, хранящиеся в файлах ресурсов, относительно легко перевести. Программы часто создаются для обращения к библиотекам ресурсов в зависимости от выбранных данных локали.
Хранилище для переводимых и переводимых строк иногда называют каталогом сообщений [2], поскольку строки называются сообщениями. Каталог обычно содержит набор файлов в определенном формате локализации и стандартную библиотеку для обработки указанного формата. Одна программная библиотека и формат, который помогает в этом, - это gettext .
Таким образом, чтобы приложение поддерживало несколько языков, нужно спроектировать приложение так, чтобы оно выбирало соответствующий файл языковых ресурсов во время выполнения. Код, необходимый для управления проверкой ввода данных и многих других типов данных, зависящих от языкового стандарта, также должен поддерживать различные требования к языку. Современные системы разработки и операционные системы включают сложные библиотеки для международной поддержки этих типов, см. Также Стандартные локальные данные выше.
Многие проблемы локализации (например, направление письма, сортировка текста) требуют более глубоких изменений в программном обеспечении, чем перевод текста. Например, OpenOffice.org достигает этого с помощью переключателей компиляции.
Процесс
После планирования метод глобализации включает три этапа реализации: интернационализацию, локализацию и обеспечение качества. [2]
В некоторой степени (например, для обеспечения качества ) в группы разработчиков входит человек, который занимается основными / центральными этапами процесса, который затем включает все остальные. [2] Такие люди обычно понимают иностранные языки и культуры и имеют некоторый технический опыт. Специализированные технические писатели должны создать синтаксис, приемлемый для потенциально сложных концепций, в сочетании с инженерными ресурсами для развертывания и тестирования элементов локализации.
После правильной интернационализации программное обеспечение может полагаться на более децентрализованные модели локализации: бесплатное программное обеспечение с открытым исходным кодом обычно полагается на самостоятельную локализацию конечными пользователями и добровольцами, иногда организованными в группы. [18] KDE3 проект, например, было переведено на более чем 100 языков; [19] MediaWiki на 270 языках, из которых 100 в основном завершены по состоянию на 2016 год.[Обновить]. [20]
При переводе существующего текста на другие языки сложно поддерживать параллельные версии текстов на протяжении всего срока службы продукта. [21] Например, если сообщение, отображаемое пользователю, изменено, все переведенные версии должны быть изменены.
Коммерческие соображения
В коммерческих условиях выгода от локализации - доступ к большему количеству рынков. В начале 1980-х Lotus 1-2-3 потребовалось два года, чтобы разделить программный код и текст, и потерял лидерство на европейском рынке по сравнению с Microsoft Multiplan . [2] MicroPro обнаружила, что использование австрийского переводчика для рынка Западной Германии привело к тому, что ее документация WordStar, по словам одного из руководителей, «не приобрела тот тон, который должен был быть». [22]
Однако это связано со значительными затратами, которые выходят далеко за рамки инженерии. Кроме того, бизнес-операции должны адаптироваться для управления производством, хранением и распространением нескольких отдельных локализованных продуктов, которые часто продаются в совершенно разных валютах, нормативных условиях и налоговых режимах.
Наконец, отдел продаж, маркетинга и техническая поддержка также должны облегчить свою работу на новых языках, чтобы поддерживать клиентов в отношении локализованных продуктов. Предложение локализованного продукта никогда не может быть экономически выгодным, особенно для относительно небольшой языковой группы. Даже если большое количество языков может оправдать локализацию данного продукта, а внутренняя структура продукта уже допускает локализацию, конкретному разработчику или издателю программного обеспечения может не хватать размера и сложности для управления вспомогательными функциями, связанными с работой в нескольких регионах.
Смотрите также
- Подкомпоненты и стандарты
- Поддержка двунаправленного скрипта
- Международные компоненты для Unicode
- Код языка
- Языковая локализация
- Локализация веб-сайтов
- Связанные понятия
- Доступность компьютера
- Русификация компьютера , локализация на русский язык
- Разделение проблем
- Методы и примеры
- Локализация игры
- Система управления глобализацией
- Pseudolocalization , тестирование программного обеспечения метод для проверки готовности программного продукта для локализации.
- Другой
- Редактор метода ввода
- Языковая индустрия
Рекомендации
- ^ а б «Локализация против интернационализации» . Консорциум World Wide Web .
- ^ Б с д е е г ч я J к л м п о р д Патрик А.В. Холл; Мартин А. Ульд, ред. (1996). Программное обеспечение без границ: многоплатформенный, многокультурный и многонациональный подход . При участии и под руководством Рэя Хадсона, Костаса Спиропулоса, Тимо Хонкелы и др. Вайли. ISBN 978-0-471-96974-7.
- ^ Берт Эсселинк (2003). Эволюция локализации (PDF) . Руководство по локализации. Многоязычные вычисления и технологии. Архивировано из оригинального (PDF) 07.09.2012.
Короче говоря, локализация основана на сочетании языка и технологий для создания продукта, способного преодолевать культурные и языковые барьеры. Ни больше ни меньше.
- ^ «Глоссарий жаргона W3C» . Консорциум World Wide Web . Проверено 13 октября 2008 .
- ^ «Происхождение аббревиатуры I18n» .
- ^ «Утилиты GNU gettext: концепции» . Проект GNU . Архивировано из оригинального 18 -го сентября 2019 года . Проверено 29 октября 2019 года .
Когда мы обсуждаем поддержку родного языка в программах, постоянно появляются два длинных слова, и эти слова имеют точное значение, которое стоит объяснить здесь, раз и навсегда, в этом документе. Слова интернационализации и локализации. Многие люди, уставшие писать эти длинные слова снова и снова, взяли за привычку писать вместо этого i18n и l10n, цитируя первую и последнюю букву каждого слова и заменяя ряд промежуточных букв числом, просто указывающим, сколько таких букв Существуют.
- ^ а б Алан (29 марта 2011 г.). «Что такое интернационализация (i18n), локализация (L10n) и глобализация (g11n)» . Архивировано из оригинала на 2015-04-02.
Заглавная L в L10n помогает отличить его от строчной i в i18n.
- ^ «IBM Globalization» . 17 марта 2016 года Архивировано из оригинала на 2016-03-31.
- ^ «Пошаговая глобализация» . Архивировано из оригинала на 2015-04-12.
- ^ «Шаг за шагом к глобализации: понимание интернационализации» . Архивировано из оригинала на 2015-05-26.
- ^ «Утилиты GNU gettext: формы множественного числа» .
- ^ Languagetranslationsservices.wordpress.com. Архивировано 3 апреля 2015 г. на Wayback Machine.
- ^ Хайдер, М. (17 мая 2016 г.). «Пакистан выражает озабоченность по поводу Индии спорной„карта законопроекта “ » . Рассвет . Пакистан Геральд Пабликейшн (Пвт.) Лтд . Проверено 9 мая 2018 .
- ^ Хамдани, Ю.Л. (18 мая 2016 г.). «Смена карты не означает, что Кашмир - часть вас, Индия» . Блоги Express Tribune . Сеть новостей Express Tribune . Проверено 9 мая 2018 .
- ^ Madrad Courier (24 июля 2017 г.). «Обзор законопроекта о регулировании геопространственной информации» . Курьер Мадраса . Випра Holdings Ltd . Проверено 9 мая 2018 .
- ^ «Международные форматы адресов» . Сеть разработчиков Microsoft . Microsoft . Проверено 10 декабря 2013 года .
- ^ Павловски, JM (2008): Профили культуры: Содействие глобальному обучению и обмену знаниями. Proc. ICCE 2008, Тайвань, ноябрь 2008 г. Черновая версия
- ^ Рейна, Лаура Арджона; Роблес, Грегорио; Гонсалес-Бараона, Хесус М. (25 июня 2013 г.). Петринья, Этиэль; Суччи, Джанкарло; Иоини, Набиль Эль; Силлитти, Альберто (ред.). Предварительный анализ локализации в свободных программах: как выполняются переводы . Достижения ИФИП в области информационных и коммуникационных технологий. Springer Berlin Heidelberg. С. 153–167. DOI : 10.1007 / 978-3-642-38928-3_11 . ISBN 978-3-642-38927-6.
- ^ Текущий список см. На KDE.org
- ^ «Перевод: групповая статистика - translatewiki.net» .
- ^ «Как перевести игру на 20 языков и не попасть в ад» .
- ^ Шраге, Майкл (17 февраля 1985). «IBM побеждает на европейском компьютерном рынке» . Вашингтон Пост . ISSN 0190-8286 . Проверено 29 августа 2018 .
дальнейшее чтение
- .NET Internationalization: The Developer's Guide to Building Global Windows and Web Applications , Guy Smith-Ferrier, Addison-Wesley Professional, 7 августа 2006 г. ISBN 0-321-34138-4
- Практическое руководство по локализации , Берт Эсселинк, издательство Джона Бенджамина, [2000]. ISBN 1-58811-006-0
- Лидия Эш : The Web Testing Companion: The Insider's Guide to Efficient and Effective Tests , Wiley, 2 мая 2003 г. ISBN 0-471-43021-8
- «Бизнес без границ: стратегическое руководство по глобальному маркетингу» , Дональд А. ДеПальма, Globa Vista Press [2004]. ISBN 978-0-9765169-0-3
Внешние ссылки
- Локализация FOSS в Викиучебнике
- Мгновенно изучите тестирование локализации
- Локализация против интернационализации Консорциумом World Wide Web
- СМИ, связанные с интернационализацией и локализацией на Викискладе?