Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Скриншот программ TDE, в основном локализованных на китайский (традиционный) .

В вычислительном , интернационализация и локализациях ( американская ) или интернационализации и локализации ( BRE ), часто сокращенно i18n и l10n, [ править ] является средством адаптации программного обеспечения к различным языкам, региональным особенностям и техническим требованиям целевого языка. [1]Интернационализация - это процесс разработки программного приложения, позволяющего адаптировать его к различным языкам и регионам без инженерных изменений. Локализация - это процесс адаптации интернационализированного программного обеспечения для определенного региона или языка путем перевода текста и добавления компонентов, зависящих от локали . Локализация (которая потенциально выполняется несколько раз для разных языков) использует инфраструктуру или гибкость, обеспечиваемую интернационализацией (которая в идеале выполняется только один раз перед локализацией или как неотъемлемая часть текущей разработки). [2]

Именование [ править ]

Эти термины часто сокращаются до числовых имен i18n (где 18 обозначает количество букв между первым i и последним n в слове « интернационализация» , употребление, придуманное Digital Equipment Corporation в 1970-х или 1980-х годах) [3] [4] и L10n для локализации из-за длины слов. [5] [6] Некоторые авторы пишут последнюю аббревиатуру с заглавной буквы, чтобы помочь различить их. [7]

Некоторые компании, такие как IBM и Oracle , используют термин глобализация , g11n , для сочетания интернационализации и локализации. [8]

Microsoft определяет интернационализацию как сочетание готовности к миру и локализации. Мировая готовность - это задача разработчика, которая позволяет использовать продукт с несколькими скриптами и культурами (глобализация) и разделять ресурсы пользовательского интерфейса в локализуемом формате (локализуемость, сокращенно L12y ). [9] [10]

Hewlett-Packard и HP-UX создали систему под названием «Поддержка национальных языков» или «Поддержка национальных языков» (NLS) для производства локализуемого программного обеспечения. [1]

Сфера [ править ]

Процесс интернационализации и локализации
(на основе диаграммы с веб-сайта LISA )

Согласно « Программному обеспечению без границ» , аспекты дизайна, которые следует учитывать при интернационализации продукта, включают «кодирование данных, данные и документацию, создание программного обеспечения, поддержку аппаратных устройств, взаимодействие с пользователем»; в то время как ключевые области дизайна, которые следует учитывать при создании полностью интернационализированного продукта с нуля, - это «взаимодействие с пользователем, разработка алгоритмов и форматы данных, программные услуги, документация». [1]

Перевод обычно является наиболее трудоемким компонентом языковой локализации . [1] Это может включать:

  • Для фильмов, видео и аудио - перевод произнесенных слов или музыкальных текстов, часто с использованием дублирования или субтитров.
  • Перевод текста для печатных материалов, цифровых носителей (возможно, включая сообщения об ошибках и документацию)
  • Возможное изменение изображений и логотипов, содержащих текст, с целью добавления переводов или общих значков [1]
  • Различная длина перевода и различия в размерах символов (например, между буквами латинского алфавита и китайскими иероглифами ) могут привести к тому, что макеты, которые хорошо работают на одном языке, плохо работают на других [1]
  • Учет различий в диалекте , регистре или разновидности [1]
  • Письменные соглашения, такие как:
    • Форматирование чисел (особенно десятичный разделитель и группировка цифр )
    • Формат даты и времени , возможно, включая использование разных календарей

Стандартные языковые данные [ править ]

Компьютерное программное обеспечение может сталкиваться с различиями, выходящими за рамки простого перевода слов и фраз, поскольку компьютерные программы могут динамически генерировать контент. Эти различия, возможно, необходимо будет учесть в процессе интернационализации при подготовке к переводу. Многие из этих различий настолько регулярны, что преобразование между языками можно легко автоматизировать. Общий Locale хранилище данных с помощью Unicode обеспечивает сбор таких различий. Его данные используются основными операционными системами , включая Microsoft Windows , macOS и Debian , а также крупными интернет-компаниями или проектами, такими как Google иФонд Викимедиа . Примеры таких различий включают:

  • В разных «сценариях» в разных системах письма используются разные символы - разный набор букв, силлограмм, логограмм или символов. Современные системы используют стандарт Unicode для представления множества разных языков с помощью единой кодировки символов .
  • Направление письма слева направо на большинстве европейских языков, справа налево на иврите и арабском языке или в обоих шрифтах в сценариях бустрофедона , и, возможно, вертикальное на некоторых азиатских языках. [1]
  • Сложный макет текста для языков, где символы меняют форму в зависимости от контекста
  • Использование заглавных букв присутствует в некоторых скриптах, но не в других.
  • Разные языки и системы письма имеют разные правила сортировки текста.
  • В разных языках используются разные системы счисления , которые, возможно, потребуется поддерживать, если не используются западные арабские цифры.
  • Разные языки имеют разные правила плюрализации, что может усложнять программы, динамически отображающие числовое содержимое. [11] Другие грамматические правила также могут отличаться, например, родительный падеж .
  • В разных языках используются разные знаки препинания (например, цитирование текста с использованием двойных кавычек («»), как на английском языке, или гильеметов («»), как на французском языке).
  • Сочетания клавиш могут использовать только кнопки на раскладке клавиатуры, для которой выполняется локализация. Если ярлык соответствует слову на определенном языке (например, Ctrl-s означает «сохранить» на английском языке), возможно, его необходимо изменить. [12]

Национальные съезды [ править ]

В разных странах существуют разные экономические соглашения, в том числе разные:

  • Форматы бумаги
  • Системы телевещания и популярные носители информации
  • Форматы телефонных номеров
  • Форматы почтовых адресов , почтовые индексы и выбор служб доставки
  • Валюта ( символы , положение маркеров валют и разумные суммы из-за разной истории инфляции ) - коды ISO 4217 часто используются для интернационализации.
  • Система измерения
  • Размеры батарей
  • Стандарты напряжения и тока

В частности, США и Европа различаются по большинству этих случаев. Другие области часто следуют за одним из них.

Конкретные сторонние сервисы, такие как онлайн-карты, прогнозы погоды или поставщики платежных услуг , могут быть недоступны по всему миру у одних и тех же операторов связи или вообще.

Часовые пояса в мире различаются, и это необходимо учитывать, если изначально продукт взаимодействовал с людьми только в одном часовом поясе. Для интернационализации UTC часто используется для внутреннего использования, а затем преобразуется в местный часовой пояс для отображения.

В разных странах действуют разные юридические требования, например:

  • Соответствие нормативным требованиям может потребовать настройки для конкретной юрисдикции или изменения продукта в целом, например:
    • Соблюдение закона о конфиденциальности
    • Дополнительные заявления об отказе от ответственности на веб-сайте или на упаковке
    • Различные требования к маркировке потребителей
    • Соблюдение экспортных ограничений и правил шифрования
    • Соблюдение режима цензуры в Интернете или процедуры повестки в суд
    • Требования к доступности
    • Сбор различных налогов, такие как налог с продаж , налог на добавленную стоимость , или таможенные пошлины
    • Чувствительность к различным политическим вопросам, таким как споры о географических названиях и спорные границы, показанные на картах (например, Индия предложила противоречивый законопроект, согласно которому отказ от показа Кашмира и других территорий в соответствии с намерениями правительства будет преступлением [13] [14] [15 ] )
  • Номера, присвоенные государством, имеют разные форматы (например, паспорта, номера социального страхования и другие национальные идентификационные номера ).

При локализации также могут учитываться культурные различия, например:

  • Местные праздники
  • Соглашения о личном имени и титуле
  • Эстетика
  • Понятность и культурная уместность изображений и цветовой символики
  • Этническая принадлежность , одежда и социально-экономический статус людей и архитектура изображенных мест
  • Местные обычаи и соглашение , такие как социальные табу, популярные местные религии или суеверия , такие как типы крови в японской культуре против астрологических знаков в других культурах

Бизнес-процесс интернационализации программного обеспечения [ править ]

Чтобы сделать продукт интернационализированным , важно рассмотреть множество рынков, на которые продукт может выйти. [1] Подробная информация, такая как длина поля для почтовых адресов, уникальный формат адреса, возможность сделать поле почтового индекса необязательным для адресации стран, у которых нет почтовых индексов, или поле штата для стран, у которых нет штатов, а также введение новых регистрационных потоков, соответствующих местному законодательству, - это лишь некоторые из примеров, которые делают интернационализацию сложным проектом. [7] [16] Более широкий подход учитывает культурные факторы, касающиеся, например, адаптации логики бизнес-процесса или включения индивидуальных культурных (поведенческих) аспектов. [1] [17]

Уже в 1990-х годах такие компании, как Bull, широко использовали машинный перевод ( Systran ) для всей своей переводческой деятельности: переводчики-люди выполняли предварительное редактирование (делая вводимые данные машиночитаемыми) и постредактирование . [1]

Инженерное дело [ править ]

Как при реинжиниринге существующего программного обеспечения, так и при разработке нового интернационализированного программного обеспечения первым шагом интернационализации является разделение каждой потенциально зависящей от локали части (будь то код, текст или данные) в отдельный модуль. [1] Каждый модуль может затем полагаться на стандартную библиотеку / зависимость или быть независимо заменен по мере необходимости для каждой локали.

В настоящее время преобладает практика, когда приложения помещают текст в строки ресурсов, которые загружаются во время выполнения программы по мере необходимости. [1] Эти строки, хранящиеся в файлах ресурсов, относительно легко перевести. Программы часто создаются для обращения к библиотекам ресурсов в зависимости от выбранных данных локали.

Хранилище переводимых и переводимых строк иногда называют каталогом сообщений [1], поскольку строки называются сообщениями. Каталог обычно содержит набор файлов в определенном формате локализации и стандартную библиотеку для обработки указанного формата. Одна программная библиотека и формат, который помогает в этом, - это gettext .

Таким образом, чтобы приложение поддерживало несколько языков, нужно спроектировать приложение так, чтобы оно выбирало соответствующий файл языковых ресурсов во время выполнения. Код, необходимый для управления проверкой ввода данных и многих других типов данных, зависящих от языкового стандарта, также должен поддерживать различные требования к языку. Современные системы разработки и операционные системы включают сложные библиотеки для международной поддержки этих типов, см. Также Стандартные локальные данные выше.

Многие проблемы локализации (например, направление письма, сортировка текста) требуют более глубоких изменений в программном обеспечении, чем перевод текста. Например, OpenOffice.org достигает этого с помощью переключателей компиляции.

Процесс [ править ]

После планирования метод глобализации включает три этапа реализации: интернационализацию, локализацию и обеспечение качества. [1]

В некоторой степени (например, для обеспечения качества ) в группы разработчиков входит человек, который занимается основными / центральными этапами процесса, который затем включает все остальные. [1] Такие люди обычно понимают иностранные языки и культуры и имеют некоторый технический опыт. Специализированные технические писатели должны создать синтаксис, приемлемый для потенциально сложных концепций, в сочетании с инженерными ресурсами для развертывания и тестирования элементов локализации.

После правильной интернационализации программное обеспечение может полагаться на более децентрализованные модели локализации: бесплатное программное обеспечение с открытым исходным кодом обычно полагается на самостоятельную локализацию конечными пользователями и добровольцами, иногда организованными в группы. [18] KDE3 проект, например, было переведено на более чем 100 языков; [19] MediaWiki на 270 языках, из которых 100 в основном завершены по состоянию на 2016 год . [20]

При переводе существующего текста на другие языки сложно поддерживать параллельные версии текстов на протяжении всего срока службы продукта. [21] Например, если сообщение, отображаемое пользователю, изменено, все переведенные версии должны быть изменены.

Коммерческие соображения [ править ]

В коммерческих условиях выгода от локализации - доступ к большему количеству рынков. В начале 1980-х Lotus 1-2-3 потребовалось два года, чтобы разделить программный код и текст, и потерял лидерство на европейском рынке по сравнению с Microsoft Multiplan . [1] MicroPro обнаружила, что использование австрийского переводчика для рынка Западной Германии привело к тому, что документация WordStar, по словам одного из руководителей, «не приобрела тот тон, который должен был быть». [22]

Однако это связано со значительными затратами, которые выходят далеко за рамки инженерии. Кроме того, бизнес-операции должны адаптироваться для управления производством, хранением и распространением нескольких отдельных локализованных продуктов, которые часто продаются в совершенно разных валютах, нормативных условиях и налоговых режимах.

Наконец, отдел продаж, маркетинга и техническая поддержка также должны облегчить свою работу на новых языках, чтобы поддерживать клиентов в отношении локализованных продуктов. Предложение локализованного продукта никогда не может быть экономически выгодным, особенно для относительно небольшой языковой группы. Даже если большое количество языков может оправдать локализацию данного продукта, а внутренняя структура продукта уже допускает локализацию, конкретному разработчику или издателю программного обеспечения может не хватать размера и сложности для управления вспомогательными функциями, связанными с работой в нескольких регионах.

См. Также [ править ]

  • Подкомпоненты и стандарты
    • Поддержка двунаправленного скрипта
    • Международные компоненты для Unicode
    • Код языка
    • Языковая локализация
    • Локализация веб-сайтов
  • Связанные понятия
    • Доступность компьютера
    • Русификация компьютера , локализация на русский язык
    • Разделение проблем
  • Методы и примеры
    • Локализация игры
    • Система управления глобализацией
    • Pseudolocalization , тестирование программного обеспечения метод для проверки готовности программного продукта для локализации.
  • Другой
    • Редактор метода ввода
    • Языковая индустрия

Ссылки [ править ]

  1. ^ a b c d e f g h i j k l m n o p q Патрик А. В. Холл; Мартин А. Ульд, ред. (1996). Программное обеспечение без границ: многоплатформенный, многокультурный и многонациональный подход . При участии и под руководством Рэя Хадсона, Костаса Спиропулоса, Тимо Хонкелы и др. Вайли. ISBN 978-0-471-96974-7.
  2. ^ Берт Эсселинк (2003). Эволюция локализации (PDF) . Руководство по локализации. Многоязычные вычисления и технологии. Архивировано из оригинального (PDF) 07.09.2012. Короче говоря, локализация основана на сочетании языка и технологий для создания продукта, способного преодолевать культурные и языковые барьеры. Не больше, не меньше.
  3. ^ «Глоссарий жаргона W3C» . Консорциум World Wide Web . Проверено 13 октября 2008 .
  4. ^ «Происхождение аббревиатуры I18n» .
  5. ^ «Локализация против интернационализации» . Консорциум World Wide Web .
  6. ^ "Утилиты GNU gettext: Концепции" . Проект GNU . Архивировано из оригинального 18 -го сентября 2019 года . Проверено 29 октября 2019 года . Когда мы обсуждаем поддержку родного языка в программах, постоянно появляются два длинных слова, и эти слова имеют точное значение, которое стоит объяснить здесь, раз и навсегда, в этом документе. Слова интернационализации и локализации. Многие люди, уставшие писать эти длинные слова снова и снова, взяли за привычку писать вместо этого i18n и l10n, цитируя первую и последнюю букву каждого слова и заменяя ряд промежуточных букв числом, просто указывающим, сколько таких букв Существуют.
  7. ^ Б алан (2011-03-29). «Что такое интернационализация (i18n), локализация (L10n) и глобализация (g11n)» . Архивировано из оригинала на 2015-04-02. Заглавная L в L10n помогает отличить его от строчной i в i18n.
  8. ^ «IBM Globalization» . 17 марта 2016 года Архивировано из оригинала на 2016-03-31.
  9. ^ «Пошаговая глобализация» . Архивировано из оригинала на 2015-04-12.
  10. ^ «Шаг за шагом глобализации: понимание интернационализации» . Архивировано из оригинала на 2015-05-26.
  11. ^ "Утилиты GNU gettext: формы множественного числа" .
  12. ^ Languagetranslationsservices.wordpress.com. Архивировано 3 апреля 2015 г. на Wayback Machine.
  13. Перейти ↑ Haider, M. (17 мая 2016 г.). «Пакистан выражает озабоченность по поводу Индии спорной„карта законопроекта » . Рассвет . Пакистан Геральд Пабликейшн (Пвт.) Лтд . Проверено 9 мая 2018 .
  14. ^ Хамдани, YL (18 мая 2016). «Смена карты не означает, что Кашмир - часть вас, Индия» . Блоги Express Tribune . Сеть новостей Express Tribune . Проверено 9 мая 2018 .
  15. ^ Madrad Courier (24 июля 2017). «Обзор законопроекта о регулировании геопространственной информации» . Курьер Мадраса . Випра Holdings Ltd . Проверено 9 мая 2018 .
  16. ^ "Международные форматы адресов" . Сеть разработчиков Microsoft . Microsoft . Проверено 10 декабря 2013 года .
  17. ^ Павловски, JM (2008): Профили культуры: Содействие глобальному обучению и обмену знаниями. Proc. ICCE 2008, Тайвань, ноябрь 2008 г. Черновая версия
  18. Рейна, Лаура Арджона; Роблес, Грегорио; Гонсалес-Бараона, Хесус М. (25 июня 2013 г.). Петринья, Этиэль; Суччи, Джанкарло; Иоини, Набиль Эль; Силлитти, Альберто (ред.). Предварительный анализ локализации в свободных программах: как выполняются переводы . Достижения ИФИП в области информационных и коммуникационных технологий. Springer Berlin Heidelberg. С. 153–167. DOI : 10.1007 / 978-3-642-38928-3_11 . ISBN 978-3-642-38927-6.
  19. ^ Текущий список см. На KDE.org
  20. ^ «Перевод: групповая статистика - translatewiki.net» .
  21. ^ «Как перевести игру на 20 языков и не попасть в ад» .
  22. ^ Шраге, Майкл (1985-02-17). «IBM побеждает на европейском компьютерном рынке» . Вашингтон Пост . ISSN 0190-8286 . Проверено 29 августа 2018 . 

Дальнейшее чтение [ править ]

  • .NET Internationalization: The Developer's Guide to Building Global Windows and Web Applications , Guy Smith-Ferrier, Addison-Wesley Professional, 7 августа 2006 г. ISBN 0-321-34138-4 
  • Практическое руководство по локализации , Берт Эсселинк, издательство Джона Бенджамина, [2000]. ISBN 1-58811-006-0 
  • Лидия Эш : Помощник по веб-тестированию: Руководство посвященного лица по эффективным и действенным тестам , Wiley, 2 мая 2003 г. ISBN 0-471-43021-8 
  • «Бизнес без границ: стратегическое руководство по глобальному маркетингу» , Дональд А. ДеПальма, Globa Vista Press [2004]. ISBN 978-0-9765169-0-3 

Внешние ссылки [ править ]

  • Локализация FOSS в Викиучебнике
  • Мгновенно изучите тестирование локализации
  • Локализация приложений обеспечивает максимальную рентабельность инвестиций в ваше приложение
  • СМИ, связанные с интернационализацией и локализацией на Викискладе?