Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Многие почтовые клиенты теперь предлагают некоторую поддержку Unicode . Некоторые клиенты будут автоматически выбирать между устаревшей кодировкой и Unicode в зависимости от содержимого сообщения, либо автоматически [1], либо при запросе пользователя. [2]

Технические требования к отправке сообщений, содержащих символы, отличные от ASCII, по электронной почте, включают:

  • кодирование определенных полей заголовка (тема, имена отправителя и получателя, организация отправителя и имя для ответа) и, опционально, тела в кодировке передачи содержимого
  • кодирование не-ASCII символов в одном из преобразований Unicode
  • согласование использования кодировки UTF-8 в адресах электронной почты и кодах ответов ( SMTPUTF8 )
  • отправка информации о кодировке передачи контента и преобразовании Unicode, используемом для правильного отображения сообщения получателем (см. Mojibake ).

Если адрес электронной почты отправителя или получателя содержит символы, отличные от ASCII, отправка сообщения требует также их кодирования в формате, понятном почтовым серверам.

Поддержка Unicode в протоколах [ править ]

  • RFC 6531 обеспечивает механизм, позволяющий не-ASCII адреса электронной почты в кодировке UTF-8 в SMTP [3] или LMTP протокола

Поддержка Unicode в заголовке сообщения [ править ]

Чтобы использовать Unicode в определенных полях заголовка электронной почты, например, строках темы, именах отправителя и получателя, текст Unicode должен быть закодирован с использованием MIME «Encoded-Word» с кодировкой Unicode в качестве кодировки. Чтобы использовать Unicode в доменной части адресов электронной почты, традиционно необходимо использовать кодировку IDNA . В качестве альтернативы SMTPUTF8 [3] позволяет использовать кодировку UTF-8 в адресах электронной почты (как в локальной части, так и в доменном имени), а также в разделе заголовка почты. Были созданы различные стандарты для модификации обработки данных, отличных от ASCII, до первоначально использовавшегося только для ASCII протокола электронной почты:

  • RFC 2047 обеспечивает поддержку кодирования значений, отличных от ASCII, таких как настоящие имена и строки темы в заголовке электронной почты [4]
  • RFC 5890 обеспечивает поддержку кодирования доменных имен, отличных от ASCII, в системе доменных имен [5]
  • RFC 6532 позволяет использовать UTF-8 в разделе заголовка сообщения [6]

Поддержка Unicode в теле сообщений [ править ]

Как и для всех кодировок, кроме US-ASCII , при использовании текста Unicode в электронной почте необходимо использовать MIME , чтобы указать, что для текста используется формат преобразования Unicode.

UTF-7 , устаревшая кодировка, имела преимущество перед кодировками Unicode в устаревших сетях, отличных от 8-битных, в том, что не требовала кодирования передачи для соответствия семибитным ограничениям устаревших почтовых серверов Интернета. С другой стороны, UTF-16 должен быть закодирован для передачи, чтобы соответствовать формату данных SMTP. Хотя это и не обязательно, UTF-8 обычно также кодируется для передачи, чтобы избежать проблем на семибитных почтовых серверах. Кодировка передачи MIME UTF-8 делает его либо нечитаемым как простой текст (в случае base64 ), либо, для некоторых языков и типов текста, сильно неэффективным по размеру (в случае цитируемого печатного текста ).

Некоторые форматы документов, такие как HTML , PostScript и Rich Text Format, имеют свои собственные 7-битные схемы кодирования для символов, отличных от ASCII, и поэтому могут быть отправлены без использования каких-либо специальных кодировок электронной почты. Например, электронная почта HTML может использовать объекты HTML для использования символов из любого места в Юникоде, даже если исходный текст HTML для электронного письма имеет устаревшую кодировку (например, 7-битный ASCII). Подробнее об этом см. Unicode и HTML .

См. Также [ править ]

Ссылки [ править ]

  1. ^ "страсть к путешествиям / апель" . GitHub . Проверено 5 сентября 2018 .
  2. ^ «Настройка Outlook для использования UTF-8» . Проверено 5 сентября 2018 .
  3. ^ а б Цзянькан, Яо; Вэй, Мао. «Расширение SMTP для интернационализированной электронной почты» . tools.ietf.org . Проверено 5 сентября 2018 .
  4. ^ Мур, Кейт. «MIME (многоцелевые расширения почты Интернета), часть третья: расширения заголовков сообщений для текста, отличного от ASCII» . tools.ietf.org . Проверено 5 сентября 2018 .
  5. ^ Кленсин, Джон К. «Интернационализированные доменные имена для приложений (IDNA): определения и структура документов» . tools.ietf.org . Проверено 5 сентября 2018 .
  6. ^ Абель, Ян; Шон, Стил. «Интернационализированные заголовки электронной почты» . tools.ietf.org . Проверено 5 сентября 2018 .

Внешние ссылки [ править ]

  • Бесплатные шрифты, редакторы и документация SIL