WikiProject Computing | |
Ссылки на таблицу символов
Для диаграмм символов Unicode вернул URL-адрес с http://www.unicode.org/charts/normalization/ обратно на http://www.unicode.org/charts/ . Диаграммы нормализации отображают символы только в том случае, если у вас уже установлен шрифт, и они не кажутся такими полными, как полные диаграммы, доступные по другому URL-адресу. - Нейт, 15:37, 7 марта 2003 г. (UTC)
Десятичное или шестнадцатеричное
Хм, я не был уверен, действительно ли было более "интуитивно понятным" использовать десятичные числа вместо шестнадцатеричных. Я имею в виду, что обе альтернативы скрывают символ, и аргумент о том, что «старые веб-браузеры» не могут анализировать шестнадцатеричное, является спорным IMO, поскольку в этих веб-браузерах в любом случае будут проблемы с не-8-битными символами. Я чувствовал, что NPOV будет диктовать, что в HTML могут использоваться как шестнадцатеричные, так и десятичные числа, поэтому я изменил это. Djmutex 10:51 2 мая 2003 г. (UTC)
Официальный "набор символов"
Во вступлении говорится: HTML 4.0 использует Unicode в качестве официального набора символов.
Есть ли у кого-нибудь ссылка на то место в спецификации, где это указано? - Хирзель
- Раздел 5.1. Использование термина «набор символов» вводит в заблуждение, потому что он слишком перегружен, но он точен. Документ HTML должен состоять из символов Юникода. Эти символы, в свою очередь, кодируются (как iso-8859-1, utf-8 и т. Д.). Сегодня я добавил в статью текст, чтобы прояснить этот момент. - mjb 23:48, 19 августа 2004 г. (UTC)
- Я считаю, что это утверждение неверно. Если я правильно понимаю http://www.w3.org/TR/html401/charset.html#encodings , в нем явно указано, что кодировки "по умолчанию" не существует. Вместо этого «соответствующие пользовательские агенты» должны иметь возможность отображать любой HTML-документ в Unicode (например, для поддержки всех определенных именованных HTML-сущностей) и могут применять эвристику к HTML-документу, если кодировка не указана явно (либо в заголовке HTTP , или тег META, или атрибут "charset" для определенного элемента.) - djmutex 21:20 10 июня 2003 г. (UTC)
- Что касается меня, то утверждение на самом деле не ошибочное, но может ввести в заблуждение. Все символы Unicode должны поддерживаться браузером, но не существует набора символов "по умолчанию". В результате Unicode является «официальным» набором символов, но не по умолчанию. djmutex 21:23, 10 июня 2003 г. (UTC)
- Ну, вроде как, но не совсем. Возникает путаница из-за неудачного использования перегруженного термина «набор символов» и вашего очевидного непонимания того, что Unicode сам по себе является кодировкой в том же смысле, что и «набор символов» (это не так).
- Документы HTML действительно всегда состоят из символов Юникода, но символы Юникода являются абстрактными концепциями: просто «идея» единицы в системе письма, сопоставленная с таким же абстрактным понятием неотрицательного целого числа, его «кодовой точкой». . Документ HTML или XML определяется как последовательность таких символов и, следовательно, сам является абстрактным объектом. Только тогда, когда документ проявляется как последовательность битов / байтов в сети, на диске или в памяти, с ним связана кодировка. Кодирование преобразует символы / кодовые точки в последовательности битов. Вы правы в том, что кодировки по умолчанию нет, по крайней мере, в самой спецификации HTML, но в зависимости от того, как передается документ, по умолчанию может быть us-ascii или iso-8859-1 (RFC 2616 и 3023 обращаются к этому тема). Я несколько изменил статью, чтобы объяснить это, не вдаваясь в подробности; есть статьи, посвященные этим темам, и нам не нужно их здесь подробно повторять. - mjb 23:48, 19 августа 2004 г. (UTC)
Отображение Unicode в Windows MSIE
- Некоторые многоязычные веб-браузеры, которые динамически объединяют необходимые наборы шрифтов по запросу, например, Microsoft Internet Explorer 5.0 и выше в Windows или Mozilla / Netscape 6 и выше кросс-платформенных, способны отображать все символы Unicode на этой странице одновременно после загружаются соответствующие «пакеты поддержки текстового дисплея». MSIE 5.5 будет подсказывать пользователям, нужен ли новый шрифт, с помощью функции «установка по запросу».
Все символы в таблице отображаются правильно в Safari и Firefox на моем Mac (отчасти благодаря шрифтам Code2000 и Code2001). Но моя стандартная установка Windows XP не показывает последние шесть букв в MSIE 6.0 или Firefox 1.0 и не предлагает мне что-либо делать. Вышеупомянутый отрывок неверен, или что-то не так с моей Windows или проводником? - Майкл З. 00:35, 2005 20 января (UTC)
Что такое «пакет поддержки текстового дисплея». Эта фраза не появляется в Интернете, кроме этой страницы. - Майкл З. 14:20, 2005, 20 января (UTC)
- В предложении статьи только сказано, что браузеры могут переключаться между шрифтами, если они установлены . Полагаю, в вашей стандартной системе XP недостаточно или не хватает нужных шрифтов.
- Также обратите внимание, что метод, который Mozilla переключает, более гибкий. При необходимости он переключит один отсутствующий диакрический символ на другой шрифт. Уродливо, но лучше, чем ничего. См. Статью Nirvana для примеров.
- Насчет точного значения "" я сам задаюсь вопросом.
- Pjacobi 21:47, 2005 20 января (UTC)
- Я все еще не понимаю этот отрывок. Редактировал страницы с символами старой кириллицы и IPA . Пользователи Windows жалуются, что не могут видеть некоторые символы, если мы не поместим их в с Arial Unicode MS в качестве первого выбора шрифта. Символы поддерживаются шрифтом, присутствующим в Windows, но я не вижу ни «динамического слияния по запросу», ни запроса «установить по запросу». Я бы переписал описание, но я мало знаю о Windows, и, возможно, первоначальный автор знает что-то, чего я не знаю.
- В статье о Nirvana MSIE / Win показывает а-макроны. Firefox / Win также показывает n-точки и m-точки, но шрифт, похоже, отлично сочетается с остальной частью страницы. Оба браузера Mac показывают все это, плюс китайский язык. Но на Mac n-точка не выделяется жирным шрифтом там, где она должна быть - как в методе Moz, который вы описываете.
- - Майкл З. 00:45, 21 января 2005 г. (UTC)
- AFAIK «динамическое переключение шрифтов» в MSIE - это только поиск диапазонов кода и языков для поиска. Шрифты, которых нет в этих таблицах поиска, никогда не рассматриваются для отображения. Теперь, если плохой фрагмент текста сопоставлен с шрифтом X этими таблицами MSIE, все кодовые точки, не охваченные X, просто не будут отображаться! Итак, для плохого решения этой проблемы пользователям MSIE нужен явный тег шрифта.
- В отличие от этого, Mozilla переключается в зависимости от наличия кода в шрифте. У меня довольно простой набор шрифтов по умолчанию, и b-точки и dm-точки в Nirvana отображаются в также установленном Code 2000 от Moz.
- Пьякоби 08:50, 2005 21 янв (UTC)
- Итак, MSIE / Win просто выбирает шрифты на основе кодировки страницы или указанного языка? Учитывает ли он атрибуты lang в DIV, SPAN или других элементах?
- Напротив, Moz выбирает шрифты на основе каждого символа на странице. Как только я это выясню, я перепишу этот абзац, потому что поведение двух браузеров определенно нельзя описать как одно и то же. - Майкл З. 21 января 2005, 17:32
- Это все еще немного догадок, поэтому необходимы некоторые тесты или действительно знающий источник. Моя текущая гипотеза: MSIE / Win может смешивать разные шрифты на странице, используя явные шрифты и (я полагаю, теги lang). И (ИМХО) он смотрит на фактические символы, но не для того, чтобы найти шрифт, действительно включающий их (я бы сказал, что он никогда не спрашивает шрифт, какие символы он поддерживает), а только для переключения на правильный «блок». Китайский символ переключит его на шрифт, настроенный для китайского (не глядя, действительно ли этот символ включен), но m-underdot, если вообще, переключается только на стандартный шрифт Unicode. Извините за путаницу, но, по крайней мере, я не запрограммировал это. - Пьякоби, 22:52, 21 января 2005 г. (UTC)
«IE5 был первым, кто использовал глифы из« лучших доступных »шрифтов»
Mjb, я не знаю, как это называет Microsoft, но он не выбирает правильные шрифты для отображения всех символов на странице, как это делают другие современные браузеры.
Вы заметите, что во многих местах редакторы Википедии добавили код, например, style="font-family:Arial Unicode MS, Lucida Sans Unicode, sans-serif;"
в таблицы, отображающие символы Юникода. Нам пришлось разработать Template: IPA ( документация ) и Template: Polytonic для отображения IPA и политонических греческих символов в MSIE. Все это хаки, нацеленные только на MSIE в Windows. В стандартной системе Mac или Windows необходимые шрифты присутствуют, и Safari и Firefox отображают все эти символы. Но MSIE отображает маленькие квадратики, если только веб-авторы не догадаются, какие шрифты могут быть в системе, и не укажут их в каждом случае появления этих символов Unicode.
Пример: некоторые символы IPA и непонятные символы кириллицы. Обе строки выглядят одинаково в стандартной системе Mac OS X или Windows XP в Firefox или Safari. В проводнике в верхней строке отображаются квадраты; вторая строка работает, потому что Template: IPA явно указывает ему использовать шрифт Lucida Unicode MS.
без форматирования:
ѫ ѣ ʃ ʒ
в шаблоне: IPA:
ѫ ѣ ʃ ʒ
- Майкл З. 31.01.2005, 07:22 Z
- Привет. Да, я вижу, что у IE проблемы с неформатированным текстом в вашем примере.
- Я основывал свое утверждение на упоминании «связывания шрифтов» в этой статье, представленной на 16-й Международной конференции Unicode в 2000 году: Новые международные возможности Internet Explorer . Я не исследовал этот вопрос, но похоже, что IE имеет по крайней мере некоторую поддержку в этом отношении, и имеет ее в менее эффективной форме со времен IE 4.0.
- Немного исследуя только что, я нашел другое описание технологии: «Связывание шрифтов - это, по сути, технология, которую Internet Explorer использует для одновременного отображения символов нескольких языков на одной странице. Так, например, вы можете использовать японский и Китайский, корейский, арабский, деванагари и любой набор символов, который вы хотите, все на одной странице. И в Интернете есть несколько интересных страниц, которые на самом деле демонстрируют эту возможность. Что делает Internet Explorer, так это поиск определенных шрифтов в операционной системе. системы, которые поддерживают эту возможность, называемую связыванием шрифтов. Это означает, что эти шрифты имеют возможность, если символ не находится в текущем шрифте, иметь возможность искать символ и связанный с ним шрифт. Так, например, вы могли настройте отображение страницы на японский язык и установите шрифт Mincho, популярный японский шрифт. Теперь предположим, что у вас есть корейский язык на той же странице. Из-за того, как Internet Explorer обрабатывает это, и как я t отключив эту возможность связывания шрифтов, он может определить, что корейские символы не входят в шрифт Mincho, но он может получить ссылки на корейский шрифт, который будет обрабатывать эти символы. Итак, если вы посмотрите страницу с японским и корейским языками, вы увидите, что японская страница использует шрифт Mincho, а корейская часть страницы будет использовать GulimChe или другой корейский шрифт » [1].
- Это делает его идеальным и скорее автоматическим, не так ли? Фактически, в моей системе с IE6 в Windows XP SP2 у меня нет проблем с отображением этой тестовой страницы . Из этого я бы сделал вывод, что IE делает то же самое, что и другие браузеры; другие, видимо, просто делают это лучше или «тщательнее». Кому-то придется провести дополнительные исследования, чтобы определить причуды встроенного связывания шрифтов IE. Во всяком случае, я не думаю, что было правильным утверждать, что IE вообще этого не делает, в то время как другие делают.
- Различные другие ссылки, которые я нашел через Google, звучат так, как будто "связывание шрифтов" - это то, что можно также сделать при кодировании собственных приложений (на основе браузера или автономных), написав сценарий COM-объекта, специфичного для IE (MLang), чтобы отображать многоязычный текст [2] . - mjb 02:34, 1 февраля 2005 г. (UTC)
- У меня есть стандартная система XP для тестирования веб-сайтов, и я загрузил эту тестовую страницу в свои браузеры. Ни один из них не отображал кандзи или ханкаку, предположительно потому, что я не добавил шрифтов в систему. Firefox отображал три строки с меткой Romanj, но в MSIE 6 и Opera 7.5 отображались только квадраты.
- MSIE 6 опережает Netscape 4 в том, что он может отображать Unicode из нескольких кодировок на одной странице. Но я еще не видел ни одного случая, когда он выбирает шрифт, отличный от того, который указан на веб-странице (я признаю, что при очень небольшом тестировании). Мне любопытно узнать, как работает связывание шрифтов. Но в то же время, с точки зрения отображения блоков с несколькими Unicode, это единственный браузер, для которого мне нужно проделать дополнительную работу (как и с точки зрения рендеринга CSS). - Майкл З. 1 февраля 2005 г., 04:27 Z
- Вы имеете в виду Unicode из нескольких скриптов (систем письма). Да, мне это тоже интересно. Как я уже сказал, «у меня работает», но у меня установлена поддержка японского языка. (Панель управления> Язык и региональные стандарты> Языки> Установочные файлы для языков Восточной Азии).
- В «Romanj» ( ромадзи , я думаю , что это должно быть ... Я уверен , что есть лучшие примеры страницы там) строки используют символы из Дальневосточных Полноширинного форма (U + FF01 до U + FFE5 или около того ), которые находятся в Adobe Список Glyph . Вы могли бы подумать, что вполне вероятно, что у вас будет шрифт, который их поддерживает, но, возможно, нет. Возможно, вы этого не сделаете, и Firefox вместо этого «обманывает», подставляя глифы, которые в файлах шрифтов фактически сопоставлены с диапазоном Latin-1.
- Для целей статьи, я думаю, нам следует полностью прекратить называть и сравнивать браузеры, чтобы не углубляться в вопросы защиты / точки зрения, а также потому, что заявления о текущих возможностях популярных браузеров в целом не имеют большого срока годности. Вместо этого, я думаю, мы должны просто признать, что одновременное отображение символов из разных скриптов зависит от установленных пользователем шрифтов и подвержено другим технологическим ограничениям (например, консольные браузеры даже не имеют доступа к шрифтам), поэтому естественно , браузеры, включая самые популярные, почти неизбежно будут иметь различные уровни поддержки. - mjb 06:17, 1 февраля 2005 г. (UTC)
- Хорошие моменты. Я просто реагировал на несколько утверждений в статье и даже не думал о том, чтобы писать здесь по-настоящему. Вы правильно поняли: срок годности некоторых браузеров истек.
- Интересно, что в Lynx (браузере) есть потрясающий движок транслитерации. Вы можете просматривать все виды страниц Unicode. Он неплохо справляется с отображением кириллицы и даже IPA латинскими буквами. Я считаю, что он также поддерживает прямой Unicode, я думаю, но мне не удалось правильно настроить свой. - Майкл З. 1 февраля 2005 г., 07:45 Z
- не выбрасывайте информацию с помощью POV. Нам нужно придерживаться фактов, и мы должны квалифицировать эти факты с помощью номеров версий. Не помогает то, что IE чертовски непредсказуем (т.е. я сделал по крайней мере одну страницу, которая сломалась в IE для меня, но не для других людей.
- Я предполагаю, что IE использует другие шрифты из указанных при рендеринге глифов, но ТОЛЬКО путем сопоставления определенных кодовых точек с конкретными шрифтами, а не путем поиска шрифта, который может отображать символы, которые он хочет. Это вполне может быть конфигурация, управляющая этим, но если есть, я не знаю где. Plugwash 19:54, 14 июля 2005 г. (UTC)
- Я еще немного покопался и думаю, что на самом деле он смотрит на другие шрифты. Проблема в том, что эти другие шрифты должны быть явно связаны с текущим базовым шрифтом в реестре (ищите ключ, содержащий «FontLink», например HKEY_LOCAL_MACHINE \ SOFTWARE \ Microsoft \ Windows NT \ CurrentVersion \ FontLink \ SystemLink). Это может быть вопрос осторожного использования языковых тегов в HTML, чтобы убедиться, что выбран хороший базовый шрифт, а затем наличия правильных сопоставлений в реестре, чтобы связать этот шрифт со шрифтами, которые нужно использовать. Но есть еще некоторые нюансы в выборе базового шрифта, которые я не понимаю. Любой, у кого больше опыта в этой области, прокомментируйте! - mjb 20:56, 14 июля 2005 г. (UTC)
- Я предполагаю, что IE использует другие шрифты из указанных при рендеринге глифов, но ТОЛЬКО путем сопоставления определенных кодовых точек с конкретными шрифтами, а не путем поиска шрифта, который может отображать символы, которые он хочет. Это вполне может быть конфигурация, управляющая этим, но если есть, я не знаю где. Plugwash 19:54, 14 июля 2005 г. (UTC)
- не выбрасывайте информацию с помощью POV. Нам нужно придерживаться фактов, и мы должны квалифицировать эти факты с помощью номеров версий. Не помогает то, что IE чертовски непредсказуем (т.е. я сделал по крайней мере одну страницу, которая сломалась в IE для меня, но не для других людей.
Это звучит многообещающе: согласно IEBlog , Центр передовых технологий Microsoft в Пекине работает над улучшением связывания шрифтов и откатом для IE7. - mjb 08:22, 26 сентября 2005 г. (UTC)
Редактирование форм и кодирование
Верно ли, что только браузеры на основе Mozilla конвертируют символы - не указанные в кодировке по умолчанию - в объекты Unicode? Разве не следует об этом упомянуть в статье? - Хильшер, 09:32, 27 марта 2005 г. (UTC)
- в firefox я знаю, что могу просто вставить символы за пределами latin1, и они останутся объектами. Я просто попытался сделать то же самое в IE, и он , похоже, преобразовал его в объект (хотя не исключено, что это был взлом, выполненный mediawiki, а не IE, делающий правильные вещи.
Группы сущностей персонажей
Хотя верно, что сущности символов разделены на 3 группы, это не помогает читателю понять взаимосвязь между Unicode и HTML, чтобы объяснить им это. Группы в основном произвольны и существуют как исторические артефакты из процессов стандартизации, которые использовались для их определения (я приложил руку к этому, хотя и очень незначительно). Если требуется пояснение группировок, лучше всего основывать их на комментариях из файлов .ent, которые переходят на более точный уровень детализации, согласованный с именами диапазонов Unicode.
Я также устал убирать правки, которые, хотя и являются подробными, имеют очень разговорный, а не энциклопедический тон и изобилуют орфографическими, заглавными, пунктуационными и грамматическими ошибками. Если я и дальше буду их видеть, я с большей вероятностью открою их сразу, независимо от того, какой полезный контент они могут включать. Извините за грубость, но у меня такое ощущение, что некоторые чрезмерно используют готовность других исправить эти ошибки. - mjb 19:45, 14 июля 2005 г. (UTC)
Те же персонажи?
Является ли символ, закодированный номером HTML, тем же самым символом, который закодирован таким же номером Unicode? Например, является ли номер символа 2343 в HTML тем же самым, что и 2343 в Юникоде? - Абдул, 14:31, 19 августа 2005 г. (UTC)
- Да, это так, по определению (HTML не определяет значение номеров символов; вместо этого он полагается на юникод). - cesarb 15:36, 19 августа 2005 г. (UTC)
- да, числа относятся к кодовым точкам Unicode. Однако большинство html-сущностей являются десятичными (вы можете использовать шестнадцатеричные, но их не так много), в то время как Unicode обычно использует шестнадцатеричный код при обращении к кодовым точкам. Plugwash 16:30, 19 августа 2005 г. (UTC)
- Есть ли какая-либо ссылка, чтобы узнать, с какой версии каждый браузер поддерживает шестнадцатеричные объекты, а какие браузеры все еще не поддерживают его? Поскольку шестнадцатеричный формат настолько естественен, когда так много средств просмотра карт диаграмм предоставляют только шестнадцатеричный код Юникода … Lacrymocéphale —Предыдущий комментарий без знака добавлен 217.195.19.145 ( доклад ) 13:02, 3 июня 2008 г. (UTC)
Я не хочу использовать этот шрифт!
Некоторые веб-браузеры, такие как Mozilla Firefox, Opera и Safari, могут отображать многоязычные веб-страницы, разумно выбирая шрифт для отображения каждого отдельного символа на странице. Они будут правильно отображать любое сочетание блоков Unicode, если в операционной системе присутствуют соответствующие шрифты.
Code2000 - отличный шрифт с большим количеством символов, но некоторые символы очень плохо похожи на Code2000, например, символы IPA . После установки Code2000 на мою Windows XP Mozilla Firefox всегда использует Code2000 для каждого специального символа, который должен отображаться. Как мне указать Firefox использовать другой шрифт для IPA? Собственно, как Firefox решает, какой шрифт использовать для специальных символов, если можно выбрать четыре разных шрифта? - Абдул, 14:31, 19 августа 2005 г. (UTC)
- попробуйте разместить сообщение на форуме Mozilla, и вы, вероятно, получите там лучшую поддержку. Plugwash 21:19, 19 августа 2005 г. (UTC)
Комбайнеры
Можно ли выразить комбайнеры в экранированном HTML? Например, 0041 + 0308-207.109.251.117 03:43, 4 ноября 2005 г. (UTC)
- конечно, а почему бы и нет? Plugwash 00:25, 16 ноября 2005 г. (UTC)
Internet Explorer
На странице написано: «Internet Explorer может отображать полный диапазон символов Unicode, но не может автоматически выбрать необходимый шрифт. Авторы веб-страниц должны угадать, какие соответствующие шрифты могут присутствовать в системах пользователей, и указать вручную. их для каждого блока текста с другим языком или диапазоном Unicode. У пользователя может быть установлен другой шрифт, который будет отображать некоторые символы, но если автор веб-страницы не указал его, то Explorer не сможет отобразить их и отобразить заполнитель квадраты ". Каков правильный выбор шрифта и как бы вы его изменили? (У меня есть Internet Explorer, я просматриваю множество математических страниц в Википедии и вижу множество «квадратов-заполнителей».) - SurrealWarrior 01:33, 4 декабря 2005 г. (UTC)
Поддержка браузера - сущности или нет?
Есть ли разница в поддержке браузером, например,
- Символ X представлен как именованный / числовой объект (
mdash, #8211
) по
сравнению с - Символ X как фактический символ utf-8 в HTML-документе с кодировкой utf-8 правильно обслуживается?
- Не с любым современным браузером, но я думаю, что NS4 может вести себя странно по этому поводу. Большинство оставшихся проблем с поддержкой Unicode в браузере связано с выбором шрифта и отображением сложного текста. Plugwash 17:44, 12 февраля 2006 г. (UTC)
А как насчет IE 7?
Я заглядывал на эту страницу, потому что мне было интересно, есть ли в новом IE 7 еще одна досадная ошибка, связанная с невозможностью выбрать подходящий шрифт. Однако на странице упоминается только IE 6. Кто-нибудь может проверить, как это работает в IE 7? Спасибо.
Худший письменный документ, с которым я когда-либо сталкивался
Это, безусловно, худший документ, с которым я когда-либо сталкивался. Я не скажу, что это греческий, потому что я могу читать по-гречески, это полная чушь. Сказать, что HTML-страница является Unicode, все равно что сказать, что кошка - это собака. Я создаю html-страницы с помощью блокнота и знаю, что мои html-страницы могут иметь только очень ограниченный набор символов. В какой момент 8-битное кодирование моего документа превращается в битовое кодирование, необходимое для юникода? Или Unicode означает «любой символ, определяемый числом», как кажется, определение, используемое в первом абзаце.
Я собирался сделать все это намного более читабельным, просто удалив весь первый абзац и сделав его бесполезным для всех, кроме тех, кто хочет посмеяться. —Предыдущий неподписанный комментарий добавлен 79.79.206.183 ( обсуждение ) 11:19, 23 октября 2008 г. (UTC)
- Unicode определяет (большой) набор чисел, известный как «кодовые точки», и символы, которые они представляют (обратите внимание, однако, что в некоторых случаях кодовые точки Unicode не имеют сопоставления 1: 1 с видимыми пользователем символами из-за наличия комбинирования и управления символы).
- Когда вы пишете HTML-документ, вы должны * указать, какую "кодировку" вы используете. Эта кодировка определяет, как интерпретируется последовательность байтов в вашем HTML-файле.
- Ключом к пониманию взаимосвязи между юникодом и HTML является понимание того, что HTML рассматривает все кодировки как кодировки подмножества юникода. Если вы пишете свои html-документы в WINDOWS-1252, тогда вы можете напрямую представлять только символы, которые есть в WINDOWS-1252, но вы все равно можете косвенно представлять любой символ Юникода через ссылку на сущность. В качестве альтернативы вы можете написать свой HTML-документ в UTF-8 и напрямую представлять почти все символы **.
- * если вы не укажете, какую кодировку вы используете, браузер, скорее всего, сделает предположение по умолчанию, которое может или не может совпадать с кодировкой, которую вы фактически использовали.
- ** Некоторые символы (которые немного различаются в зависимости от контекста) не могут быть представлены напрямую, потому что они "чувствительны к разметке".
- - Plugwash ( обсуждение ) 01:35, 17 февраля 2012 г. (UTC)
юникод (UTF-8): около 50% Интернета в 2010 г.
Похоже, что юникод (UTF-8) составляет около 50% Интернета в 2010 году (Источник: http://3.bp.blogspot.com/_7ZYqYi4xigk/S2Hcx0fITQI/AAAAAAAAFmM/ifZX2Wmv40A/s1600-h/unicode.png и http : //googleblog.blogspot.com/2010/01/unicode-nearing-50-of-web.html ) - Предыдущий неподписанный комментарий добавлен 84.99.17.74 ( обсуждение ) 20:30, 13 июня 2011 г. (UTC)
- 60% и 80% с ASCII в 2012 г. http://googleblog.blogspot.com/2012/02/unicode-over-60-percent-of-web.htmlhttp://googleblog.blogspot.com/2012/02/unicode -over-60-percent-of-web.html - Предыдущий неподписанный комментарий добавлен 86.69.108.41 ( обсуждение ) 23:53, 16 февраля 2012 г. (UTC)
В разделе « Частота использования» говорится, что «кодировка Unicode UTF-8 стала наиболее часто используемой кодировкой на веб-страницах, обогнав как ASCII (США), так и 8859-1 / 1252», что является цитатой из процитированной страницы Google. Но в этом нет никакого смысла, учитывая, что ASCII является подмножеством UTF-8. Я предполагаю, что, возможно, автор Google имел в виду указанную кодировку страниц, кто-нибудь знает? (Старый сейчас, я знаю ...) Максуэлл ( разговор ) 01:13, 23 апреля 2021 (UTC)