Таблица символов или что скрывает обычный шрифт

Основная многоязычная плоскость

Основная многоязычная плоскость. Каждая пронумерованная ячейка содержит 256 кодовых позиций.

Плоскость 0 (Основная многоязычная плоскость, англ. Basic Multilingual Plane, BMP) отведена для символов большинства современных письменностей и большого числа специальных символов. Большая часть таблицы занята идеограммами ККЯ и корейскими слогами.

В Юникоде 15.0 в этой плоскости представлены следующие блоки:

Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться от версии, проверенной 7 февраля 2023 года; проверки требуют 10 правок.

Thank you! Your submission has been received!

Oops! Something went wrong while submitting the form.

New Athena Unicode – это бесплатный многоязычный шрифт, распространяемый Американской филологической ассоциацией. Он следует стандарту Unicode ( версии 6/7 ) и включает символы для английского и западноевропейского языков, политонического греческого, коптского, древне итальянского и демотической египетской транслитерации ( и арабского транслитерации ), а также метрические символы и другие символы, используемые классическими учеными и некоторые из которых требуются средневековым и византийским. Новый Athena Unicode – это интеллектуальный шрифт, который включает в себя лигатуры OpenType, позволяющие отображать предварительно составленные комбинированные символы, не распознаваемые Unicode, но необходимые ученым.

Бесплатно для личного и коммерческого использования; SIL Open Font License 1.1 — свободная и открытая лицензия, разработанная SIL International, используется для многих свободных шрифтов у которых открыт исходный код. Все файлы, производные от файлов OFL, должны оставаться лицензированными в соответствии с OFL.

Коммерческое использование; Изменение; Распространение; Персональное использование

Ограничение ответственности; Отсутствие гарантий

Пожаловаться на лицензию

Рекомендуем для сочетания

Представляю инструмент для просмотра таблицы символов шрифта. Дополнительно в статье рассмотрены: стандарт Unicode, символы и пиктограммы некоторых блоков Unicode, комбинируемые диакритические знаки, суррогатные пары символов. Подробно описаны эмодзи – внешний вид, модификация и конструирование составных эмодзи.

Unicode

Результат.Вставить(Код1, Цел((Код – 65536) / 1024) + 55296); Результат.Вставить(Код2, (Код – 65536)%1024 + 56320);

Рендер шрифта в конкретной программе понимает (вернее, должен понимать))), что из двух последовательных кодов, суррогатной пары, надо получить один символ, найти его изображение в файле шрифта и отобразить на экране.

Таблица символов

С теорией покончено, переходим к практике. Для просмотра символов шрифта был создан специальный инструмент, приложенный к публикации.

Image

Основные функциональные возможности:

Символы с кодами, большими 65535, преобразуются в суррогатные пары:

Image

Проблемы с обработкой символов Unicode

Здесь символ U+1F47B разбивается на два: D83D и DC7B. Обратите внимание: символ выглядит как один, но строка содержит два символа! Это приводит к проблеме подсчета количества символов, сравнения строк, получения подстрок, даже перевернуть строку становится очень сложной задачей.

Суррогатные пары и специальные символы

Суррогатные пары – это не единственная особенность Unicode. Существуют специальные символы, которые могут влиять на поведение других символов – объединять или разделять символы, менять направление текста и т.д.

Так, например, символы U+202E и U+202D меняют направление текста в поле ввода:

  1. В строке 0123456789 после 3 и после 7 поменялось направление и в поле ввода отображается 0123897654.
  2. На картинке я перемещаю курсор только с помощью стрелки вправо на клавиатуре, а курсор прыгает в разные части строки, конец строки для него – между видимыми цифрами 9 и 7.

Проблемы с отправкой данных на сервер

При написании данного инструмента возникла проблема при передаче сериализованного контекста формы между клиентом и сервером. При наличии в реквизитах формы некоторых символов Unicode возникает ошибка, которую необходимо предвидеть и обрабатывать.

Чтобы избежать появления подобных ошибок, необходимо очищать потенциально опасные реквизиты перед отправкой запросов на сервер.

Исследование шрифтов в 1С

Давайте посмотрим, как поведет себя самый обычный шрифт 1С Шрифт диалогов и меню.

Эксперименты проведены в тонком клиенте 8.3.22.1709, со стандартными шрифтами Windows 11 Домашняя (Версия 22H2):

  • Возможно использовать комбинации символов, такие как буква И и символ COMBINING BREVE для написания текстов, которые не поддерживают поиск в 1С.
  • Подобные комбинации символов могут создавать забавные ситуации при работе с текстом.

Символы кириллицы не сортируются алфавитном порядке из-за особенностей кодирования, что может вызывать сложности при обработке строк.

Примеры символов в шрифте

Примеры комбинированных знаков

Примеры расположения кириллических символов

Многие языки (например арабский) рассчитаны на массовое использование комбинированных знаков - к обычным буквам добавляются штрихи, черточки и т.п.
### Красивые символы
- ![](https://infostart.ru/upload/iblock/2bd/2bdae7ba42650fdb3bb12adb247e6bbf.png)
- ![](https://infostart.ru/upload/iblock/a83/a839fc3f7dff7f12e61bf42ade3176fc.png)
- ![](https://infostart.ru/upload/iblock/740/740a6785f7f0353529e20c2585aac6cf.png)
- ![](https://infostart.ru/upload/iblock/7d1/7d1e2701a4a618670796a690285a964c.png)
- ![](https://infostart.ru/upload/iblock/3bb/3bbb68ceeec3fca4610dfee23fd2dae5.png)
- ![](https://infostart.ru/upload/iblock/577/577f18af0befc43cdff945974c8ec17c.png)
- ![](https://infostart.ru/upload/iblock/06d/06d3ce2f33834c8a130485ec7679097f.png)
- ![](https://infostart.ru/upload/iblock/259/2595285300e0c0175dea48d979cafa61.png)
- ![](https://infostart.ru/upload/iblock/729/729eb927047f012fb63db3bbb96ea665.png)
- ![](https://infostart.ru/upload/iblock/6b8/6b862037cd3c636e8f35729a8d580516.png)
- ![](https://infostart.ru/upload/iblock/177/17708b06187cd1d1d8cafe47fd322fdb.png)
- ![](https://infostart.ru/upload/iblock/4ae/4ae52f68d3e89d4762edd504f0f2fd8a.png)
- ![](https://infostart.ru/upload/iblock/d5b/d5bc99e70243146b19f0f2a5f2cc4899.png)
- ![](https://infostart.ru/upload/iblock/bbc/bbccfe423378ac42144c4c1df393e408.png)
- ![](https://infostart.ru/upload/iblock/cf7/cf738ea8c176c3dd19b53db188ce89af.png)
- ![](https://infostart.ru/upload/iblock/b86/b86a4a7d17b7b2b41851dff6e5c73de6.png)
Символы последних трех блоков, а также символы шахматных фигур вполне могут быть использованы при написании игр, в том числе на 1С.
### Эмодзи
Эмодзи - это целая технология в рамках Unicode. Представляют собой цветные или монохромные картинки. Содержатся в шрифтах:
- Windows - Segoe UI Emoji
- Android - Noto Color Emoji
- macOS/iOS - Apple Color Emoji
1С поддерживает только монохромные эмодзи, для просмотра цветных вариантов можно использовать программу BabelPad. Рендер 1С может не поддерживать полноценное отображение разновидностей эмодзи. Не все программы могут правильно отображать символы.

Эмодзи

Эмодзи, в основном, расположены в блоках плоскости 1: 1F300-1F5FF Разные символы и пиктограммы (Miscellaneous Symbols and Pictographs) и 1F900-1F9FF Дополнительные символы и пиктограммы (Supplemental Symbols and Pictographs). Как утверждает документация, эмодзи можно получить из символов блока 2600-26FF Разные символы (Miscellaneous Symbols) и 2700-27BF Dingbats (Dingbats) с помощью дополнительного символа U+FE0F VARIATION SELECTOR-16 (VS16), но у меня не получилось заметить хоть какого-то влияния этого модификатора на внешний вид.

Примечание

Чем же примечательны эмодзи? Тем, что комбинируя несколько эмодзи с использованием объединяющих символов и модификаторов можно получить новый символ.

Некоторые Примеры

  • Белый (полярный) мишка U+1F43B U+200D U+2744
  • Черный кот U+1F408 U+200D U+2B1B
  • Пиратский флаг U+1F3F4 U+200D U+2620
  • Космонавт U+1F468 U+200D U+1F680
  • Художница U+1F469 U+200D U+1F3A8
  • Фермер U+1F468 U+200D U+1F33E
  • Повар U+1F469 U+200D U+1F373

Примеры

Эти же эмодзи в цветном варианте:

  • [Вставить цветные иллюстрации]

У эмодзи можно модифицировать цвет кожи (U+1F3FB – U+1F3FF), пол (U+2640, U+2642), прическу (U+1F9B0 – U+1F9B3).

Дополнительные Примеры

  • Межрасовое рукопожатие U+1FAF1 U+1F3FF U+200D U+1FAF2 U+1F3FB
  • Скалолазка U+1F9D7 U+200D U+2640
  • Темнокожая скалолазка U+1F9D7 U+1F3FF U+200D U+2640
  • Бородатый мужчина U+1F9D4 U+200D U+2642
  • Кудрявая блондинка U+1F469 U+1F3FC U+200D U+1F9B1
  • Лысый негр U+1F9D1 U+1F3FF U+200D U+1F9B2

Семейные Отношения

  • U+1F469 U+200D U+1F91D U+200D U+1F468
  • U+1F469 U+200D U+2764 U+200D U+1F468
  • U+1F469 U+200D U+2764 U+200D U+1F48B U+200D U+1F468
  • U+1F470 U+200D U+2640
  • U+1F469 U+200D U+1F37C
  • U+1F468 U+200D U+1F469 U+200D U+1F466
  • U+1F468 U+200D U+1F469 U+200D U+1F467 U+200D U+1F466

В этих примерах используется объединяющий символ U+200D – ZERO WIDTH JOINER (ZWJ).

Примеры

  • [Вставить иллюстрации]

В 1С это тоже частично работает, только изображение монохромное:

  • [Вставить монохромные иллюстрации]

Целый класс эмодзи, к сожалению, не работает в Windows: флаги стран, составленные из букв “regional indicator symbol letter” (U+1F1E6 – 1F1FF). "RU" должен был бы превратиться во флаг России. Также не работают флаги Британского Содружества: U+1F3F4 U+E0067 U+E0062 U+E0073 U+E0063 U+E0074 U+E007F – это флаг Шотландии.

Зато работают эмодзи Keycaps:

Таблица символов или что скрывает обычный шрифт

Вместо первого символа можно использовать цифры, и символы ‘#’ и ‘*’. Видимо, они сделаны для обозначения кнопок телефона. Кстати, это единственный вид составного эмодзи, который правильно отображается и в декорации, и в табличном документе 1С.

В заключение осталось отметить:

Напомню, что тесты проводились в тонком клиенте 8.3.22.1709, со стандартными шрифтами Windows 11 Домашняя (Версия 22H2). На других платформах и ОС результаты могут быть иными.

Некоторые из прочих моих публикаций

Дополнительная идеографическая плоскость

Дополнительная идеографическая плоскость. Каждая пронумерованная ячейка содержит 256 кодовых позиций.

Плоскость 2 (Дополнительная идеографическая плоскость, англ. Supplementary Ideographic Plane, SIP) отведена для редко используемых иероглифов ККЯ.

В Юникоде 15.0 в этой плоскости представлены следующие наборы иероглифов:

Специализированная дополнительная плоскость

Специализированная дополнительная плоскость. Каждая пронумерованная ячейка содержит 256 кодовых позиций.

Плоскость 14 (Специализированная дополнительная плоскость, англ. Supplementary Special-purpose Plane, SSP) отведена для символов, используемых по особому назначению.

Третичная идеографическая плоскость

Третичная идеографическая плоскость. Каждая пронумерованная ячейка содержит 256 кодовых позиций.

Плоскость 3 (Третичная идеографическая плоскость, англ. Tertiary Ideographic Plane, TIP) содержит редко используемые китайские иероглифы, в неё также предполагается внести исторические формы китайского письма.

Дополнительная многоязычная плоскость

Дополнительная многоязыковая плоскость. Каждая пронумерованная ячейка содержит 256 кодовых позиций.

Плоскость 1 (Дополнительная многоязыковая плоскость, англ. Supplementary Multilingual Plane, SMP) отведена преимущественно для исторических письменностей, но включает также символы условных обозначений, такие как музыкальные и математические символы.

Читайте также:  Аттестация химической лаборатории нормативные документы