Share
/tools/text-unicode-entities-convertor.php
Unicode - це стандарт обчислювальної галузі для послідовного кодування, представлення та обробки тексту, вираженого в більшості світових систем письма. Розроблена спільно зі стандартом Universal Character Set і опублікована в книжковій формі як Unicode Standard, остання версія Unicode складається з репертуару з більш ніж 109 000 символів, що охоплюють 93 скрипти, набір кодових діаграм для візуальної довідки, методології кодування та набору стандартних кодування символів, перерахування властивостей символів, таких як верхній і нижній регістр, набір довідкових даних комп'ютерних файлів, і ряд пов'язаних елементів, таких як властивості символів, правила нормалізації, розкладання, зіставлення, рендеринга і двонаправленого відображення порядку (для правильного відображення текст, що містить як сценарії справа наліво, такі як арабська та іврит, так і сценарії зліва направо). Станом на 2011 рік, найновішим основним переглядом Unicode є Unicode 6.0. Консорціум Unicode, некомерційна організація, яка координує розвиток Unicode, має амбітну мету в кінцевому підсумку замінити існуючі схеми кодування символів Unicode та його стандартні схеми Unicode Transformation Format (UTF), оскільки багато існуючих схем обмежені за розміром та обсягом і несумісні з багатомовними середовищами. Успіх Unicode у об'єднанні наборів символів призвів до його широкого та переважного використання в інтернаціоналізації та локалізації комп'ютерного програмного забезпечення. Стандарт був реалізований в багатьох останніх технологіях, включаючи XML, мову програмування Java, Microsoft .NET Framework і сучасні операційні системи. Юнікод може бути реалізований різними кодуваннями символів. Найбільш часто використовуваними кодуваннями є UTF-8 (який використовує один байт для будь-яких символів ASCII, які мають однакові значення коду як в кодуванні UTF-8, так і в ASCII, і до чотирьох байтів для інших символів), застарілий UCS-2 (який використовує два байти для кожного символу, але не може кодувати кожен символ в поточному Стандарт Unicode), і UTF-16 (який розширює UCS-2 для обробки кодових точок за межами UCS-2).
Source:
Wikipedia
AKA:
Ключові слова: текст, HTML, сутності, конвертер, кодування, символи, екранування, декодування, unescape, unescape, unicode, utf8, ascii
|