КомпјутериИнформатичката технологија

Encoding "Уникод": карактер кодирање стандард

Секој корисник на Интернетот, во обид да се постави еден или на друг на својата функција барем еднаш видов на екранот напишани со латинични букви зборот "Уникод." Што е тоа, ќе научите со читање на овој член.

дефиниција

Encoding "Уникод" - знаци стандард. Тоа беше предложен од Unicode АД непрофитна организација во 1991 година. Стандардот е дизајниран за да ги собере на најголем можен број на различни типови на карактери во документот. Страница, која е формирана врз основа на него, може да содржи букви и карактери од различни јазици (од руски на корејски) и математичките знаци. Во овој случај, сите ликови во карактер сет се прикажани без никакви проблеми.

Причините за создавање на

Еднаш, многу одамна, долго пред појавата на еден систем "Уникод" кодирање е избран врз основа на параметри на авторот на документот. За оваа причина, често да се чита документ, тоа е потребно да се користи различни маси. Понекогаш е потребно да се направи неколку пати, што во голема мера го отежнува животот на просечниот корисник. Како што веќе рековме, решението на овој проблем во 1991 година беше поканет во уникод АД организација непрофитна да понуди нов тип на кодирање на карактери. Таа е дизајнирана да се комбинираат застарени и различни стандарди. "Уникод" - го кодирањето дека ozvolila постигне незамисливо во времето: да се создаде алатка која го поддржува голем број на карактери. Резултатот надмина многу очекувања - имаше документи истовремено содржи и англиски и руски текст, латински и математички изрази.

Но, создавањето на единствен кодирање претходи потребата за решавање на голем број на проблеми кои се појавиле како резултат на огромниот спектар на веќе постоечките стандарди во тоа време. Најчестите од нив:

  • Elvish писмена форма, или "глупост";
  • ограничувањата на карактер сет;
  • Проблемот се трансформира кодирања;
  • фонт дуплирање.

Мали историски excursus

Замислете дека 80-дворот. Компјутерски хардвер не е толку честа појава и има форма поинаква од денес. Додека секој оперативен систем е уникатен и префинет специфичните потреби на секој ентузијаст. Потреба за размена на информации се претвора во дополнителни rework сè. Обидувајќи се да се чита документ изработен од страна на друг оперативен систем, често се прикажува чуден збир на знаци, и играта започнува со кодирање. Тоа не секогаш го направи тоа брзо, а понекогаш и потребните документи може да се отвори во шест месеци, па дури и подоцна. Луѓето кои често се разменат информации, да се создаде за себе и табела за конверзија. А потоа работи на нив покажуваат интересен детал: на потребата да ги создаде во две насоки ", од мојот во вашиот" и назад. Направете банални инверзија компјутерска машина не може, за тоа во десната колона на изворот, а левата - резултат, но не и обратно. Ако видите на потребата да се користат специјални карактери во документот, тие мораа да се додаде, а потоа друг, и да им се објасни на партнер што тој треба да направите за да овие ликови не стане "глупост". И да не заборавиме дека за секој кодирање мораше да се развие или спроведување на нивните сопствени фонтови, што доведе до создавање на голем број на дупликати во оперативниот систем.

Замисли си уште дека фонтовите на страницата, ќе видите 10 парчиња на идентични Times New Roman со мала забелешка: за UTF-8, UTF-16, ANSI, UCS-2. Сега ви е јасно дека развојот на универзалните стандарди беше императив?

"Основачите на креаторите на"

Потеклото на создавање на Уникод да се најде во 1987 година, кога Dzho Bekker од Xerox, заедно со Ли Колинс и Марк Дејвис од Apple започна истражување во областа на практичната создавање на една универзална карактер сет. Во август 1988 година, Dzho Bekker објави нацрт-предлог за создавање на 16-битна мулти-јазична меѓународен систем за кодирање.

Неколку месеци подоцна Unicode беше работна група се прошири и Кен Вистлер и Мајк Kernegana од RLG, Глен Rayt на Sun Microsystems и неколку други специјалисти, овозможувајќи им на завршување на работата на првичните формирање на заеднички кодирање стандард.

општ опис

Уникод врз основа на концептот на симболот. Според оваа дефиниција се однесува на апстрактен феномен кој постои во одредена форма на пишување и реализира преку графемата (нивната "портрети"). Секој лик е дадена во "Уникод" единствен код припаѓаат на одредена единица стандард. На пр графемата Б е исто така на англиски јазик и руската азбука, но тоа одговара на Уникод 2 различни карактери. Тие се предмет на конверзија во мали букви, т. Е., од кои секоја опишува клучните база на податоци, збир на својства и полно име.

Предности на Уникод

Од другите современици кодирање "Уникод" Постои огромен фонд на знаци за "енкрипција" знаци. Фактот дека неговите претходници 8 бита, која е поддржана од 28 карактери, но новиот дизајн беше веќе 216 карактери, тоа беше голем чекор напред. Ова им овозможи кодираат речиси сите постоечки и заеднички азбуки.

Со доаѓањето на "Уникод", веќе не треба да се користи табела на конверзија: како единствен стандард тоа само негира потребата за нив. Слично на тоа, тие имаат потонат во заборав, а "глупост" - единствен стандард ги направи невозможно, како и владеењето на потребата да се создаде дупликат фонтови.

развој на Уникод

Се разбира, напредокот не е на место, а од првата презентација помина за 25 години. Сепак, charset "Уникод" упорно држи својата позиција во светот. На многу начини ова беше овозможено благодарение на фактот дека тоа стана лесно да се имплементираат и да се шири, се признати програмери на комерцијален (платени) и софтвер со отворен код.

Ние не треба да се верува дека денес го гледаме истиот код "Уникод", како што четвртина од пред еден век. Во моментов, тоа беше заменет од страна на верзија 5.h.h, а бројот на кодирани симболи се зголеми на 231. На можноста за користење на поголема маргина марки одби да се уште ги одржуваат поддршка за Уникод-16 (кодирање, каде што максималниот износ на нивниот ограничен број 216). Од своето основање и до верзија 2.0.0 "Уникод Стандард" го зголеми бројот на карактери кои што се вклучени во речиси 2 пати. можности и континуиран раст во наредните години. За верзија 4.0.0 веќе постои потреба за зголемување на самиот стандард, а тоа беше направено. Како резултат на тоа, "Уникод" е резултат на формата во која што го знаеме денес.

Што друго е во Уникод?

Во прилог на огромното, постојано ажурирана со бројот на карактери, "Уникод" -Encoding текстуални информации е уште една корисна карактеристика. Ова е т.н. нормализација. Наместо да се движите низ целиот документ карактер по карактер, и замена на икони на табелата за согласност, користете еден од постоечките нормализација алгоритми. Што е тоа?

Наместо да се трошат ресурсите на компјутер, на редовна проверка од ист карактер, кои можат да бидат слични во различни азбуки, со помош на специјален алгоритам. Тоа ви овозможува да се направи слични симболи посебна табела пребарување столб и се применува веќе за нив, а не одново и одново да Провериповторно сите податоци.

Таквите алгоритми се развиени и имплементирани четири. Секоја пренамена се одвива со строго определен принцип, различни од другите, така да се јавите било еден од нив не е најефикасен можен рок. Секој наменети за специфични потреби, е вграден и успешно се користи.

дисеминација стандард

Во 25 години од својата историја кодирање "Уникод" Добив веројатно повеќето широко распространета во светот. Според овој стандард се прилагодени програми и веб-страници. Широчината на барањето може да укажуваат на тоа дека Unicode сега се користи од страна на повеќе од 60% од интернет ресурси.

Сега, знаете, кога се појави на "Уникод" стандард. Што е тоа, исто така, знае и да биде во можност да го цениме целосна значењето на пронајдокот, направени од страна на група на експерти Unicode Inc. Пред повеќе од 25 години.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 mk.birmiss.com. Theme powered by WordPress.