Cunoaște Intuit, prelegere, care codifică alfabetul românesc

În prezent, cinci tabele de codificare diferite sunt cel mai frecvent utilizate pentru prezentarea oficială a literelor românești (!):

  • I. ISO 8859-5 - standardul internațional;
  • II. Cod pagina 866 (Microsoft CP866) - utilizat în MS-DOS;
  • III. Pagina de cod 1251 (Microsoft CP1251) pentru Microsoft Windows;
  • IV. Pe baza GOST KOI-8, KOI8 -r - este utilizat în lumea Unix;
  • V. Unicode - este utilizat în Microsoft Windows, Unix și clone Unix.

De bază GOST codificare (standard de stat al URSS) din 1987 se bazează pe recomandările ISO, iar mai târziu a devenit baza pentru reprezentarea caracterelor literelor românești în Unicode. Ea codări și II, III și V toate literele cu excepția e și E sunt aranjate în ordine alfabetică. În practică, această codificare poate fi găsit doar pe vechile computere compatibile IBM PC, UE-1840, iar unele imprimante. browsere de internet, de obicei, o mențină, împreună cu codificările II-IV.

codare CP866, dezvoltat pe baza GOST alternative de codificare, creat special pentru sistemul de operare MS-DOS, în care caracterele desen sunt utilizate în mod frecvent. În această codificare, aceste caractere au aceleași coduri ca standard calculator compatibil IBM PC.

Alternativa GOST codare care are două variante, CP866 coincide cu pozițiile pentru literele alfabetului și marchează pseudographics românești. Codificarea de bază coincide cu GOST ISO 8859-5 numai pentru toate semnele literelor românești, dar Y. literă mare

Utilizarea CP1251 se datorează aproape exclusiv influența companiei calculator tehnologii de dezvoltare Microsoft. În cel mai deplin în comparație cu I, II, IV prezintă caractere, cum ar fi ,, №, diverse tipuri de citate și cratimă și m. P.

caractere codificarea Unicode UCS bazate pe director (Universal Set de caractere) ISO 10646. standardul UCS poate conține până la 2 la 31 de caractere diferite. Codurile UCS -2-2-byte, UCS -4-4-byte. Sunt folosite ca coduri de lungime variabilă UTF-8 (Unicode Transfer Format) - 1 6-byte mai compatibil cu ASCII, UTF-16, și - 2 octeți sau 4. Unicode în aplicațiile se realizează doar parțial, în totalitate și totuși nicăieri nu este acceptată. Linux folosește UTF-8.

Este utilizat pe scară largă de codificare ASCII pe baza:

  • VI. Pe baza KOI-7 - poate fi utilizat în absența chirilic codului font obținut prin scăderea 128 din codul corespunzător din -r KOI8, care oferă, de obicei un cod de litere de capital, fonetic aproape de rus.
  • Codificata VI nu este un simbol vizibil pentru b

    Ceea ce urmează este un tabel. care prezintă toate metodele de codificare ale alfabetului românesc. În acest tabel, coloana 1 sunt simboluri de litere, în coloana 2 din numele literelor din Unicode 3.2 (numele cu litere mici litere chirilice începe cu cuvintele chirilice litere mici și de capital -.... chirilice tone CAPITAL Scrisorii de numele complet al literei D - chirilic CAPITAL SCRISOAREA DE ) în coloana i pentru codurile V decimale și hexazecimale ce corespund tabelelor de codificare. și în coloana VI - caractere ASCII pentru KOI-7.

    Pe lângă cele de mai sus pot fi utilizate pentru a satisface o altă administrare codificări GOST codare bulgara numita MIC. Interprog sau „versiunea veche a Centrului de Calcul al URSS.“ Pe computerele care rulează sistemul de operare Macintosh este utilizat, de asemenea, propria tabelă de codificare pentru a literelor românești pe mărcile setate nu este aproape identic cu CP1251.

    Cunoaște Intuit, prelegere, care codifică alfabetul românesc