Cum ar trebui să codifice la html
De data aceasta vom vorbi despre codificare în HTML: ce este, cum să spun browser-ului, și de ce ar trebui să utilizați UTF-8, și, uneori, Windows 1251. Materialul este conceput pentru incepatori si include tot ce ai nevoie pentru a obține un răspuns detaliat la această întrebare.
Codificarea HTML-pagini
HTML de codificare a paginii trebuie să fie specificate, astfel încât browser-ul poate afișa conținut în mod corespunzător în ea, informațiile text. În cazul în care browser-ul dvs. nu recunoaște în mod corespunzător de codificare HTML-pagini, în loc de textul pe care îl obține „krakozyabriki“. De ce se întâmplă acest lucru?
Codificarea (charset engleza.) - un tabel, care este atașat reprezentarea grafică a acestora pentru fiecare cod de caractere. În cazul în care codificare este determinată în mod corespunzător pentru fiecare simbol de cod pentru a fi utilizat în mod incorect imagine grafică.
Spune-i browser-ul la un HTML codificat
Pentru a spune browser-ul de codificare pagina HTML, una dintre următoarele metode pot fi utilizate:
Opțiunea 1: specificați codificarea în antetul HTTP.
De exemplu, prin configurația serverului sau funcțiile respective ale limbajului de programare web. Deci, PHP are o funcție de antet () pentru acest lucru. Având în vedere problema, soluția poate fi după cum urmează:
header ( "Content-Type: text / html; charset = KOI8-r");
Notă. trimiterea de antet HTTP ar trebui să aibă loc înainte de retragerea conținutului HTML-pagini.
Opțiunea 2: pentru a specifica codificarea într-o meta tag-ul Content-Type
Content-Type meta tag-ul este introdus în real documentul HTML, în secțiunea HEAD, cum ar fi:
Specificația HTML 5, această meta a primit un format redus, de exemplu:
Cum ar trebui să codifice în HTML?
În acest moment, una dintre codificările de text general acceptate și standardizate, care vă permite să stocați valoarea Unicode charset este de 8-biți UTF-8.
Unul dintre avantajele sale este compatibil cu ASCII, care dă câștigul în volum, în comparație cu mai avansată codare UTF-16 și UTF 32.
Prin urmare, cel mai bine este de a utiliza UTF-8.
Dar, dacă vorbim despre alfabetul chirilic, aici putem obține unele probleme. De obicei, toate acestea nu sunt critice și poate fi rezolvată. De exemplu, puteți găsi de multe ori o problemă cu necesitatea de a șterge caracterul din BOM WordPpress.
Acesta este motivul pentru care Windows 1251 încă mai continuă să se bucure de o popularitate foarte largă.
În esență, Windows 1251 compară favorabil cu alte codificări de 8 biți (cum ar fi CP866, KOI8-R și ISO 8859-5) este prezența aproape toate caracterele utilizate în tipografie pentru text simplu rusesc; conține, de asemenea, toate caracterele pentru celelalte limbi slave: ucraineană, belorumynskogo, Serbia, Macedonia și Bulgaria.
Pentru a rezuma
Deci, dacă nu intenționați să utilizați o anumită soluție gata făcute, cum ar fi motorul de blog WordPress, și vor începe să creeze propriile site-uri web. Windows-1251 este mai de preferat. Dar este necesar să se depună eforturi pentru a se asigura că trecerea treptată la UTF-codificare, acestea sunt viitorul.