Sfat Utilizați întotdeauna xml anunțul

Caracteristici cheie pentru procesare XML

Uche Ogbuji. Consultant șef, Fourthought, Inc.

Pentru a începe cu vom înțelege în termeni. Secțiunea 2.8 Recomandări W3C pentru XML 1.0, în special, prevede:

Cuvântul „ar trebui“ este un punct de vedere tehnic RFC 2119 termen, definită după cum urmează:

Acest cuvânt, sau adjectivul „recomandat“ înseamnă că, în anumite circumstanțe, pot exista motive întemeiate pentru ignorarea acestor reguli, cu toate acestea, alegerea modului toate implicațiile trebuie să fie înțelese și cu atenție cântărite.

Codificarea XML de bază este Unicode. Fiecare personaj în XML documentul este un caracter Unicode. Dacă vă amintiți acest lucru, nu trebuie să aleagă. Cel mai important punct, să spunem faptul este că toate elementele de bază non-goale trebuie să aibă o deschidere și eticheta de închidere. caracter Unicode este o abstracție, deci trebuie să existe un mecanism pentru a reprezenta caractere Unicode într-o formă adecvată pentru prelucrare. Această formă se numește codificare. Codificarea documentului este doar o facilitate pentru transmiterea documentului, dar trebuie să înțeleagă că esența XML conținut este încă limitată la Unicode. Traducere Unicode este sarcina parser.

Cele mai frecvente sunt codificări UTF-8 și UTF 16, care transmit caractere Unicode, respectiv, ca o secvență de valori de 8 biți și 16 biți. Ambele aceste coduri ar trebui să fie susținute de parser. Dacă codificare nu este setat, procesorul XML presupune că codificarea este folosită UTF-8 sau UTF-16 în funcție de prezența sau absența la începutul secvenței octet fișier special (denumit Byte Order Mark sau BOM).

Notă: File, utilizați UTF-16 trebuie să înceapă cu o secvență de BOM, chiar dacă codificarea este declarată corect.

Autonomă (autonomă)

Rezumând