Nội dung chính
Khoảng trắng (Whitespace) trong XML
Bài này trình bày cho bạn về việc xử lý khoảng trắng (WhiteSpace) trong tài liệu XML. Khoảng trắng là một tập hợp gồm các khoảng trống, tab và newline (dòng mới). Nói chung, chúng được sử dụng để làm cho tài liệu dễ đọc hơn.
Tài liệu XML chứa hai loại khoảng trắng: Khoảng trắng quan trọng và khoảng trắng không quan trọng. Dưới đây là phần giải thích chi tiết:
Khoảng trắng quan trọng trong XML
Khoảng trắng quan trọng xuất hiện bên trong phần tử mà chứa text cùng với phần đánh dấu. Ví dụ:
<name>TrungPhan</name>
và
<name>Vinh Phan</name>
Hai phần tử trên là khác nhau bởi vì có khoảng trống ở giữa Trung và Phan. Bất kỳ chương trình nào khi đọc phần tử này trong một XML file sẽ phải duy trì sự khác nhau này.
Khoảng trắng không quan trọng trong XML
Khoảng trắng không quan trọng tức là các khoảng trắng ở đó chỉ có nội dung phần tử được cho phép. Ví dụ:
<address.category="residence">
hoặc
<address....category="..residence">
Hai ví dụ trên là giống nhau. Ở đây, khoảng trống được biểu diễn bởi các dấu chấm (.). Trong ví dụ trên, khoảng trống giữa address và category là không quan trọng.
Một thuộc tính đặc biệt xml:space có thể được đính kèm với một phần tử. Nó chỉ rằng khoảng trắng nên bị gỡ bỏ cho phần tử đó bởi ứng dụng. Bạn có thể thiết lập thuộc tính này là default hoặc preserve như trong ví dụ sau:
<!ATTLIST address xml:space (default|preserve) 'preserve'>
Ở đây:
Giá trị default chỉ rằng chế độ xử lý khoảng trắng mặc định của một ứng dụng nên chấp nhận phần tử này.
Giá trị preserve chỉ rằng ứng dụng nên duy trì tất cả khoảng trắng.