Mã hóa ký tự
Mã hóa ký tự định nghĩa ánh xạ giữa các byte và văn bản. Một chuỗi byte cho phép các cách diễn giải văn bản khác nhau. Bằng cách chỉ định một mã hóa cụ thể (như UTF-8), chúng ta xác định cách chuỗi byte được diễn giải.
Ví dụ, trong HTML, chúng ta thường khai báo mã hóa ký tự UTF-8, sử dụng dòng sau:
html
<meta charset="utf-8" />
Điều này đảm bảo rằng bạn có thể sử dụng các ký tự từ hầu hết mọi ngôn ngữ loài người trong tài liệu HTML của mình và chúng sẽ hiển thị đáng tin cậy.
Xem thêm
- Mã hóa ký tự trên W3C
- Character encoding trên Wikipedia