Bộ ký tự

Bộ ký tự là một hệ thống mã hóa để cho máy tính biết cách nhận dạng ký tự, bao gồm chữ cái, số, dấu câu và khoảng trắng.

Trong thời kỳ trước, các quốc gia đã phát triển bộ ký tự riêng do các ngôn ngữ khác nhau được sử dụng, chẳng hạn như mã JIS Kanji (ví dụ: Shift-JIS, EUC-JP, v.v.) cho tiếng Nhật, Big5 cho tiếng Trung truyền thống, và KOI8-R cho tiếng Nga. Tuy nhiên, Unicode dần dần trở thành bộ ký tự được chấp nhận nhiều nhất vì khả năng hỗ trợ ngôn ngữ toàn cầu.

Nếu một bộ ký tự được sử dụng không chính xác (ví dụ: Unicode cho một bài viết được mã hóa bằng Big5), bạn có thể thấy không gì ngoài các ký tự bị vỡ, được gọi là Mojibake.

Xem thêm