Đơn vị mã
Đơn vị mã (code unit) là thành phần cơ bản được sử dụng bởi một hệ thống mã hóa ký tự (như UTF-8 hoặc UTF-16). Một hệ thống mã hóa ký tự sử dụng một hoặc nhiều đơn vị mã để mã hóa một điểm mã Unicode.
Trong UTF-8, mỗi điểm mã được mã hóa bằng một đến bốn đơn vị mã 8-bit.
Trong UTF-16, mỗi điểm mã được mã hóa bằng một hoặc hai đơn vị mã 16-bit.