BCP 47 language tag
Thẻ ngôn ngữ BCP 47 (BCP 47 language tag) là một chuỗi ký tự xác định chính xác một ngôn ngữ của con người theo ngôn ngữ cơ bản, nhưng cũng tùy chọn hệ thống chữ viết và phương ngữ. Ví dụ, en chỉ định tiếng Anh, nhưng en-GB và en-US xác định chính xác hơn tiếng Anh Anh và tiếng Anh Mỹ tương ứng.
Thẻ ngôn ngữ BCP 47 được sử dụng ở bất kỳ đâu trên nền tảng web mà một tính năng được thiết kế để tạo ra các kết quả khác nhau tùy thuộc vào ngôn ngữ được chỉ định, cho phép hỗ trợ quốc tế hóa.
Ví dụ bao gồm:
- Thuộc tính
langtrong HTML - Phần tử HTML
<track> - Đối tượng
Temporal - Thuộc tính
CanvasRenderingContext2D.lang - API Dịch thuật và Phát hiện ngôn ngữ
Cú pháp BCP 47
Cú pháp đầy đủ của BCP 47 được quy định trong RFC 5646. Nó có khả năng xác định các phương ngữ ngôn ngữ cực kỳ cụ thể, nhưng hầu hết các cách dùng đơn giản hơn nhiều.
Thẻ ngôn ngữ được tạo thành từ các thẻ phụ được phân cách bởi dấu gạch ngang, trong đó mỗi thẻ phụ chỉ ra một thuộc tính nhất định của ngôn ngữ. Ba thẻ phụ phổ biến nhất là:
- Thẻ phụ ngôn ngữ
-
Mã 2 hoặc 3 ký tự xác định ngôn ngữ cơ bản, thường được viết bằng chữ thường. Ví dụ, mã ngôn ngữ cho tiếng Anh là
en, và mã cho Badeshi làbdz. - Thẻ phụ chữ viết Optional
-
Thẻ phụ này xác định hệ thống chữ viết được sử dụng cho ngôn ngữ và luôn dài 4 ký tự, với chữ cái đầu tiên được viết hoa. Ví dụ, tiếng Pháp bằng chữ Braille là
fr-Braivà tiếng Nhật được viết bằng bảng chữ cái Katakana làja-Kana.Note: Nếu ngôn ngữ được viết theo cách đặc trưng cao, như tiếng Anh bằng bảng chữ cái Latin, không cần sử dụng thẻ phụ này.
- Thẻ phụ vùng Optional
-
Thẻ phụ này xác định một phương ngữ của ngôn ngữ cơ sở từ một địa điểm cụ thể và là hai chữ cái viết hoa khớp với mã quốc gia hoặc ba chữ số khớp với khu vực không phải quốc gia. Ví dụ,
es-ESlà tiếng Tây Ban Nha như được nói ở Tây Ban Nha, vàes-013là tiếng Tây Ban Nha như được nói ở Trung Mỹ. "Tiếng Tây Ban Nha quốc tế" chỉ làes.
Thẻ phụ chữ viết đứng trước thẻ phụ vùng nếu cả hai đều có mặt — ru-Cyrl-BY là tiếng Nga, được viết bằng bảng chữ cái Cyrillic, như được nói ở Belarus.
Xem thêm
- Danh sách các thẻ phụ ngôn ngữ chính phổ biến
- RFC 5646: Tags for Identifying Languages: nơi các thẻ ngôn ngữ BCP 47 được quy định.
- Chọn thẻ ngôn ngữ: Hướng dẫn W3C về chọn thẻ ngôn ngữ phù hợp.
- Tra cứu thẻ phụ ngôn ngữ BCP 47: tra cứu mã thẻ phụ cho một ngôn ngữ.