Hi all,
Minh viết bậy vài dòng bác Thành xem thế nào.
Unicode16 luu tru moi ky tu 2-bytes la ma tuyet doi UCS-2. Con UTF-8 co gang ma hoa UCS-2 duoi dang byte sequence, mat tu 1 den 3 bytes, cu the:
0xxx xxxx (Code<128)
110x xxxx 10xx xxxx (ma duoc 11 bit)
1110 xxxx 10xx xxxx 10xx xxxx (ma duoc 16 bit).
Ma Unicode tuyet doi se duoc dien vao cac bit 'x'.
Nguyen