Unicode Transformation Format, 8-bit encoding form
ISO/IEC 10646(UCS)とUnicodeで使える8ビット符号単位の文字符号化形式および文字符号化スキーム
英語圏におけるASCIIコードとの互換性を考慮した数値変換を行う。ASCIIコードで以外の文字は、2~6バイトで表現され、日本語の文字は基本的に3バイトで表現する。