maeshimaの日記

メモ書きです

文字コード

UTF-8の仕様

メモ。UTF-8はASCII文字と互換性を持たせるために可変長。最初のバイトが 0なら1バイト 11なら2バイト 111なら3バイト 1111なら4バイト 10は中間文字。 はまりどころ? これだけだと複数のバイトで同じ文字が表現できてしまう。(中間文字が10000000の場合)。…