.NET5以降の文字の扱いの差違について

.NET 5以降から、文字などの扱い・認識にはNLSではなくICUを使うようになったらしいので、さしあたりIndexOfの動作の差違をやっつけで調べてみた。.NET5以降では他にも「”\r\n”.… .NET5以降の文字の扱いの差違について の続きを読む

UNICODEでの半角全角判定2

シフトJISに変換して半角全角判定を行う方法をなぜ使用しないのか?一つは速度が遅いから。もう一つの理由はWindows(.net?)が怪しい変換をするから。例えば下記のように私用領域の一部の文字がシフトJISの0xA0な… UNICODEでの半角全角判定2 の続きを読む

円記号”U+A5″は半角なのか全角なのか?

各文字のサイズを.net framework 4.5のMesureStringで取得した結果がコレ。文字は左からU+5C、A5、FFE5。MS ゴシックではU+5CもA5も半角として扱われている。そもそもU+5Cは\(バ… 円記号”U+A5″は半角なのか全角なのか? の続きを読む

UNICODEでの半角全角判定

拙著にも書いてますが、文字の幅はフォントによって異なり、また、細いスペース(thin space)なども存在するので半角と全角に二分すること自体に無理がありますが、それでも二分したいことがあるのも事実です。さしあたりシフ… UNICODEでの半角全角判定 の続きを読む

技術書典11に出展しています

「たかが文字コード、されど文字コード/ShiftJISerへ贈る鎮魂歌」を技術書典11のオンラインに出展しています。・未だにシフトJISが日本語の標準文字コードだと思っている方・UNICODEは一文字2バイトと思っている… 技術書典11に出展しています の続きを読む

■ShiftJISerへ贈る鎮魂歌 第十二版発行

BOOTHにて配布している「たかが文字コード、されど文字コード/ShiftJISerへ贈る鎮魂歌」を第十二版に差し替えました。小さな修正のため再取得するほどのものではありませんがお知らせしておきます。 https://b… ■ShiftJISerへ贈る鎮魂歌 第十二版発行 の続きを読む