文字ツール公開

本家(https://pullup.net/)にて文字に関する情報や解析結果を表示するページを公開しました。どの機能もブラウザやOSによって判定がわかる可能性があるのでご注意下さい。特に正規化はよく変化する可能性がありま…

WTF-8?

CESU-8とは違う内部用UTF-8亜種エンコード。https://simonsapin.github.io/wtf-8/上記サイトにも記述がありますが、間違ってもこのエンコードを外部出力に使わないで下さい。UTF-16…

【重要なお知らせ】

手違いでブログシステム毎、データを失ってしまいました。現在復旧作業を行っていますが元の記事をサルベージ出来る可能性はかなり低いです。落ち着くまではかなり時間がかかると思われます。(全データロストに伴いシステムをリセットし…

UNICODEの漢字の判別

最近、文字列から漢字だけを抽出したいとか漢字の使用率を知りたいなどと言う無茶な話を耳にする。「漢字」の定義すらよくわからないのに。シフトJISであれば[亜(0x889F)-黑(0xEEEC)]の範囲とすれば済みそうだけど…