2022/9/10 電子書典13に出展します
たかが文字コード、されど文字コード/ShiftJISerへ贈る鎮魂歌(第13版) https://techbookfest.org/product/5677280795820032?productVariantID=57…
ときどき文字コードに関してブツブツ語る
たかが文字コード、されど文字コード/ShiftJISerへ贈る鎮魂歌(第13版) https://techbookfest.org/product/5677280795820032?productVariantID=57…
千葉県の📻局 SKYWAVE FM さんが火曜日の22時から「IT正常運用促進課」という番組を放送しているのですが、そこで「たかが文字コード~」が少し紹介されるようです。WEBでも聞けるようなのでよかったら聞いてみて下さ…
新人・社内教育などでの利用を想定した小冊子「UNICODEに纏わる言葉とお話し」を誰でも読めるようgoogleドキュメントで公開しました。 ☞ UNICODEに纏わる言葉とお話し 「たかが文字コード、されど文字コード」か…
本家(https://pullup.net/)にて文字に関する情報や解析結果を表示するページを公開しました。どの機能もブラウザやOSによって判定がわかる可能性があるのでご注意下さい。特に正規化はよく変化する可能性がありま…
大体のことは佐藤文優氏のblogに書かれてますが、氏の言うとおりUTF-8-MACはNFDではありませんし、WindowsはNFCではありません。 ■macOS X/HFS+はNFDではない NFDの詳しい話はウィキペデ…
CESU-8とは違う内部用UTF-8亜種エンコード。https://simonsapin.github.io/wtf-8/上記サイトにも記述がありますが、間違ってもこのエンコードを外部出力に使わないで下さい。UTF-16…
BOOTHで販売中の「たかが文字コード、されど文字コード」を第十三版に差し替えました。変更点は・誤字脱字の修正・UNICODE年表にVer14.0.0を追加・参考文献へのリンクを修正程度ですので再取得する必要性は低いと思…
手違いでブログシステム毎、データを失ってしまいました。現在復旧作業を行っていますが元の記事をサルベージ出来る可能性はかなり低いです。落ち着くまではかなり時間がかかると思われます。(全データロストに伴いシステムをリセットし…
最近、文字列から漢字だけを抽出したいとか漢字の使用率を知りたいなどと言う無茶な話を耳にする。「漢字」の定義すらよくわからないのに。シフトJISであれば[亜(0x889F)-黑(0xEEEC)]の範囲とすれば済みそうだけど…
動画「なので㋿は入力出来ない」の補足説明をyoutubeにアップしました。約7分の動画です。録音環境が悪かったので肉声ではなく「ゆっくり」に喋らせています。ちょっと大雑把すぎかも知れないですがご容赦ください。