本家(https://pullup.net/)にて文字に関する情報や解析結果を表示するページを公開しました。
どの機能もブラウザやOSによって判定がわかる可能性があるのでご注意下さい。
特に正規化はよく変化する可能性があります。
●文字情報
文字をコードポイント単位に分解し、文字毎の情報を表示します。
情報⇒コードポイント、JISX0213における漢字水準、常用漢字、人名用漢字
●文字正規化
文字を正規化した結果を表示します。
●文字照合
二つの文字列を文字単位で比較して、共通する文字としない文字に分けて表示します。
例えばここから「e-tax.txt」と「JISX0213_第1水準.txt」と「JISX0213_第2水準.txt」を取得して、文字列1に「e-tax.txt」を、文字列2に「JISX0213_第1水準.txt」+「JISX0213_第2水準.txt」を設定して解析すれば、第1水準と第2水準以外の漢字がe-tax.txtに含まれていることがわかります。(文字列1に第3水準漢字などが残る)
これはe-Taxで使用可能な文字かを判定するためにシフトJIS(CP932)に変換してても意味が無いことを示しています。(e-Taxで使用可能な第3水準漢字までが除外されてしまう)
「使用可能な文字が除外されるが、使用不可能な文字は残らない」というのが理由として成立するならよいのですが。