JIS X 0208 の JIS83制定時の変更点
[URL]
を見ていて、kakasi の異体字辞書(itaijidict)に含まれていない文字があることに気づきました。
JIS83で第1水準と第2水準が入れ替わったもの(22組) のうち5組
礦砿 邇迩 鶯鴬 諫諌 頸頚
JIS83で字形を変更し、従来の字形を第2水準に追加したもの(4字) のうち1組
堯尭
これらは JIS X 0208 の JIS83制定時の変更で挿し換わったものであるから異体字になります。 近いうちに itaijidic に追加して公開したいと思います。
そう思って異体字辞書を調べてみると
[URL]
にフリーの異体字辞書がありました。 厳密異体辞書、慣用異体辞書という区別があったり、JIS第3・4水準対応という区別もあったりもします。
kakasi での使用を考えた場合には、慣用異体字までは必要ないような印象を受けましたが、用途によっては有用でしょう。
また kakasi の場合は、EUC-JP ですので JIS X 0213 をサポートしたEUC-JISX0213を考えるというよりは、UNICODE化の際にJIS第3・4水準対応を考えた方が良いでしょう。
セコメントをする