異体字
2006-04-09


JIS X 0208 の JIS83制定時の変更点

 [URL]

を見ていて、kakasi の異体字辞書(itaijidict)に含まれていない文字があることに気づきました。

JIS83で第1水準と第2水準が入れ替わったもの(22組) のうち5組

礦砿
邇迩
鶯鴬
諫諌
頸頚

JIS83で字形を変更し、従来の字形を第2水準に追加したもの(4字) のうち1組

堯尭

これらは JIS X 0208 の JIS83制定時の変更で挿し換わったものであるから異体字になります。 近いうちに itaijidic に追加して公開したいと思います。

そう思って異体字辞書を調べてみると

 [URL]

にフリーの異体字辞書がありました。 厳密異体辞書、慣用異体辞書という区別があったり、JIS第3・4水準対応という区別もあったりもします。

kakasi での使用を考えた場合には、慣用異体字までは必要ないような印象を受けましたが、用途によっては有用でしょう。

また kakasi の場合は、EUC-JP ですので JIS X 0213 をサポートしたEUC-JISX0213を考えるというよりは、UNICODE化の際にJIS第3・4水準対応を考えた方が良いでしょう。

[開発]
[KAKASI]

コメント(全1件)
コメントをする


記事を書く
powered by ASAHIネット