Windows の中の JIS 外漢字

Windows の文字セットの中に、JIS X 0208 で規定されてない漢字がいくつか入っている。 Shift_JIS で 0xFA5C-0xFC4B(IBM 文字)と 0xED40-0xEEEC(NEC 選定 IBM 文字)にダブって配置されている漢字
元々、IBM が JIS X 0208:1978(旧称 JIS C 6226-1978)に入ってない文字を、需要があったんで配置したんだと思う。
これらの文字、てっきり JIS X 0212 か JIS X 0213 で救済されているんだと勝手に思っていた。 これらの文字を「拡張漢字」って呼んでた文献を、私が勝手に JIS X 0212 だと勘違いしていたのかも。

JIS X 0212 と JIS X 0213 の規格書を入手したんで、今いろいろと各規格間の対応とかを調べている。
すると、34 文字が JIS X 0212 にも JIS X 0213 にも含まれてない事が判った。 いや、厳密には一部の文字は包摂して含まれているっていう扱いなんだろうけど。


U+4EFC FA6A(IBM)/ED4E(NEC)
(U+4EFB、0208:39-04)の異体字
U+50F4 FA7C(IBM)/ED60(NEC)
(U+50E9、0212:18-35、0213:2-01-93)の拡張新字体
U+51EC FA83(IBM)/ED66(NEC)
(U+98A8、0208:41-87)の古字
U+FA0E FA90(IBM)/ED73(NEC)
U+5759 FA96(IBM)/ED79(NEC)
これ、小さいポイント数で表示されているのを見た時、巠(U+5DE0、0212:27-93、0213:2-08-75)だと思っていた。よぉく見ると下は “工” じゃなく “土” なのね。
U+5CF5 FAAE(IBM)/ED92(NEC)
U+6085 FABD(IBM)/EDA1(NEC)
(U+60A6、0208:17-57)の旧字
U+6120 FAC1(IBM)/EDA5(NEC)
(U+614D、0208:56-18)の拡張新字体
U+654E FACD(IBM)/EDB1(NEC)
(U+6559、0208:22-21)の旧字
U+663B FAD0(IBM)/EDB4(NEC)
≈昂(U+6602、0208:25-23)
これ、Windows XP の実装だと同じに見える。 Unicode の例示字体では、部分字形が U+6602 の方は“卬”(U+536C)、U+663B の方は “卭”(U+536D)という事になっている。
によると、78JIS の 25-23 が部分字形 “卭”(U+536D)だった頃に追加された文字らしく、でも 83JIS で部分字形 “卬”(U+536C)になったんで、両者が同じグリフになっちゃったんだそうだ。
この字を追加した意図は「JIS とは違うグリフが欲しかったから」である筈だから、83JIS でのグリフ変更に腹を立ていたろうな、この字を追加した人(又は組織)は。
さてそうすると、この 2 字を Unicode と相互変換する時は、どんなマッピングをしたらいいんだろう?  グリフだけ見れば昂(U+6602)しかないけど、それだと最初に追加した人(又は組織)の意図が反映されない。 出回っているマッピングテーブルでは、当初追加したのとは違うグリフになっちゃうし。
JIS の立場では 1 文字だけ考えればいいんだろうけどね。
U+FA12 FAD8(IBM)/EDBC(NEC)
(U+6674、0208:32-18)の旧字
U+6AE2 FAF2(IBM)/EDD6(NEC)
U+6DF8 FB43(IBM)/EDE4(NEC)
(U+6E05、0208:32-22)の旧字
U+6DF2 FB44(IBM)/EDE5(NEC)
U+7682 FB70(IBM)/EE54(NEC)
Windows XP の実装では〔白+匕〕で皀(U+7680、0208:66-05)の異体字っぽいけど、Unicode の例示字体では〔白+七〕で皁(U+7681、0212:46-21、0213:1-88-64)の俗字っぽくもある。
U+FA17 FB75(IBM)/EE59(NEC)
(U+76CA、0208:17-55)の旧字
U+FA18 FB7D(IBM)/EE61(NEC)
(U+79AE、0208:67-25)の古字、礼(U+793C、0208:46-73)の異体字
U+FA1C FB86(IBM)/EE69(NEC)
(U+9756、0208:44-87)の旧字
U+FA1D FB89(IBM)/EE6C(NEC)
(U+7CBE、0208:32-26)の旧字
U+FA1E FB92(IBM)/EE75(NEC)
(U+7FBD、0208:17-09)の旧字
U+8807 FBA1(IBM)/EE85(NEC)
(U+8823、0208:73-58)との関係は?
U+8D76 FBB0(IBM)/EE94(NEC)
(U+8D95、0212:63-49、0213:2-89-23)の新表記
U+FA23 FBB1(IBM)/EE95(NEC)
U+FA25 FBB4(IBM)/EE98(NEC)
(U+9038、0208:16-79)の異体字
U+FA27 FBD3(IBM)/EEB7(NEC)
U+FA28 FBDA(IBM)/EEBE(NEC)
U+9592 FBE8(IBM)/EECC(NEC)
(U+9593、0208:20-54)の旧字。 よく JIS 漢字批判で、内田百閒(小説家、1889-1971)の名前が書けない、と引き合いに出される字
しかし、Moon と Sun を包摂しちゃうのは乱暴な気もする。
U+FA29 FBEA(IBM)/EECE(NEC)
U+9751 FBF2(IBM)/EED6(NEC)
(U+9752、0208:32-36)の旧字
U+FA2A FBF6(IBM)/EEDA(NEC)
(U+98EF、0208:40-51)の旧字
U+FA2B FBF7(IBM)/EED8(NEC)
(U+98FC、0208:27-84)の旧字
U+FA2C FBF9(IBM)/EEDD(NEC)
(U+9928、0208:20-59)の旧字
U+9AD9 FBFC(IBM)/EEE0(NEC)
(U+9AD8、0208:25-66)の異体字。はしごだか。
U+FA2D FC49(IBM)/EEEA(NEC)
(U+9DB4、0208:36-65)の異体字。よく見ると “宀” と “隹” に離れている。