2004 JIS をめぐる混乱 |
2004 JIS ( JIS2004 )について、問題となる混乱を解説します。 [ 2005.08.12. ]
※ この文書の目的は、誰かを非難または攻撃することではなくて、
世間にある誤解または錯覚をほどくことです。
★ 「個々の文字をどう使えばいいのか」という 実用的な結論については、
下記のページをご覧ください。
→ Open ブログ 「文字使用の指針・まとめ」
このページには、「指針1」「指針2」「指針3」というリンクもあります。
★ 本文書では、学術的 ・理念的 ・原理的 な 話題 を主に扱います。
本文書を公開したあとの新しい情報ついては、次のページをご覧ください。
→ Open ブログ 「文字規格」
ここには、細々とした話題がいろいろとあります。
「JISの規格委員会と、マイクロソフトは、規格決定に至った理由について、説明責任を果たすべし。国民に対して、なぜその規格を採るようになったか、根拠をちゃんと説明せよ。」 |
【 補足 】
( ※ とはいえ、そもそもの提唱者である私の主張をまったく無視しているのだから、JISが説明責任を果たすことは、原理的に不可能である。……なぜなら、その主張は私の主張であるからだ。仮に、その主張を勝手に語れば、JISの委員会が「剽窃」という著作権法違反を犯して、犯罪をなすことになるからだ。……今になって、南堂を無視してきたツケが回る。皮肉。)
( ※ なお、「字形の変更」という説を唱える人は、私以外には一人もいなかった。また、当初は、トンデモだと見なされていた。)
( ※ ついでだが、「字形の変更」という用語は、私の作り出した用語。当時の標準用語では、「字体の変更」という。つまり、略字体から正字体への変更だ。これが正式。ただし、私は政治的な思惑で、「デザイン差」の範疇に含めようとしたので、「字形の変更」という用語を用いた。そして今では、誰もがこの用語を使っている。もともとは南堂の意図的な誤用だった、とは気づかないまま。…… 「電子透かし」みたいな「著作者表示」がこっそり入っているわけだ。 (^^); )
[ 付記1 ]
「現状の略字は、そのまま維持すればいい。正字は新たに追加すればいい」
という説がある。この説は、一見もっともだが、実は、解決案になっていない。なぜか? 略字の「辻」さんは文句を言わないが、正字の「辻」さんは文句を言うからだ。
もう少しわかりやすく示そう。「榊」という文字は、現在、一通り(略字)しかない。つまり、一つの文字に、略字の「木ネ申」と、正字の「木示申」とが、混在している。世の中には多くの「さかきばら」さんがいるが、「榊原」というふうにパソコンで表示されているのが、「木ネ申」と「木示申」のどちらかは、わからない。双方があるのだ。
で、このあと、「略字は現状のままで、正字は新たに追加」というふうにしたとしよう。略字の「榊原」さんは大喜びだ。しかし正字の「榊原」さんは不満である。なぜなら、正字の「榊原」を新フォントで表記すると、旧フォントのパソコンでは「 原」さんになってしまうからだ。これまでは曲がりなりにも略字で「榊原」と表現されていたのが、今度はただの「 原」さんになってしまうのだ。大不満だ。略字の「榊原」と正字の「榊原」なら、実質的には差はないが、「榊原」と「 原」とではまったく異なるからだ。
要するに、「ひとつのコードポイントに二つの字体がもぐりこんでいる」という状況では、双方を満足させることはできない。必ずどちらかが不満になる。略字の「辻」さんや略字の「榊原」さんを満足させれば、正字の「辻」さんや正字の「榊原さん」が「文字消失」という憂き目にあう。正字の「榊原」さんは「 原」さんになるので半分は残るが、正字の「辻」さんは「 」さんになってしまう。完璧な氏名消失だ。
もちろん、逆も成立する。略字の「辻」を新たに追加すれば、略字の「辻」さんは、古いフォント環境では「 」さんになってしまう。
要するに、字体の微妙な差ばかりにこだわっていると、一面では正確に表すことが可能だが、一面では文字消失の憂き目にあう。……何もかも解決ということはありえないのだ。
というわけで、さまざまな状況をかんがみて、「最も重要な場合を優先する」という原則を立てたのが、私の主張である。微妙なデザイン差のこだわりは捨てることになるが、文字そのものの消失を避ける。一画や二画の違いは無視してもらうことにして、文字そのものの同一性は厳守する。細かなことは無視して、肝心なことを絶対的に保護する。人間で言えば、体重の差にはこだわらず、生死には徹底的にこだわる。……これが私の方針である。そして、この方針に従ったのが、JIS規格委員会の決定であり、MSの方針である。
どんな物事にも、明るい面と暗い面がある。メリットとデメリットがある。そのうちの一部だけにこだわると、総合的な評価ができなくなる。物事は広い視野で考察するべきなのだ。
[ 付記2 ]
「略字を使いたい」という「辻」さんたちには、つらいことばかりのように見える。ただし、実は、いくらか解決の方法がある。それは、「字形の変更」を受け入れた上で、略字を将来的に、新たなコードポイントに採用することだ。
これだと、「文字消失」の問題は生じるが、「将来の追加」という形であれば、「文字消失の危険を覚悟する」というデメリットを負った上で、その文字を区別して利用することが可能になる。
ただし、そうすること(略字を将来追加すること)のためには、現在の文字コード表で、コードポイントをいくつか、あらかじめ空白にしておくことが必要だ。つまり、既存の第3水準または第4水準の文字から、いくつかの文字を排除することが必要だ。
それは、可能か? 可能だ。排除すべき文字があるからだ。すなわち、欧文2バイト文字である。これらの文字は、ない方がいいのだから、削除するといいだろう。そうすれば、将来的に、「辻」などの略字を収めることができる。
( → 欧文2バイト文字の問題 )
[ 付記3 ]
なお、「辻」などの略字について言えば、「簡易慣用字」という位置づけて、公認してもいいだろう。まったくのパソコン略字とは違って、一点しんにょうについては、歴史的な慣用の例も多くあるからだ。
実は、一点しんにょうなどを使う簡易慣用字については、私は必ずしも排除する意図はない。実際、南堂私案では、もっと多くの略字が「簡易慣用字」として収録されることになっている。
つまり、「簡易慣用字」とされる略字まで、やたらと排除したがるのは、現在のJIS委員会の方針であって、私の方針ではない。
[ 付記4 ]
旧来の略字はまったく使えなくなるわけでもない。報道から引用すると、次の通り。
「マイクロソフトでは、こうした不具合を解消するため、字体切り替え機能を提供する予定だという。」( → 引用元 )
この機能を使えば、少なくとも書き手が印刷するときには、略字を使える。それで十分だろう。
なお、この方法は、私がかねて提案した、「略字は略字フォントで、切替え表示する」という提案そのものだ。
「文字コードは、正字を基本として、あまり使われない異体字としての略字は、フォント切替で対応する」
というのが、私の主張であった。マイクロソフトが今回の方針を取ったのは、私の主張に合致するので、好ましい。
( ※ 「そんなの、いちいち言わなくても、当り前だろ」と思うかもしれない。だが、さにあらず。決まってからなら、そう言えるだろう。しかし、私がこの提案をしたときは、「トンデモ」扱いされて、まともに考慮されなかったのだ。むしろ、「フォント切替なんかをすると、略字と正字が一つの文字コードに共存するので、字体の区別ができなくなってしまうので、絶対に駄目だ」という意見が、圧倒的多数だった。)
[ 付記5 ]
なお、誤解が広く見られるので、指摘しておく。それは、次の誤解だ。
“ 新JISでは、字形の変更がなされ、略字から正字へと変更された。だから、略字の代表格である「鴎」は、「区鳥」から「區鳥」に変わった。”
これは間違いである。正しくは、次の通り。
“ 新JISでは、字形の変更がなされ、略字から正字へと変更された。ただしそれは原則であり、例外がある。略字の代表格である「鴎」は、この例外に該当する。ゆえに、「区鳥」から「區鳥」に変わることは、ない。「鴎」のコードポイントの文字は、略字の「区鳥」のままであり、正字の「區鳥」は、新たなコードポイントに追加された。つまり、従来の「鴎」という文字は、新JISでも、略字のままである。”
具体的にコードポイントを述べると、次の通り ( → 文字コード表 )
区鳥 …… シフトJIS: 89a8
區鳥 …… シフトJIS: efe3
では、なぜ、そうなったか? それは、文字コードの歴史と関係する。簡単に言えば、正字の「區鳥」と略字の「区鳥」はもともと unicode に存在するので、混乱を防ぐためだ。仮に、字形の変更をすると、「區鳥」という文字コードポイントが二つ存在することになってしまう。
なお、同様の文字は、次の19字であるらしい。(出典は このサイト )
侠 倶 呑 填 掴 焔 痩 祷 箪 繋 繍 莱 蒋 蝉 蝋 醤 頬 顛 鴎
これらの19字は、前述の通り、「 unicode にすでに正字と略字があるので、正字と略字がそのまま残る文字」と見なしていいだろう。全部チェックしたわけではないが、任意に7個チェックしたら、7個とも正字と略字がすでに unicode に入っていた。残りも同様だろう。
( ※ 実は、この種の例外は、私は5字ぐらいしかないだろうと予想したのだが、思ったよりはたくさんあったわけだ。……なお、これらの文字は、「補助漢字」のうちに「正字体」として組み込まれたもの。略字主義者が徹底的に排除しようとしたのだが、うまく19字をもぐりこませたわけだ。それは「正字を救うための処置」であったが、今となっては逆に「略字を救うための処置」になっている。歴史の皮肉。)
[ 付記6 ]
「鴎」という文字については、「字形の変更」がなされなかった。これは例外である。
では、これは、一般的には、良いことだろうか、悪いことなのだろうか? 答えは、二通りある。── 「鴎」という文字を人名にしている人にとっては、良いことである。しかし、普通に日本語を使う人にとっては、悪いことである。
具体的な迷惑の例を示す。(青空文庫からの引用)
青空文庫は作業上の大原則として、「JIS漢字コードの包摂規準の枠内で、底本に忠実な入力を行う」という方針を掲げています。 底本の多くは、森鴎外の「鴎」に「區+鳥」を使っていますから、この方針を、新JIS環境への切り替えにあたっても貫こうとすれば、「鴎」の見直しが必要です。「気の遠くなるような作業」というが、これは、青空文庫に限ったことではなく、多くの人々の作成した日本語文献で、やはり必要となる作業だ。私が先に「何億回かの置換」というのは、このことだ。(正確に言えば、「鴎」だけでなく多くの文字が同様に置換作業が必要となるから、「何億回」になる。)
それまで入力してきたすべてのファイルに関して、「鴎」の字が使われていないかあたり直し、もし使われていれば、あらためて底本と照合し、それが「区+鳥」なのか「區+鳥」なのかを確認し、必要なら修正しなければいけません。
出版の世界では、従来、「区+鳥」は俗字と位置づけられ、ほとんど使われてきませんでした。 「區+鳥」への修正が必要になる可能性は、きわめて高いのです。…(中略)…これまで作ってきたファイルの中で見つけだしていくことは、気の遠くなるような作業となるでしょう。
2004 JISでは、 「區鳥」については「正字の追加」だったから、この作業が必要となる。一方、「榊」については、必要ない。なぜなら、略字の「榊」はすべて自動的に正字の「榊」になるから、作業は必要でないからだ。(作業したくても、作業のしようがない。略字のコードポイントはないからだ。)
要するに、「あまり使わない略字」については例外扱いにして、文字コードの基本原則に入れないことにすれば、問題は起こらない。どうしても区別したい人名漢字派の人には受け入れられないだろうが、普通に日本語を使っている人には「一つの文字には一つのコードポイント」にして、細かな字形差はフォントで区別する方が、ずっとありがたいのだ。日本語は、正規の文字が正しく使えることが大事なのであって、非正規の文字を使うことをあまりにも優先すると、正規の文字をうまく使えなくなってしまうのだ。
誰をも満足させる道はない。とすれば、選べる選択肢のなかで、最適のものを選ぶことが、必要だろう。その際、小さなデメリットに目を奪われ、大きなメリットを無視することのないようにしたい。価値判断を間違えないようにしたい。5人のわがままを満たすために、95人の生命を犠牲にすることのないよう、注意したい。
[ 付記7 ]
ここまで読んで、それでもやはり、疑問に思う人も多いだろう。
「そもそも、どうして、こういう変なことになったのか? 本来ならば、新しい文字を追加すればいいはずなのに、どうしてそういう方針が取れないのか?」
もっともな疑問だ。そこで、根源的な理由を示しておこう。それは、こうだ。
「現状そのものが間違っているからだ」(83JISにおける大失策のせい。)
現状が正しければ、現状に何かを追加するだけでいい。それが常識だろう。しかし、現状が正しくなければ、現状に何かを追加するという方針ではまずい。なぜなら、現状が正しくないという状況が固定されてしまうからだ。
この場合には、まず「現状を正す」ということが先決となる。この先決となる問題を解決するのが、すべてに優先する。
たとえて言おう。夫婦が結婚するなら、ちゃんと結びつくべき相手と結びつくのがいい。ところが、どこかの強引な人が勝手に神霊教のようなものを持ち出して、「あんたはこの人と結婚しなさい」と押しつけたとする。そのまま十年間、何とか暮らしたが、どうにも合わない相手といっしょに暮らすのは、苦痛以外の何物でもない。二人とも不幸になるだけだ。だったら、離婚して、やり直した方がいい。ここでは、「離婚する」というふうに、根源を正すのが正解だ。
一方、「現状を変えてはならない」という方針もある。「現状を変えると、姓がかわったり、子供の転校問題が起こったりして、小さな面倒がいっぱい発生する。だから、小さな面倒を避けるために、離婚するべきではない。離婚はやめて、それぞれ、別の異性と浮気生活をすればいい。これなら、姓を変えるというような小さな面倒を避けることができる」……なるほど、その方針なら、小さな面倒を避けることができる。しかし、肝心の根幹が、まったくないがしろにされてしまうのだ。
物事の根幹が狂っているときには、根幹から改定するべきだ。「間違った現状を持続させる方がいい」というのは、それはそれで一つの案だが、それだと、小さな面倒を避けることができるものの、大きな根本問題が続いてしまう。── つまり、文字規格では、「間違った略字が、正当なコードポイントを占めている」という根本問題が。ちょうど、「間違った異性が、配偶者の位置を占めている」というふうに。
たとえて言おう。あなたには、昔ながらの、愛する恋人がいた。相思相愛の仲だったのに、横からちょっかいを出す人のせいで、強引に引き離され、別の相手と結婚してしまった。おかげで、相性が合わず、悲惨な人生だった。毎日毎日、意見の対立と喧嘩で、修羅場ばかりが続く。さっさと離婚するべきだと思うのだが、まわりの親族が「姓が変わると面倒ですよ」というので、そのまま離婚せずに、夫婦とも苦しみ続けてきた。しかしやがて、二人とも、本来の相思相愛の相手とめぐりあった。相手は結婚してくれるという。だったら、今の相手と、さっさと別れた方がいいだろう。そうすれば、二人とも幸福になれるからだ。しかしそれでも、文句を言う人が出る。子供である。「姓が変わって、学校が変わるのは、困るよ。このまま夫婦で居続けてほしい。せめて、僕が結婚するまではね。僕は幸福な結婚をしたいから、両親は不幸な結婚をし続けてほしい」
これは子供のエゴだろう。ここでは、両親は子供に言い聞かせるべきだ。「おまえには不便をかけて済まないが、このまま私たちの人生を完全に破壊するわけには行かないんだ。おまえの小さな便宜のために、私たちの人生のすべてを犠牲にするわけには行かないんだ」と。
「過ちて改めるに憚ることなかれ」── これが私の主張だ。通常ならばたしかに、「なるべく現状を維持せよ」と言える。しかし、現状がもともと「過ち」であれば、「何が何でも現状を維持せよ」というふうにはならないのだ。ここでは、小さなトラブルを避けることが大事なのではなく、大きなトラブルをかかえた現状を変えることが大事なのだ。
[ 付記8 ]
コンピュータ関係者のために、コンピュータに即して言おう。(話の趣旨は同じだが。)
コンピュータ関係では、「データの互換性が大事だ」としばしば言われる。それはその通りだ。ただし、そのことが成立するには、次の前提がある。
「元のデータ規格が正当な規格である」
しかるに、この前提が満たされない場合がある。すなわち、
「元のデータ規格が根本的に狂った規格である」
こういう場合に、データの互換性を保つために、あえて規格をそのまま維持すると、根本的に狂った状態が続くので、狂いがどんどん蓄積していく。その被害もふくらむ。
たとえば、次の例がある。
(1) 西暦の2桁表記
2000年問題以前の表記では、西暦は下2桁だった。ここで、データの互換性を重視するなら、下2桁の表記を維持するべきだったろう。つまり、「2001年」と書かずに、「01年」と書くべきだったろう。そうすれば、データの互換性は保たれる。
しかし、下2桁の表記というのは、根本的に狂った表記なのだ。こんなことを続ければ、百年後にまた大問題が起こる。その混乱は、途方もないものだろう。(なぜなら、1901年にはコンピュータのデータがなかったが、2001年には莫大なデータがあったからだ。)
だから、下2桁の表記という根本的に狂った表記を改めて、4桁の表記にするべきなのだ。そのせいで、データの互換性がなくなったとしても、やむを得ない。コンバーターを使って、何とか互換性を維持できるのだから、それで済ますべきだ。
元のシステムが狂っているときには、元の狂ったシステムとの互換性は、あまり重要ではないのだ。
(2) ファイル名の8文字表記
MS-DOS にはファイル名に「(1バイトの)8文字+3文字」という限界があった。そして、MS-DOSとの互換性を保つために、この限界を一部で維持する、という方針が、Windows では取られた。そのせいで、ファイルの復元などをやったときに、大切なファイルがうまく復元されない、という問題が起こることがある。
たとえば、「Program Files」のかわりに「prog~134」なんていう名前に勝手に書き換えられたあとで、その名前が「134と135で食い違ってしまう」というようなことが起こる。……すると、ファイルやフォルダの消失という、大問題が起こってしまう。
ここでは、「8文字+3文字」という限界のあるシステムそのものが狂っていたのだ。だから、「狂ったシステムとの互換性」を維持するよりは、「新しいシステムでの正常な機能」を優先するべきだったのだ。
元のシステムが狂っているときには、元の元の狂ったシステムとの互換性は、あまり重要ではないのだ。
というわけで、この二つような場合には、「元のシステムとの互換性」は、あまり重要ではない。システムにとって最重要なのは、「システムが正常に働くこと」である。その基本をないがしろにして、古いシステムとの(ごく部分的な)互換性ばかりを重視しては、本末転倒である。ありがちな勘違いなので、注意しよう。
【 参考 】
新JISを受けて、企業や個人がどうするべきかを、示しておこう。
[ 参考1 ] 企業の場合
企業は今後、どう対処するべきか?
字形の変更があると、「人名の混同などでトラブルが起こる」という混乱が予想される。それで企業は「大変だ、大変だ」と騒ぐかもしれない。そこで、対処策を示しておこう。最善の対策は、こうだ。
「何もしないこと」
ただし、まったく何もしないのではなくて、頭だけは下げるといい。つまり、「一点が二点になった」と文句を言う顧客(クレーマー)がいくらか出るだろうから、これらの顧客に対する苦情受付の窓口を用意しておくといい。たぶん相手はしつこくネチネチと文句を言ってくるだろう。だが、JISやマイクロソフトが決めたことに対して、自社としてはどうしようもない。だから、こういう顧客に対しては、ひたすら頭を下げるしかない。
なお、頭を下げるだけでなく、何らかの対処をすると、とんでもないことになる。たとえば、「システムを書き換えて、これまでの一点しんにょうの略字を別のコードポイントの文字に自動的に置換する」というような措置を取ると、コードポイントが変更されるから、同一人物に二つの文字コードが割り当てられることになる。こんなことをやれば、必ず、どこかで大問題が発生する。
ここでは、原則を理解しておこう。今回の「字形の変更」では、字形が変更されるだけであり、コードポイントそのものが移動するわけではない。現在の「辻」さんを、新たなコードポイントの略字の「辻」さんに移動すれば、問題が起こるが、現在の「辻」さんを、字形では正字にするだけ(コードポイントを変えない)のであれば、何も問題は起こらない。── コンピュータのシステムでは、コードポイントだけが大事であり、字形の差などは内部処理には使われないからだ。
なお、どうしても「略字の辻にしろ」と文句を言う顧客もいるだろうから、そういう顧客に対しては、「コードポイントの変更の手続き」を取ってもらえばいい。それは、通常の「氏名変更の手続き」と同じである。結婚後に「改姓」があるように、今回も同じく「改姓」と同様の手続きを取ってもらえばいい。これはこれで、特に問題はない。
とにかく、「自動処理で一挙にコードポイントを変更する」ということだけは、やめた方がいい。そんなことをすれば、トラブル続出は目に見えている。余計なことは、やらない方がいい。── そして、問題は、それだけだ。
要するに、企業がやるべきことは、「顧客対応」の窓口にいる女の子をたくさん雇用することだけだ。それ以外には、何もやらなければいい。それで万事解決。
ついでに言えば、マスコミがあらかじめ「こうなりますよ」と世間に情報提供しておけば、いちいち文句を言う顧客もいなくなる。その場合は、まったく何一つしなくていいことになる。
( ※ ただし、文句を言う顧客だけは、「改姓」と同じ手続きが必要となる。これらの顧客だけは、少しだけ、余分な手間がかかる。……これらの顧客は、手続きをするか? たぶん、しないでしょう。ぶつくさと文句をたくさん言うのは大好きだが、手続きをしてまで訂正したがる人は、たいしていないはずだ。要するに、一点か二点かの違いなんて、言っている本人だって、本当はたいして気にしないのだ。)
[ 参考2 ] 個人の場合
一般の個人は今後、どうするべきか? こう思う人もいるかもしれない。
「JISの文字規格? おれには関係ないね。おれの名前は略字じゃないからね」
と。しかし、さにあらず。一般の個人も、無関係ではいられない。けっこう大きな影響がある。なぜか? 自分の名前は問題がなくても、他人の名前を使うことがあるからだ。名前については、「他人のものは使わない」というわけには行かないのだ。
では、どうなるか? 漢字を類別して、考察しよう。
(i) 字形の変更がなかったもの
「鴎」の用に、字形の変更がなかった文字がある。(前述。)
これら19字については、いろいろと面倒があるだろう。たとえば、あなたは今後、「森鴎外」と書きたいとき、古い「森鴎外」の文書をコピペするとき、いちいち気を遣って、略字を正字に書き換える必要がある。
また、IMEに漢字登録されていない場合には、「もりおうがい」とか「かもめ」とかの読みで、いちいち正字の単語を登録する必要がある。この二語だけではない。「白鴎」のように、「鴎」を使う文字を使うたびに、いちいち正字を呼び出して、単語登録する必要がある。面倒なこと、この上ない。やらなかったら、馬鹿にされる。
たとえば、「醤油」(しょうゆ)や、「魚醤」(ぎょしょう)の「醤」という文字がそうだ。こういうのが、いろいろとある。面倒ですねえ。それというのも、「字形の変更」がなかったから。
(ii) 人名略字
人名異体字も、いろいろとある。「辻」さんなら、「辻」さん本人は困るだろうが、他の人は別に困らない。略字が異体字になるだけで、文字は一つだから、何の措置も必要ない。
しかし、「蓬莱」さんの場合は、「莱」の字が、略字と正字の二つに分かれるから、どっちにするか、いちいち注意する必要がある。間違えると、「違うぞ」と怒鳴り込まれる。(ついでだが、略字の「莱」は、本来は存在しなかったものであり、一種の誤字である。こんなものが正式に残ったせいで、いろいろと無駄な気を遣わされるハメになるわけだ。誰が? あなたが。)
(iii) 人名異体字
略字なら読めるからまだいい。一方、とうてい読みようのないような、変な人名異体字も、新JISにはたくさん取り込まれている。 ( → 一覧表 の 87A1 など。)
代表的なのは、「七」という字を三つ、「品」という文字の「口」のように配置した文字(87A1)だ。これは「喜」の異体字である。屋号ではしばしば使われるから、これはまあ、いくらか許容範囲だ。
なお、本当はこれは誤字である。「喜」の草書体を、似た明朝体に書き直したものであり、素人の勝手な誤読が定着しただけだ。ちなみに、この草書体の画像を、次に示す。(典拠は Bookshelf。その文字をコピーして MS-Wordで拡大した。)
これは草書体だが、あくまで「喜」という字であり、「喜」の異体字ではない。……そのせいかもしれないが、現在の unicode 環境では、これを明朝体にした文字(87A1)は、どういうわけか出力されない。X0213:2000 であるせいかもしれないが。
さて。「喜」の変な異体字はまだ、序の口である。新JISには、およそ読みようのない[読みがたい]変な異体字が、たくさん取り込まれている。
これらは規格委員会の出した草案における、人名異体字の例だ。(一つは例外。)
で、誰かがこれらの人名異体字を使ったら、あなたはそれを読まなくてならない。読みようがなければ、隣の人に尋ねたり、パソコンで検索したり、いろいろと手間がかかる。
( ※ ついでだが、普通の漢和字典には出ていません。漢字というよりは、特殊な国字だからだ。私の解釈では、ただの誤字だ。)
( ※ 「正しい読み方は?」と尋ねても、無意味である。もともとは誤字[勝手に自己流で作り出した文字]なのだから、正しい読み方などはもともと存在しない。「正しいバグ」が存在しないのと同様だ。ただし、どこかのひどい会社は、「これは仕様です」と称して、バグを「正しい仕様」と称する。そういうのが、新JISの人名異体字。)
( ※ どうしても読みたい場合は、その異体字と同等とされる正統的な文字を探す。偽物の意味は、本物を探すことで、その偽物が何の偽物であるかがわかる。誤字の意味は、正しい字を探すことで、その誤字が何の誤字であるかがわかる。)
さて。人名異体字の場合は、「読めない」と気づけば、まだマシである。一方、「読めない」と気づかないまま、誤読・誤解することもある。「渡邊」の「邊」のように、一見区別がつきにくい文字も、結構ありそうだ。(前述のサイトの例を参照。)……で、これらの区別しにくい異体字については、他の似た異体字と混同して、コードポイントの誤認が起こるかもしれない。さらには、まったく別の字との誤認も起こるかもしれない。(上の図でいえば、「剋」という字に似た字があるので、それと誤読する可能性がある。)
というわけで、こういうふうに変な異体字(誤字みたいなもの)を覚える手間が、たくさんある。つまり、「おれの文字(誤字)を区別して使え」というエゴイストの要求を聞き入れて、新JISには変な文字がたくさん取り込まれて、その結果、エゴイストは大喜びだが、あなたは莫大な手間が要求されるようになったのだ。(比喩的に言えば、「邊」の65種類も異体字・誤字を覚える必要がある、というようなものだ。)
かくて、あなたは今後、変な文字をたくさん使うことを迫られる。さもないと、辻さんが「この異体字を使え」と強要だけでなく、変な文字の**さんたちも「この異体字を使え」と強要するからだ。これまでは「JISにはその文字がないんです」と言い逃れできたが、もはや言い逃れはできなくなった。さっそく、新JISの文字の読み方と書き方を、毎日勉強しましょう。小学生のようにね。
今日はまず、ドリルの1ページ目を開いて、十字覚えましょう。明日も十字。明後日も十字。全部覚える必要があります。覚えなければ、給与ダウンかも。……ついでだが、いくら勉強しても、その分、残業代は出ないはず。全部、新JISのせいです。 (^^);
なお、手間なしで大丈夫な分もある。それは、字形の変更がなされた分だ。この分だけは、無駄な略字[誤字]を、いちいち覚える手間はない。たとえば、「ぼうとく」という文字を書くときには、現状のまま、何もしないでいい。そうすれば、現時点では「冒涜」というふうに略字で表記されるが、将来はこれが自動的に正字(シ賣)で表記される。それだけを使えばいい。今までの略字は使えなくなるが、そもそも、略字というのは、もともと存在しなかった誤字にすぎないから、消滅しても何ら不便はないし、むしろ余計なものがなくなってすっきりする。どうしても表現したいときは略字フォントや画像で表現すればいいだけだ。
( ※ 仮に、「字形の変更」がなかったなら、「涜」などについて、いろいろと面倒な手間がかかるはずだ。いちいちIMEに正字を登録したり、既存の全文書に対して文字の置換をしたり、と。かといって、略字のまま残せば、「おまえ、馬鹿か? 正しい漢字も知らないのか? こんな誤字は使うな」と怒られる。……で、そういうトラブルが生じなくて済んだのは、南堂久史という変人が「字形の変更」を推進したからだ。5人はちょっと不満になるが、95人は大幅に助かる。あなたもその95人のうちの一人だ。[例外となる人も少しはいるでしょうけどね。])
|
【 あとがき 】
これでようやく、話は済んだ。
なお、舞台裏を示しておこう。私はこれで、どんな得をするか? もちろん、一文も得をしない。むしろ、手間をかけただけ、骨折り損のくたびれもうけである。
しかし、この程度なら、まだいい。たったの数時間だ。それに比べて、以前、「日本語を守れ」というための意見を展開したときには、今回の千倍ぐらいの多大な時間を費やした。その時間をコンビニのアルバイトで過ごしても、何百万円にもなっただろう。それだけの時間と手間をかけたのだ。
で、それだけの手間をかけて、私は、何を得たか? 金銭的には、何も得ない。ただし、日本語だけは守られた。日本語が守られたこと。それだけが、私の報酬だ。そして、その報酬を得るために、私は何年間も多大な努力をなしたのだ。
なお、この私の多大な努力に対して、世間は何を与えてくれたか? 「トンデモだ」という評価だけだ。「互換性を無視して字形の変更を唱えるなんて、常識知らずのトンデモだ」と。
しかし、その評価を、私は甘受しよう。なぜなら、私がこの行動を取ったのは、私のためではなくて、愛する日本語のためだからだ。愛するものために自己を犠牲にして、結果的に愛するものが守られたなら、もって瞑すべしだろう。
古典派経済学者は「自己の利益のため生きよ」と主張する。真のマクロ経済学者は「愛するもののためのために生きよ」と主張する。
ここまで述べて、ようやく、筆を措くことにする。
【 参考 】 略字体への統一について
略字と正字が混在すると、字体が統一されない。そこで、「常用漢字は新字体だから、この新字体にすべて統一しよう」という意見がある。つまり、「略字への統一」である。── これが「略字派」の主張である。
実は、この方針のもとで、1983年のJISは改定された。そして、これが、以後の大混乱の元となったのである。
ところが、この歴史を無視して、ふたたび「略字に統一しよう」という意見が見られる。ただし、その主張は、理論的にまったく破綻している。この件は、「略字 侃侃諤諤」のページで詳しく説明したので、そちらを参照。「統一」という語で検索するといい。
なお、「略字体への統一」を主張する場合には、たとえば、以下のすべてを略字にすることになる。
辶 辸 达 迀 迁 迆 迊 迋 迍 运 迒 迓 迕 迠 迣 迤 迨 迮 迵 迶 迻 迾 适 逄 逈 逌 逘 逛 逨 逩 逪 逬 逭 逯 逳これらは、既存の文字規格( unicode )で扱える文字だ。ただし、「統一」を唱える場合には、これらだけでは足りない。康煕字典の漢字数は、5万ぐらいもある。そのすべてを略字体に統一する必要がある。さらには、このあと未発見の漢字が発見されたりしたら、そのたびに略字体に変更する必要がある。大変な努力が必要だ。
しかも、その努力のすべては、まったくの無駄である。なぜか? 現実にこれらの文字を使うユーザーは、正字体しか使わないからだ。つまり、「略字体への統一」というのは、「まったく使われない文字規格を作ること」であり、同時に、「必要不可欠な正字体の文字規格を廃止すること」である。
比喩的に言えば、「微分や積分の専門記号を、素人にもわかりやすいハートマークなどに書き換えて、素人にも使いやすくすること」に相当する。そうすれば、素人は、専門記号を見ても、すぐにわかる。ただし、素人は、それらの専門記号を使うことはない。つまり、
「使わない人にとってはとっても便利であるが、使う人にとってはすごく不便」
これが「略字体への統一」の意味だ。
さらに言っておこう。現実問題として、「略字体への統一」は、やりたくても不可能である。
なぜか? パソコンの文字だけなら、フォントの交換により可能だ。しかし、書籍の文字は、どうしようもないからだ。現在発行されている書籍では、略字体でなく正字体(国技審議会が定めた文字)が使われている。また、過去に刊行された書籍も、同様だ。これらの文字については、「略字体への統一」は、原理的に不可能である。すると、どうなるか? 「統一」のかわりに、「二つの字体の流通」という、混乱だけが起こる。
ではなぜ、略字統一論者は、そのことに気づかないか? 簡単だ。彼らは、本を読まないからだ。本を読まない。難しい漢字も知らない。毎日毎日、パソコン画面とだけ、にらめっこ。だから平気の平左で、「略字体への統一」という荒唐無稽な空想を提唱するのだ。いわば、自然数しか知らない小学生が、「実数や虚数なんて難しくて不便だから、簡単な自然数に統一しよう。それで問題ない。だって、ぼくは自然数しか使わないから」と主張するように。
( ※ これらの問題は、5年以上前に、さんざん議論されたことである。今さら蒸し返すまでもない話だ。)
《 参考ページ 》
Open ブログ 「文字規格」カテゴリ
※ 今回の話についてもっと詳しく知りたい人は、上記をお読み下さい。
※ なお、特に大事なのは、 → 8月13日 ,8月16日
※ 世間の反響の総括は、 → 9月07日 (この記述は、後日追記。)
※ その他、次の情報もあります。
略字 侃侃諤諤 (基礎的文献)
字形の変更 (南堂説 : 検索)
【 オマケ 】
特に読む必要はないのですが、暇な人向けに、次のページもあります。
- 異体字の迷宮
略字と正字の違いは、異体字の違いだ。では一般に、異体字はどういうふうに区別されるか? この問題は、非常に複雑で面倒臭い。いわば、泥沼だ。この泥沼に足を突っ込みたい人は、このページを読むといいだろう。頭がこんぐらがってくるだろう。だが、こんぐらがった頭が、とりあえずは整理がつくようになる。……あくまで、暇な人向けだ。超難解で正解のないパズルで、時間をつぶしたい人向け。 (私は? 辟易しました。読み返したくないですね。)
- 区体論「誤読解説編」
「南堂はトンデモだ」と主張する人は、文字コード以外の分野にもわんさといる。その典型は、数学分野の人々だ。彼らがいかに見当違いの批判をしているかを示す。たとえば、ノイマンの説を「南堂の説だ」と勝手に主張する。あげく、「南堂はトンデモだ」と主張して、ノイマンをトンデモ扱いする。二重の勘違い。
. . . . A Link to 量子論・量子力学 & 進化論 & 集合論をめぐって