正直、「日本の漢字」と「中国の漢字」が同じか異なるか、なんて問題、机上の空論のような気がして飽きた。
単純に歴史を遡れば漢字は大半が中国から来たものだ。「峠」「働」「鰹」「栃」等、和製の漢字も多いが、それらの偏旁は中国の漢字から採っている。「漢字は中国の物」「仮名も漢字に由来するから間接的に中国の物」という意識が江戸時代の国粋主義者にあって、それ故に彼らは神代文字なんてものを捏造した訳だ。
日中混在の文書(語学の教本など)には、慥かに「高」とか「食」とかいった文字が日本語と中国語とで異なる字体で印刷されていることがあるが、戦後の日中の国家規範が教育によって習慣として根付いて、その規範や習慣を反映したに過ぎないと思う。こういう違いが「文化的な違い」なのかは疑わしい。
手元に『ポータブル日中・中日辞典 繁体字版』(蘇文山監修、三修社)があるのだが、日中部分の中国語(台湾華語)による説明は楷書体で之繞は一点折れ之繞、中日部分の親字は明朝体で二点折れず之繞なのである。草冠も前者は四画草冠、後者は三画草冠である。
「年月日をスラッシュで区切って記す順序はイギリスとアメリカで違う、故に日本人の名字と下の名を入れ替えるべきか入れ替えるべきでないかという議論も無意味なのである」(大意)という主張をしているサイトを割と最近見かけたが、誤ってブックマークを消してしまった。
(余談)Edge はいざ知らず、Firefox では選択したブックマークは Delete キーをポンと押すだけで消えて失くなるのである(サイト自体は消えないぞ)。削除確認のダイアログも出ない。
以前、Twitter で野嵜健秀氏について「正字を奨めている人が自分の名前に俗字を用いている」とあげつらっている人がいた。「嵜」の字らしい。野嵜氏のファンとして「一本取られた」と思った。
結局、ほら貝某氏とか安岡某氏とか、日本で文字コードを論じている人の大半は、「粒度の細かい文字コード」が理想だったのだろう。
「右骨」と「左骨」を峻別する文字コードがあって、更にその両方が「言語等の違い」などに応じて遣い分けられているテキストがあって、ある種の「潔癖主義者」が「同じ字の字体は統一すべき」と考えるなら、置換処理をするだけで簡単に統一できる。また別の意味の「潔癖主義者」が「同じ字とて字体は言語等に応じて遣い分けるべき」と考えるなら、置換処理なんかしなくてよい。「大は小を兼ねる」「小は大を兼ねない」と云われる所以である。
で、結局、Unicode の異体字セレクタはどうなったのか。
知人にビートルズのファンがいて、John Lennon の J の上のセリフをやたら長く書く癖があるのだけれども、イギリス人に(ついでに、アメリカ人等にも)T と間違われないかとちょっと懸念している。
因みに「イギリス人の書く cursive(筆記体)の T はフランス人やドイツ人には I や J に見える」という話も聞くけど、これ文字コードの業界ではどう扱うべきなのだろうか。「Unicode で異なる字体が統合されているのは『日中韓台港越の漢字』だけではない」という議題の一端に思えるのだが。
そもそも、Unicode とか JIS とか ASCII とか、筆記体(漢字では草書体)の字体の包摂基準を恐らく提示していないであろう。手元に仕様書や規格書がない、それどころかウェブを閲覧する時間すら限られているのが、元々私がこの分野を語る上で足枷なのだが。
数学用ラテン文字筆記体(ℐ 𝒥 𝒯 𝓘 𝓙 𝓣)は……。
ここ(彼岸花試験圃)の 2024 年 11 月 12 日付の記事を改訂した。動植物名に和製漢字がごまんとあるのは私も承知していたはずなのに、言及し損ねては読者諸氏を混乱させてしまう。
こういうふうに Unicode 批判批判みたいなことばかりしていると「Unicode なんていう資本主義とグローバリズムの走狗を擁護する鬼畜め」とか罵られそうで怖い。
私が Unicode が好きとか嫌いとかというより興味があるのは「文字を同定する」「分類する」ことの難しさに興味があるからであって。
Joseph Becker の『Unicode 88』は大雑把にしか読んでいないが、諸々の疑念がある。
以前 nkay 氏が「Unicode は文字を集めたものではなく文字コードを集めたもの(だった)」(大意)と私めを諭してくださりました。ささやかながら感謝します。
「僕は鰻だ」と「でーんでん電器はヤマダだろ」は文として同じ構造ではなかろうか。
「90 年台の Unicode 推進派の人たちは『日中韓台港越の字体の違い』を『書体の違い』と認識して、その違いを『フォントで切り替えるべき』と考えていたのではなかろうか」という説を聞かないが、違うのだろうか。今更ネットニュースの論争を確認するのも難しい。
Twitter(現ペケ)はいつ頃からか、「発言自体の言語を分析してフォントを切り替える」手法を採っていた。それ故、Twitter やペケの利用者が困っているという話をあまり聞かない。現状、無難な手法だったと個人的には思っている。プレーンテキストには応用できないが。
『中国語[文法]トレーニング』(宮岸雄介著、高橋書店)を買った。発音の解説が音韻表を含め 8 ページ。「文法」に特化していない入門書で学んでいることが前提なんだろうか。
中国人の教師、自分のことも「老师(老師、lǎoshī)」って名乗るらしい。若く見られたい先生方も「老师」って称するんだろうか。日本人には「老荘思想」の「老子(Lǎozǐ)」と紛らわしい。
二十代の頃、福山駅前で「ヤマダ電機はどっちですか」と訊かれた。多分日本語で(ここの記憶が朧気なのがおかしい)。で、「東へ五キロメートル程往ったら着きます」と日本語で答えても通じない。どうも中国人か台湾人らしい。で、東を指して付け焼き刃の北京語で「五公里(ウーコンリー)」と言ったら通じた。因みに声調は適当。それどころか実際に駅前からヤマダ電機までの距離を地図で調べたら、三公里くらいだった。
で、それを入院した時に隣の患者さんに半分自慢気に語ったら「あの頃はキャスパにベスト電器があったからそっちへ誘導すればよかったのに」(大意)と窘められた。
コンピュータのテキストで「用字系」という概念が活躍する状況、主にフォントの選択だと思う。
というのが、コンピュータのフォントというのが概ね用字系毎に設計されているからである。即ち、アラビア文字にはアラビア文字に特化したフォント、デーヴァナーガリーにはデーヴァナーガリーに特化したフォントが存在するのである。但、ラテン文字、特に ASCII 範囲内の字形は比較的製作が容易なので、大抵どのフォントにも収録されている。
一方「用字系毎にフォントを割り当てられる処理系」は、Firefox 等のブラウザがそれに準ずる程度である。MS‐Word や LibreOffice Writer 等、「英数」と「日本語」の二通りのフォントしか設定できない処理系もある。テキストエディタに至っては、その多くが単一のフォントしか設定できない。
又、よく知られている通り、Unicode に於いて統合された漢字等の字体の違い(伝統的というより、近代の国家規範によって生じた違いが大きい)を辨別したい層も多い。また漢字のフォントも概ね日本語向け、中国の漢語(シナ・チベット語族漢語派の言語の総称)向け、台湾の漢語向け、香港の漢語向け……に特化している(漢字は余りに字数が多いので、フォントの製作に手間がかかる)。そして Firefox では、漢字に関して概ね国家規範毎にフォントを設定することが一応できる。そして HTML の lang 属性等に応じて異なるフォントで文字はレンダリングされる(xml:lang 属性には対応していない)。
一方、Adobe と Google が漢字の各国の規範に準ずる字形を違和感なく混淆できる Source Han Serif なるフォントを最近漸く開発したが……。
正直、私は漢字に関しては偏旁合成による文字コードにいまだ一抹の期待をしている。Unicode の ideographic description sequence のような方法で実際に漢字を指定するのである。「渡」を「 ⿰水⿸庶又」のように表現するあれである。
漢字の偏旁の分析に関しては、CHISE というプロジェクトが先を進んでいるらしい。
無論一字は可変長になるが、Unicode も発案当時から基本的に可変長である。合成辨別符、ブラーフミー系文字、UTF‐8 等。それを 16 ビット固定長だと宣伝していた初期の Unicode 推進派が嘘吐きであるという某太田氏の批判は、この点に関しては正しい。一方で三十年の時を経て Unicode はウェブと共に普及した(してしまった)。
何も文字コードを走査する毎に字形を造形する必要は無い。フォントファイル内部で IDS(のようなもの)毎に字形を保持していてもよい。時が進めば「字形合成 AI」も発達するかも知れないが……。
偏旁合成コードの利点としては、Unicode 等既存の文字コードに比べて体系が整然とする、それに拡張がし易いことだと思っている。逆に言うとその位である。検索等にも便利か否か。
偏旁を好き勝手に組み合わせて新しい漢字を造るのを許す訳ではない(許さない訳でもない?)。
甲骨文の偏旁構造に関しては、彼岸花試験圃 2024 年 9 月 27 日、2024 年 9 月 28 日も参照されたい。
コンピュータのテキストで「ラテン文字」と「ローマ数字」を厳密に使い分けなければ気が済まないかのような人に時々遭遇する。BeatmaniaⅡDX ←こんな風に。日本製のフォントでは却って不格好になることが多いが、欧米製のフォントではラテン文字に溶け込む場合が多い。
「ラテン文字」と「ローマ数字」は「別物」だから遣い分けねばならない、という主義なのだろうか。そして「何故ラテン文字とローマ数字は別物なのか」と言えば「意味が異なる」からだろうか。
即ちラテン文字という枠組みの中にも「同綴意義語」があるのだが、ASCII にも JIS にも Unicode にもラテン文字を意味によって遣い分ける手段は存在しない(漢字の「鮎」等も然り )。
無論、これはラテン文字とローマ数字を遣い分けなくてもよい理由になっても、遣い分けてはいけない理由にはならない。文字コードを論ずるにしても、それを意識する必要がある。
いえ、気持ちは解るんですよ。潔癖な態度というか。
「字源」にしても、ローマ数字の Ⅰ や Ⅴ は羊飼いが羊の数を数えるのに石や骨に描いた筆画、ラテン文字の I や V はエトルリア文字、ギリシア文字に遡れるので異なります。但、Ⅽ はラテン語の CENTVM、Ⅿ はMILLE の頭文字を兼ねて多くの中から選ばれたそうですけれども。
偶々ラヂオで、昔は毛嫌いしていた広島辯を聞く。
広島辯というか特に女性の広島辯、「見んさい」とか、何となく漁港っぽい風情がある。さばさばしているというか。牡蠣筏の上で発達したんだろうか。「見んちゃい」は遊郭言葉か何かか?
鞆辯というか阿藻珍味の職人の言葉は上品だった。
日本語の「否定疑問文」にどう答えればよいのか、いまだに戸惑う。
要するに「お箸は要りませんか?」と問われて、実際要らない時に「はい」と答えればいいのか「いいえ」と答えればいいのか怯む。規範的には「はい」なのだろうけど。
しかも餓鬼の頃はちゃんと否定疑問文に答えられていた気がするんだ。何故この歳になって怯むんだろ。
面白いサイトを見つけた。漢字に詳しい人には「何を今更」と思うような内容かも知れないが。
ただし、一つだけ動かしがたい事実は、もはや漢字は御当地主義 localism だということです。日本は日本で、中国は中国で、台湾は台湾で、そして韓国は韓国で、それぞれ独自に形・音・義および筆順・画数が決められていて、相互に参考とすることさえあれ、互いの関係に優劣の差はありません。個々の教育政策・教育方針などに応じて、悪く言えば銘々勝手に、善く言えば各々自由に、裁量権を行使しているわけです。
――古田島洋介、『もはや漢字は御当地主義』
或る意味、太田昌孝氏始め Unicode 反対派の人には、漢字に関するこういう具体的な説明文を引き合いに出して「(今の)日中韓台港越の漢字はかくも違うのですよ」と説いて欲しかった。無論、この古田島氏の解説だけでは例えば「骨」の字体の問題は解決しないけれども。
ところが、太田氏の著書『いま日本語が危ない』の裏表紙には「いたずらに観念的、比較文化論的なディペート[侭、渡邊註]に陥ることなくユニコードの問題点を明らかにした」と書いてあるが、それ故か「日本漢字」「中国漢字」「韓国漢字」なる「比較文化論的」と思しきパラダイムへの解説が少なかったり、日本語という「文化」を護るつもりなのに「比較文化論的なディベート(英 debate)」が不十分だから(皆無ではないからややこしい)、少なくとも私は太田氏の主張に対して蟠りが残る。
一応私は、太田氏の草冠に関する主張に、以前このサイトで少し反論を試みている(太田氏の本のページ番号については、今回の更新で追記した)。
太田氏、三画草冠と四画草冠を「露骨に異なる」と言ってみたり、その違いを辨えなければ「多くの日本人は「誤字だ」と思うだけ」とか主張していたので(『いま日本語が危ない』pp.175, 176)、却って現代日本人、特に書道の心得のある人と認識を異にしている。
――渡辺朱倫、「彼岸花試験圃」2024 年 10 月 12 日付
何が言いたいのかというと、多くの日本人は漢字辞典とか漢和辞典で「草冠は旧字体(大抵の場合、康煕字典体)では四画」だと知っているし、また毛筆楷書に於いては日本でも四画草冠が普通に用いられているのである。
嘗ての東アジアの共通視覚言語たる「漢文」に言及したいのは山々だ。あまり深くは掘り下げまいが、少なくとも漢文で国家・民族を越えて通信するには、字体に関して或る程度共通の認識が必要だったはずである。骨や草冠に拘っては漢文による通信はできなかったのではなかろうか、と私などは推測する。漢字の「御当地主義」が進んだのも、漢文文化の衰頽が一因ではなかろうか。
最近『壊れかけの Radio』の 8 cm CD を某所で見つけたのだが、「德」の十一画目の横画も省かれていたし、「英」の草冠も三画だった。後で今の字体に変えたのだろうか?
偏旁合成文字コードの具体化を目指して、案を煮詰めている。別に「外部コード」として世の中に普及しなくてもいいんだ。
鎄 =: <金 衣 口 TB-M L-R>
锿 =: <金 V1 衣 口 TB-M L-R>
利 =: <禾 刀 L-R>
初 =: <衣 刀 V-1 L-R>
廣 =: <广 黃 LT-M>
島 =: <鳥 山 RT-M>
縣 =: <縣>
広 =: <广 𠃋 V1 LT-M>
島 =: <鳥 山 TR-M>
県 =: <縣 V1>
广 =: <广>
岛 =: <鳥 V1 山 RT-M>
县 =: <縣 V2>
進󠄁 =: <彳 止 T-B V2 隹 LB-M>
L-R
、TB-M
等:偏旁位置指定子。Unicode の IDC のようなものだが、後置。(「偏旁入力」に有利だから。)V-1
、(V0
)、V1
、V2
:異体字指定子。後置。0 が最も一般的な字体、−1 は完成形に近い字体。極端な字源主義は無益どころか有害だとは一応思うが……「則」は 貝 刀 L-R
とすべきか 鼎 刀 L-R
とすべきか。
太田某氏などは「日本漢字スクリプト」だの「中国漢字スクリプト」だのといった「スクリプト」の峻別を主張していたが、「スクリプト」とかその訳語である「用字系」とかいった用語自体、文字学だの文字コード問題などに深入りしていない人には聞き慣れない、見慣れない言葉である。「ローマ字」とか「ギリシア文字」のような概念や用語が頭の中にあっても、である。だから「日本漢字スクリプト」と「中国漢字スクリプト」は違う、と主張されても混乱する。
「スクリプト」なる語に関しては「インタプリタのソースコード」とか「筆記体」の意味もあるので猶更ややこしい。
『いま日本語が危ない』の問題点の一つは、「日本漢字スクリプト」とか「中国漢字スクリプト」なる概念を扱うこと自体が正に裏表紙で避けた(大意)と称する「観念的」で「比較文化論的」なディベート(ペはベに修正)である所である。
鉤が右になったり左になったりする「骨」が不便ならば、少なくとも二つ以上(鉤が∧型になっている字体も存在するので、それを数えれば三つ以上)の字体の「骨」を用意すればよい。草冠の三画と四画然り。(太田氏御製の ISO‐2022‐JP‐2 で基本的にそれはできる)。但しそれに「日本漢字スクリプト」だの「中国漢字スクリプト」だのといった地域名付きのスクリプト名を与えると寧ろ混乱する。地域名を付けるから「万葉集は中国漢字スクリプトで書かれている」(p. 118)という「観念的」で「比較文化論的」に不可解な主張すら発せられるのである。
ところで太田氏、78JIS の解説を頼りに「78JIS の漢字は日本漢字」(p. 65)と主張しているが、78JIS で万葉集を電子化してはいけないのだろうか?
因みに私は「スクリプト(用字系)」という概念自体、例えばギリシア文字とラテン文字とキリル文字の違いも、極端を云えばギリシア文字と平仮名の違いも、観念的なものだと思う。
無茶苦茶な文を書いては Unicode も太田氏も笑えない。
「いーのかなーいーのかなー、せーんせーにーゆーちゃーろー」って幼稚園児が囃し立てるのって福山近辺だけですかね、「ゆーちゃーろー」(言ってやろう)が福山辯というか広島辯寄りのような。
何故日本と中国の規範でや「骨」の字体が異なるのか、その相異がどういう文化的背景(早い話が「字源」云々など)に基づいているのかを説明できる人がいない。だから Unicode を制定した人たちも混乱した。『いま日本語が危ない』という文化の衰頽を危惧するかの如き趣旨の本が「比較文化論的ディベート」を避けているのは、手抜きのような気がしてならない。
「骨」の字体の遣い分け問題は、基本的に近現代の政府規範と関係する問題だ思う。なにじんであろうが、日本語で「左骨」が用いられたり中国の漢語で「右骨」が用いられるのを「おかしい」と思う人がいるとすれば、「余りそういった事情を知らない人」(これに属する人こそ寧ろ多いと思う)か「几帳面な人」か「言語国定主義者」だと思う。無論「おかしい」と言われたら修正するのが「世渡り」かも知れないが。
私は「言語国定主義」には批判的な立場である。言語や文字を主導するのは文筆家の役目だと思う。但、今の共産中国で文筆家が言語を主導することができるかどうか。
日本語と漢語の両方、或いは「漢文」に慣れている人は、「骨」の字体の違いは(極端な場合、二画言偏なんかも)「所詮近現代に役所が決めた規範」と考えて、寛容に振る舞う人が多いのではないかと、私なんかは推し測っている。
知人の知人(多分)に「俳」の字の楷書の七画目(一般に縦画)を右に払って妙に不格好な形にする人がいて、「この書き方はおかしいんじゃないですか」と指摘したら「渡邊さんだって自分の字に文句をつけられたらどうしますか」等と言い返された。私は字体なんて批判大歓迎なのだが、世の中には案外「批判はするな」という主義の人がまだまだ多いらしい。
この字体も「私にとって違和感のある字体」でしかなく、この字体を「おかしい」と看做す「文化的背景」を私は知らないし、少し漢字を知っている人にとっても同様ではないかと疑っている。
𠮷野家、中国でも「土𠮷」で名乗ってましたっけ。
𠮷田姓や滑川姓の人が中国に往ったら字体の書き換えを半ば強制される機会が少なくない筈だが、納得するかどうか。
台湾政府は割と異体字に寛容らしいが。
英語の code /ˈkoʊd/ と cord 及び chord /ˈkɔː(ɹ)d/ は、発音が異なる。
実際ごっちゃにしている日本人も多いので、code は「コウド」と音写したほうがいいのではないかとも思う。Unicode もユニコウドの方がいいだろうか。
いろいろ怪しい記述を修正。
いやさ、もっと体系的な論文を書きたいんだけどさ。
……とまあ、ずっと思っていたのですが、あってます?
家の形をした炭化水素を英語で housane、教会(の建物)の形をした炭化水素を churchane というらしい。
*oikane、*ekklesiane にしたい気持ちを堪えられないのだが、最近の化学界には文理両道の学者先生が少ないのだろうか。
寧ろギリシア語の濫用を止めて methane は *meadane、pentane は *fivane、neopentane は *newfivaneにしろ、という先生もいるんじゃなかろうか。
重複はチョウフク党、共存はキョウソン党。
それと、関係あるかどうかはともかく、面接をメンゼツと読む悪い癖がある。面会謝絶とごっちゃになったのだろうか。