文字学概説

渡邊朱倫

文字とは何か

文字は言葉を視覚によって顕示する手段である他、それ自体が物事を表す手段となる。

概念を視覚で伝達する手段には他に手話などがある。

書記素と単一の文字

一般に文字は書記素と呼ばれる構成単位からなる構造として認識される。書記素は音素・音節・語・概念等に対応する。

物理的に別の場所に在っても、観念的に同一視される文字の単位を字種という。字種は一個、或いは少数個の書記素から成る。

書記素と字種は一般に図形(後述する「字形」)で表されるが、字形は状況や文脈、排列、所謂書体などによって変わり得る(後述)。

字形

文字の図形としての形状を字形(英 glyph)と謂う。字形は(後述する)書体・字体に依存する。

同じ字種が全く同じ字形として顕現されることは、厳密には有り得ない。人の認識力は、字形の細部が異なっていても同じ字種と看做すことが多い。

書体

字形の筆画の形状等、意匠としての特徴を書体と謂う。

書体は概ね用字系毎に存在する。ラテン文字の書体にはローマン、ルスティカ、イタリック、サンセリフ、フラクトゥール等がある。漢字の書体には篆書・隷書・草書・行書・楷書・明朝体等がある(甲骨文・金文等をそれより後の漢字と別の用字系とする場合もある)。

字体

文字の筆画の構造を字体と謂う。

ラテン文字の g(小文字)には「閉じた g 」と「開いた ɡ 」があるが、この二つは字種としては通常同一視される。このような関係を互いに異体字であると謂う(但し国際音声字母(IPA)に於いては、歴史的理由から後者を用いるのが公式とされる)。

漢字の「吉」と「𠮷」も一般名詞では通常同一視される為異体字とされるが、固有名詞では一方を公式とする場合もある(牛丼チェーンの「𠮷野家」、各種人名等)。

「蘇」と「甦」は字体どころかそもそも構成する偏旁(書記素)が異なるが、「よみがえる」の意味の場合は可換とされ、異体字とされる場合がある。但し「紫蘇」「乳製品」の意味で「甦」を遣うのは不適切とされる。

用字系

書記素とそれらを組み合わせて言葉や物事を書き表す「ラテン文字(ローマ字)」とか「アラビア文字」といった体系を用字系と謂う。

ラテン文字は欧米諸国による植民地支配の結果、インドネシアからアメリカまで言語の系統に依存しない汎用的な用字系になっている。但し用いられる書記素・文字の頻度は言語によって異なる。アラビア文字はイスラームという宗教と共に普及したが、これも用いられる文字の頻度は言語によって異なる。

英語では é という文字の使用頻度はかなり低いが、résumécafé 等という表記もあるので皆無ではない。但し「英文字(English Alphabet)」というと é は通常含めない。

日本語などでも人文学・情報工学などの分野では新しく借用した語にラテン文字を用いるのが常態化している。

ギリシア文字

ギリシア文字はフェニキア文字から派生した。フェニキア文字は通常母音を表記しないので、喉音を表す文字を母音に流用したとされる。

小文字・アクセント記号等が発明されたのは紀元後。

ギリシア語専用だと思われがちだが、オスマン帝国時代にキリスト教徒のトルコ人がトルコ語を綴るのに用いられた例もある。

ラテン文字

一般にラテン文字はエトルリア文字から派生したというが、ラテン文字とエトルリア文字が別物と看做されるようになった時点は曖昧としか言いようがない。ラテン語の表記に流用された際に分岐したと考えると、ラテン文字がゲルマン語やスラヴ諸など更に別の言語に流用された際にも「分岐」が起こったと考えざるを得ないし、そういう考え自体は「誤り」ではない。実際「ラテン語の A と英語の A は別物である」とか「『ラテン文字』と『英文字』がある」という考えの人は少なくないらしい。

全世界的に用いられている用字系ではあるが、一字が完全に一つの音に対応する訳ではない。国際音声字母(IPA)もラテン文字を基本に制定されているが、音声の個人差まで表記することはできない。

英語は通常ラテン文字で表記されるが、文字と音の間にかなり不規則な対応が存在する。

漢字

漢字の初期の段階が甲骨文であることは知られているが、甲骨文・金文以降に廃れた文字、出現した文字もある。

現代では日本・中国(中華人民共和国)・台湾(中華民国)の各政府が独自に字体の規範を提示している。但しこれらも全く守られている訳ではなく、例えば台湾では康煕字典体に近い字体が用いられることも多い。