情報システム学会 メールマガジン 2013.625 No.08-03 [13]

連載 プロマネの現場から
第63回 『舟を編む』・・辞書作りの世界

          蒼海憲治(大手SI企業・金融系プロジェクトマネージャ)

 映画『舟を編む』(三浦しをん原作)は、辞書作りの世界を垣間見ることのできる興味深いものでした。辞書作りの世界というと、一生ものというイメージがあります。つまり、出版社に入り、大辞典作りの担当になると、定年まで30年以上にわたって携わるというもの。実際、オックスフォード英語辞典が、70年以上の歳月をかけて完成された話や、『佛教語大辞典』の中村元さんが20年かけた3万枚の原稿が、出版社側で紛失してしまう事故があり、その後、7年かけて書き直したという印象的な逸話が沢山ある世界です。
 映画の中でも、玄武書房という出版社が『大渡海』という大辞典を、15年間の長い期間かけて作り上げる中で、様々に苦労しつつも、そこに喜びを見出して取り組む様子が描かれています。
 システム構築においても、大規模プロジェクトの場合、データ分析や業務分析に先だち、データ項目辞書の策定作業が重要になります。また、システムの難易度や複雑さを評価する指標として、項目数の多寡があります。たとえば、項目数が、数千項目未満と、1万項目以上の場合、システム開発の生産性は1桁余り異なってくる。大規模プロジェクトにおいて、辞書は、システム構築のベースラインとなります。そして、整備された辞書を使うことによって、全体最適、全体整合性、トレーサビリティ確保、保守・運用性向上等の効果を得ることができるようになります。
 そのためのシステム構築におけるデータ標準化の作業は、システム部門だけでなく、顧客ユーザ部門を巻き込んだ大がかりなものになります。個別の業務システム構築の要員・体制とは別に、全社活動として、辞書作り・データ標準化作りの体制を作ることができるかが重要になります。
 今回、映画に触発されて手に取った辞書作りの書物を少し紹介したいと思います。

 そもそも辞書とは何でしょうか?

 『広辞苑』(第三版)の「辞書」の項を見てみると、

 一番目の意味は、「ことばを集め、一定の順序に並べ、その読み方・意義・語源・用例などを解説した書。辞典。辞彙」とあります。
 学生の頃から、「辞書を引く」ことだけでなく、「辞書を読む」ことが大切だ、と先生方がいうのを聴いたものの、実践できなかった覚えがあります。いま改めて考えると、「辞書を引く」のは、読み方・意義を知ることであり、「辞書を読む」とは語源・用例なども含めて読む、ということなのだと思います。
 このことばを羅列した書物が、なぜ『プロジェクトX』のような大変な物語となってしまうのでしょうか?

 単に言葉を集めるといっても、どう集めるか?
 どの言葉を残し、どの言葉を捨てるのか?
 語源や用例をどう拾うのか?
 その網羅性や十分性をどう担保するのか?

 等を少し考えただけで、実際の作業の途方もなさが感じられます。

 辞書作りの歴史をひもとくと、18世紀までは辞書作りは、本屋からの依頼を受けた個人が一人で行うものでした。サミュエル・ジョンソンは1755年に、『英語辞典』を独力で完成させ、ノア・ウェブスターも、1806年に、ほぼ独力で小さな辞書を一つ完成させた後、1828年に、2巻になる大きな辞書『アメリカの英語辞典(American Dictionary of the English Language)』を完成させています。それに対し、19世紀初頭以降は、一人で執筆・編集を行った辞書の中で、優れた辞書と呼べるものは一つもありません。

 英国の『オックスフォード英語辞典』(以下、OED)には、数名の編集者がいて、現在も進行中のプロジェクトであり、さらには未来の編集者も決まっている、といいます。初版には、ジェイムズ・マレーを主幹とし、ヘンリー・ブラッドリー、C・T・アニアンズ、W・A・クレイギーの4人がいた。以降、編集者をプロマネと見做せる辞書編集のプロジェクトチームとなっています。
 また、『ブリタニカ』には、錚々たる執筆者がいます。1911年刊行の第11版には、科学者のT・H・ハックスリー、哲学者のアルフレッド・ノース・ホワイトヘッド、詩人のアルジャーノン・スウィンバーン、獄中で「無政府主義」の項を書いた革命家のピョートル・クロポトキン。第13版には、魔術について書いたフーディーニ、精神分析について書いたフロイト、物理学について書いたアインシュタイン。そして、なんともこのぜいたくな執筆陣をまとめ上げたマネジメントチームがいたことがわかります。

 一方、明治期の日本においても、西欧諸国に近代国家と認められるために、OEDや『ブリタニカ』に匹敵する辞書が求められた、といいます。安田敏朗『辞書の政治学 ことばの規範とはなにか』(*1)には、近代国民国家における国語選定の持つ意味についてのべられています。

 つまり、
≪国語とは、実務的に国家の諸制度を担う側面と同時に、国民統合の象徴という役割も担うものとして認識しなおされてきている。一般的にいえば、単一の・あるいは二、三の国語を選定し、国民国家すみずみにまで普及浸透させる作業が国家建設の理念にかかわらず必要とされる。≫

 そのような要請に対して初期の日本はどう対応したか?
 高田宏『言葉の海へ』(*2)は、妻と娘を亡くしながら、17年の歳月をかけて、日本で最初の辞書、『言海』を出した大槻文彦の評伝ですが、その当時の辞書作りの状況が説明されています。

≪いまの辞書づくりと違って、明治前期の辞書は、殆どが個人の手に成った。山田美妙の『日本大辞書』もそうである。これは美妙が『言海』に対抗して出した辞書で、口述筆記で急いで作ったせいもあろうが、美妙個人の色が生まに出ている辞書である。≫

≪大槻文彦の『言海』は、ひとりの人間が十七年、自分を顕(あらわ)すまい、物を顕そうとつとめながら、古今雅俗の語と格闘し、自国語の統一をめざしてつくり上げたものである。その裏に抑えがたく生まれた個人の色であった。≫

 まだプロジェクトチーム発足前夜の状況でした。

 そもそも、理想的な国語辞書とはどのようなものでしょうか?
 『日本国語大辞典』の編集に長年携わった松井栄一さんの『国語辞典はこうして作る 理想の辞書をめざして』(*3)によると、理想と現実がこう対比されています。

1.その人がある言葉を引いたとき、それが必ず載っているということである。
2.ただ言葉が載せられているだけでなく、その言葉について知りたいと思う情報が的確に示されているということである。
3.その言葉が実際にどう使われているかということを示す例が数多く添えられているということである。

 いつの時代のこういう作品にこういうふうに使われているという実例が多く添えてあるほどいい。

 これがある一語についてだけでなく、何十万という言葉一つ一つについて行われなければならないとなると、膨大な量になる。時間的にも経済的にも形にするのは大変難しい。
 そのためには、本来的な辞書は、生きた材料から言葉を拾い、生きた実例を集めて、それらを広く見渡した上で説明を付けるという着実な作業をする必要があります。
 ところで、普段私たちが使う市販の国語辞書はどのように作られているのか?
 「一体、現在出版されている国語辞書で、辞書作りの本道をあゆんでできあがったものがどれくらいあるか?」
と問うと、普通に使われている小型・中型の国語辞書の多くは、既成の評判のよい辞書を2、3選んでその語釈や用例を参考にして手を少し加える程度であるといいます。

 それでは、「本道」の辞書作りのプロセスとはどういうものでしょうか。
 松井栄一さんによると、『日本国語大辞典』(第一版)は、辞書作りの第一歩から始めた、といいます。

≪まずどういう内容にするかの大要と、細かい記述形式の検討に1年間を費やした。
 そして、上代から現代までを大きく四つの時代に分け、それぞれ時代別に専門の国語国文学者の参加を仰ぎ、どういう資料から言葉を拾い上げるべきかを考えた。

 また、これと別に、仏教関係の用語、訓点資料・古記録類・法制資料・農政史料などの用語、服飾などに関するいわゆる有職における用語などについて、それぞれ専門の学者の集まりを持って相談し、あたるべき資料を決めた。

 こうしてそれらの資料の中から採り上げた用例カードを作成するのに約3年をかけた。≫(*3)
 でも、やってみると、3年は短かすぎた、といいます。

≪さらに、以上のような作業と並行して、それぞれの語について既成の諸記述が一見してわかるような資料も作った。≫(*3)

 一般の国語辞書に加え、作品別・時代別・ジャンル別にまとめられた特殊辞書の類までも含め、30点以上の辞書類を材料にする。
≪・・ひとまず以上のような準備を整えたところで、項目選定の作業を進めるかたわら、≫(*3)
 いよいよ原稿作りにとりかかったのである。この原稿は、100名余りの大勢の人と分担する。

≪ところが、今度の辞書の場合は、そこから先が大変なのである。
 大勢の手によって書かれた原稿だからあとで少数の人が記述のしかたを統一しなければならないという仕事もさることながら、一そう時間のかかるのは、引用された例の一つ一つを、こちらが定めたテキストにあたり直して確かめるという作業である。≫
(*3)

≪かくして、原稿ができたというだけでは作業は半分も終わっていないことになる。≫(*3)

 一般の人は、原稿ができたところで、8、9分できたと思われているが、実際は道半ば。だから、時間がいくらあっても足りないといいます。
 以上の作業に要した年月は、映画の『大渡海』と同じく、実に15年間だったのですが、そのスケジュールはこうです(*4)。

・昭和36年に、5人の準備委員会による初会合により、編集方針を決める。
・その後、国語漢文教員8人による増補カード作り、約8万枚の調査、国文科学生30人により、辞書類・頭注の貼り込み、時代別・・・上代中古・中世・近世・現代毎の部会に、各10人による用例採集・資料の選定。
・各部会委員とその助手や、各種部会による、用例採集・用例カード作りによって、カード総数200万枚。
・編集部員・来社国文教員による用例カード整理・貼り込み台紙統合作業。
・国文専門大学教員3人による「立項」、編集委員代表の松井栄一氏による「立項」で、約40万に整理。
・国語国文の教員、約200人により、原稿執筆。
・国語国文学生、約100人が来社し、出典検討。
・各分野の専門家、約90人により、原稿整理・専門校閲。
・社員20〜90人により、表現・表記・書式の統一。
・昭和46年末より刊行開始、完了は、昭和51年3月。

 収録語数四十五万に対して七十五万にのぼる用例があり、第二版では、さらに充実し、語数五十万、用例百万を超える辞書ができました。

 ちなみに、大槻文彦の『言海』作成時には、また別の苦労がありました。

 ウェブスターと、室町時代以来の日本の辞書、数十冊とを比較すると、辞書に必要な5つの項目、「発音。Pronunciation.」「語別。Parts of speech.」(品詞のこと)、「語源。Derivation.」「語釈。Definition.」「出典。Reference.」を、すべて一から調べ直す必要がありました。そのため、和漢洋の書物の書籍を買い集めるため、いつも現在の数十万円を持ち歩いていた、といいます。

≪語の採集は捗(はかど)った。だがそれは辞書編纂の仕事のほんの一部に過ぎない。
 古語や古事物で意味のわからぬもの、説がまちまちなものがある。品詞の区別のつけにくい語がある。

 語源の不明な語がある。動詞の語尾変化の定めかねるものがある。
 仮名遣を決定する根拠がなくて、辞書中の順序が決められない語がある。

 動植物の説明はおおむねウェブスターに拠るつもりであったが、
 考えていくと、同じ動植物でも東西の風土によって形や色が違うことが多い。
 雑草、雑魚、小禽、魚介、俗間通用の病名などに至っては、
 支那にも西洋にもないものがいくらもあって、それを調べるべき邦書もない。≫(*2)

 それに加えて、

≪だが何より大事なことは、文法の制定であった。それなくして辞書はできないことが、日を経るほどにはっきりしてくる。
 「辞書ハ、文法Grammerノ規定ニ拠リテ作ラルベキモノニシテ、
  辞書ト文法トハ、離ルベカラザルモノナリ。」≫

 大槻文彦は、日本文法の創定、日本文典の編集を、日本辞書の編集に並行させた、といいます。

 さらに、語源・・

≪或る語に古義があることに気づかないでいることがある。
 途中で転じた意義を出発点と誤認していては、見かけにとらわれて、その語の素性を見うしなう。そこを見うしなうと、転義異義の語釈にも、ずれが生じてしまう。

 一つ語がいくつか異なる意義を持つことが多い。
 そのどれが先で、どれが後か。時代を経て意義が転じるのは、どういう理由によるのか。意義の移った経路を明らかにしなければ、本当の語釈はできない。≫(*2)

 でも、その作業を想像するだけで、その途方もなさにくらくらします。

 一方、OEDの凄さの一つは、ある言葉がいつ生まれ、どのように意味が移り変わったかの来歴が百年単位でわかることにあると思います。OEDは、構想から七十年、第一巻が出版されてからも、四十四年の歳月を費やして、篤志文献閲読者と呼ばれる一般の人たちの協力を得て英語の文献から数多くの用例を集めて作られています。

 この途方もない辞書作りに取り組んだ人の心境はどういうものだったのでしょうか?

 『言海』の大槻文彦の心境は、こう表されています。

≪辞書の校正は芯のつかれる仕事だ。
 全頁が一つの有機体で、どこか一つをいじれば無数の言葉が声を挙げて検討を迫ってきた。
 ただ一行のために、買い漁った和漢洋の書物の山を探しまわり、気がつくと何時間かを失っている。
 三校、四校のゲラが朱変してゆく。≫(*2)

≪いらだってもどうしようもないのだ、
 時をかけなければこの仕事は成らない。
 そう思いながらも、あまりの「磐根錯節」に茫然とする。≫(*2)

 磐根錯節(ばんこんさくせつ)とは、固い根っこやひん曲がった節を持った木。これを切る時に初めて刃物の本当の切れ味がわかる、の意味。

≪「私は唯だ此の事業を完成して此の世の置土産にしたいと考へて居るばかりなのだ。要するに私は狂人だ。今語源に中毒して居るのだ。」≫(*2)

 ただし、明治期の日本は、国家プロジェクトの位置づけもあり、大きなプレッシャーがあったためもあると思います。国家統一の基礎であり、指標となる国語辞典が求められ、近代国家にふさわしい国語辞典を持つことが課題となっていたこと。ライバルがOEDやウェブスターだったとしたら、その重圧は想像もできないほどです。
 『日本国語大辞典』を編集された松井栄一さんの祖父・松井簡治は、『大日本国語辞典』を編纂されています。大正四年から八年にかけて、古語・現代語を含む約二十万項目を収めて出版、準備段階から数えると約30年の月日をかけての仕事でした。

 この辞書編纂において、膨大な古書を収集しながら、前段階として、国書の索引作りをはじめる。用例を拾いながら、古典語の概数をつかむ。『古事記』『日本書紀』・・『源氏物語』、軍記物、狂言、近松、西鶴などの著作の索引を作り、言葉の概数を調べたら、40万ほどになる。

 すべては無理なので、半分の20万語を対象と決める。一年のうち、65日は休むとし、300日と見て、20年で6000日になる。20万語を6000日でやるのは、一日約33語消化する計算になる。公務もあったので、朝3時に起きて8時まで、だれにも邪魔されない5時間をこの仕事に当て、消化しきれなかった分は、7、8月の夏休みに一日10時間をとって取り返す。これを20年ばかり続けて作り上げた。

 ところで、これが苦行だったのかというと、どうやら様子が違います。

≪能く云ふ例へば子供を育てるやうな話で、毎日随分骨も折れませうが、
 どんな親でも子供育ての苦心談をする人はない、
 つまり毎日段々育って行くのが非常に楽しみでありますから、
 一向苦痛と感じませぬ、子供の愛の為にさう云ふ苦労は忘れられるのであります。
 私共も字引を揃へるのは毎日面白い、是が出来たと云ふやうにして、
 悦んで居るのでありますから、一向苦痛とは思はない。≫(*4)

 ここまでくると、人生の達人の域だと感服します。

 でも、ここまで傾注して取り組む辞書にも、間違いがあり、時代が進むにつれ、陳腐化は避けられません。

 『言海』の大槻文彦の心境は、こう表されています。

≪どこかで思い切らなかったら辞書はできない。
 疑問は残したままに、とりあえずは書きつけておく。
 幸運に恵まれて、ひょいと疑いが氷解することがある。
 はじめに書きつけたままでよいと確信の持てる場合がある。
 はじめのが誤りである場合がある。
 書いては消し、消しては書いて、原稿の一枚一枚が、
 余人には判読できぬほどになってゆく。≫(*2)

 一方、辞書を読む側からすると、間違いや抜け・漏れが悪いことばかりではありません。

 OEDを全巻読んだアモン・シェイさんによると、

≪OEDに間違いや不可解な記述を見つけると、ほっとしてしまう。
 それは、なんというか、OEDに人間味を添えるというか、この壮大な辞書が、機械ではなくて、人間の手によって作られたものであることを再認識させてくれるのだ。

 OEDでも間違える。

 その事実こそが、この著作の壮大さを、よりいっそう感銘深いものにするのである。≫(*5)

≪・・OEDには、appendicitis(虫垂炎)、aeroplane(飛行機)という単語が掲載されていない。それは、A-Antの分冊が出版された時点では、これらの単語は科学的すぎると認識されていたからである。≫(*5)

 世の中には奇特な人がいるもので、OEDとブリタニカを、全巻読んだ人がいます。それぞれ体験記が本になっています。

 アモン・シェイ『そして、僕はOEDを読んだ』(*5)によると、OED・・『オックスフォード英語辞書』は、2万1730ページ、およそ5900万もの単語数。何十万もの単語が、250万以上の引用を用いて説明されている。最新版は、1989年に出版され、全20巻、重さは、62.5キロ。段ボール5箱。このOEDを、AからZまで、全ページ読む。

≪なによりもまずOEDは偉大な読み物だ。
 見事なまでの定義が与えられ、そこには強大な人間の思考と、この辞書を作り上げるのに必要とされた学識がまさに透けて見えるように感じられた。
単語、定義、さらに語源、そして何世紀にもわたって使われてきた用法について読み進めていくと、頭の中に英語の歴史が染み込んでいくように感じられる。≫

≪OEDは、妥協なく、揺るぎなく、容赦なく徹底的な存在である。≫

≪僕は、自分がなにか無駄なことをしているのではないかと感じた時、そして、こんなことよりもっと生産的なことに時間を使うべきではないかと考えた時、そんな時はいつも、マレー自身と彼がOEDに捧げた三六年間という年月を考えるようにしている。≫

 そうすると、辞書を読むということは、作業ではなく、特権的恩恵だとはっきり感じることができる、といいます。

≪ぜひ一度、OEDのsetの箇所を読んでほしい。
 冗談ではなく、本気でそう思う。
 三文字の単語が、六万語強の語を用いて記述されているのだ。≫

 6万語って一言でいいますが、ペーパーバック1冊分が優にあります。

 一方、A・J・ジェイコブズ『驚異の百科事典男〜世界一頭のいい人間になる!』では、『ブリタニカ百科事典』の2002年版にチャレンジします。全32巻、33000ページ、65000項目、執筆者9500人、図版24000点、単語数は、4400万語。各巻の重さ2キロ。32巻を床に積み上げると、高さ125センチ。これを1年かけて読破する。
 これまで何かを成し遂げたことのないものにとって、
≪・・『ブリタニカ』読破はすばらしいチャレンジの課題だと思えたのだ。
 何しろ知識の最高峰だ。聳え立つエヴェレストだ。≫(*6)

 そして、読み始めると、OEDを読んだアモン・シェイさんと同様に、いきなり頭が痛み出します。辞書の読書は、頭痛との戦い。個人的には、吐き気もしてくるような気もします。

 最後に、「自分の辞書を作ること」を紹介して終わりたいと思います。

 辞書は、学者が作ってくれるものと考えないこと。「自分の辞書を作る」とは、自分がふだん使っている辞書を基にして、その中のあることについて何か補うべきことに気がついたら、それを記録することによって、自分用の辞書を作っていくということです。井上ひさしさんは『広辞苑』に、自分が他の辞書や新聞記事などで得た用語例などを、千五百から千六百項目にわたって書き込んでいた、といいます。

≪自分の使っている辞書を、自分の力で充実させて自分の辞書を作る、これはなかなか張り合いのある楽しい作業である。≫(*3)

 これなら、仕事でも個人としても、取り組めると思います。

(*1)安田敏朗『辞書の政治学 ことばの規範とはなにか』平凡社 2006年刊
(*2)高田宏『言葉の海へ』新潮社 昭和53年刊
(*3)松井栄一『国語辞典はこうして作る 理想の辞書をめざして』港の人 2005年刊
(*4)松井栄一『出逢った日本語・50万語―辞書作り三代の軌跡』小学館 2002年刊
(*5)アモン・シェイ『そして、僕はOEDを読んだ』訳・田村幸誠 三省堂 2010年刊
(*6)A・J・ジェイコブズ『驚異の百科事典男〜世界一頭のいい人間になる!』 (文春文庫)訳・黒原敏行 2005年刊