33. 日本語は日本語のままで — OCLCのCJKシステム

 OCLCでCJK(中国語・日本語・韓国語の総称)データの取扱いが始まったのは、1986年のことです。それまではアルファベット(ラテン文字)しか取り扱えなかったOCLCの書誌データベースにも、それ以降徐々にCJKデータが登録されるようになり、そのためのシステムも進化し続けてきました。
 2008年2月現在、WorldCatに収録されている日本語資料の書誌レコードは約248万件、そのうち日本語・日本文字データを含むのは約220万件。OCLCの業務用目録システムであるConnexion Clientでも、一般公開されているWebデータベースのWorldCatでも、日本語・日本文字は入力されたままに表示されていますし、検索も可能です。

 日本語書誌の例
 http://worldcat.org/oclc/123166424

 OCLCで過去約25年にわたってCJKシステムの構築に携わってこられた小鷹久子さんにお話をうかがう機会を得ました。

 日本で病院図書館の開設に携わった小鷹さんは、オハイオ州立大学で日本語図書の整理を担当しておられた際、日本語図書についての書誌データが原綴(元の言語のままでのデータ表記)でないことに疑問を感じておられたそうです。そして、1983年にRLG(Research Library Group:アメリカの研究図書館によるグループで、2006年OCLCに統合)がRLIN(RLGの書誌目録データベース)をCJK対応したという発表を聞き、OCLCでも必ずこのCJK取扱いが大きな問題となるはずだと考え、OCLCに移り、以降CJKシステム構築の中心メンバーとして開発・改良に携わってこられました。
 当時、RLINで使われていた目録用端末では、キーボード上に漢字の部首などが並びそれを組み合わせて入力するという、CJK専用の機器が使われていましたが、1986年にOCLCが提供開始した目録用端末は、標準の端末にCJK文字を取り扱うためのECIボードを組み込み、アルファベットのキーボードのままでヨミなどからCJK文字が入力可能、というものでした。標準の目録用端末をそのまま使えるという利点はあったものの、やはり専用ボードを要するためコストが高く、当初は10館ほどの東アジア研究図書館のみによる試用からスタートしました。
 その後、図書館全体のデータベース化が進み、どの図書館でもCJK資料の処理だけをいつまでも先延ばししておくわけにはいかなくなったこと。ハーバード・イェンチン図書館などの大規模館が参加するようになったこと。CJKワープロ機能など、ユーザ館のニーズに応えるシステムをOCLCで開発していったことなどから、次第にCJKレコードの規模も参加館も増えるようになってきたとのことです。

 1991年、初めてWindows端末を見せられた小鷹さんは、Windows対応の目録システムに着手し始めました。CJK言語とWindowsシステム、ともにグラフィカルであるという共通点から、CJKがWindows対応システム開発の実験台となったようです。OCLCにCJK User Groupが発足したのもちょうどこの年でした。1992年、CJKPlusというWindows用アプリケーションが開発されましたが、当時はまだWindows自体が普及しておらず、その使い方からCJKユーザに伝えていく、といった段取りもあったそうです。またその間、CJKユーザの協力と要望を受けながら、カード目録印刷機能、オンラインCJK辞書、オンラインヘルプなどが開発されていきました。
 1998年に発表された「OCLC Access suite」は、それまでのような目録専用端末を使うことなく、Windows機にインストールすることで利用できる目録システムアプリケーションソフトでした。参加メンバーであれば無料で受け取れるこのソフトには、CJK目録取扱い用ソフトやCJK書誌データをローカルで表示できるソフトもデフォルトで含まれており、これによりCJKユーザだけが別途費用を負担したりシステムを追加したりということが不要になりました。
 その後、ホストシステムの改造に伴い、2002年からConnexionという目録作成システムが用いられています。そのWidows型のプログラムに移行したCJK機能では、文字入力にMS-IMEが採用されています。これは、どの図書館でも少ない端末で複数の言語を取り扱う必要があるという現状を鑑み、Windows機であればどの言語でも取扱いができるように、とのことからだそうです。

 1995年、早稲田大学が日本語書誌レコードを一括して提供し、以降計3回の一括提供、2004年からは月1回の定期的な提供が行なわれています。2007年1月までに早稲田大学からOCLCに提供された書誌レコードは約75万件に及んでいます。そのデータの変換・転送には、日本側代理店である紀伊国屋書店が携わったとのことでした。その紀伊国屋書店は現在、米国のいくつかの東アジア図書館に対して、図書現物の納品とともに書誌レコードを作成・提供するというサービスも行なっているようです。1996年にはハーバード・イェンチン図書館のカード目録による遡及入力がOCLCへの依頼という形で行われています。RLINとの書誌レコード交換により、TRCや慶応大学による日本語書誌レコードも収録されてきましたが、2007年にRLINのCJKレコードがすべて収録されて以降は、TRCからの定期的な書誌レコード提供も開始されています。いずれも、日米では書誌の作成要領や内容が異なるために編集を必要としますが、各図書館での業務軽減に大きく貢献していると言えるでしょう。
 OCLCの日本語書誌レコードは、同じ番号を持つMARCフィールドを2つ設け、一方に日本文字データ、もう一方にローマ字化されたアルファベットデータを記述するという形をとってきました。最近では、国際化・多言語サポートの広がりに伴い、この規制も緩和されてきています。また、RLINでは日本文字による書名などは単語ごとに分かち書きされていましたが、OCLCでは分かち書きがなされていません。現在の目録用システムであるConnexionではCJK文字1文字づつを”単語”とみなし、例えば「日本史学会誌」であれば「史学」でも「学会」でも「会誌」でも検索することが可能になっています。
 ただ、文字の取扱いには若干の問題が残ってもいます。例えば「江戸」という言葉を日本文字で検索しても書誌レコードはヒットしません。「戸」という字について、日本文字で一般的な「戸」(上の棒が横一直線)ではなく、上の棒が左肩下がりの「戸」が使用されているためです。これは、ALA内のグループによって、JACKPHY(日本語、アラビア語、中国語、韓国語、ヘブライ語)文字についてはUnicode文字すべてを使うのではなく、従来用いられていたMARC-8と呼ばれる文字集合のみを用いる、というルールが決められたことによるそうです。したがってMARC-8内に含まれていない日本文字の「戸」は使用されないことになります。OCLCのデータベース自体はUnicodeに対応していますが、記述に際して採用される漢字には制限がある、ということのようです。

 OCLCのCJKシステムの発展は、参加館である各東アジア研究図書館のライブラリアン・カタロガー、早稲田大学・紀伊国屋書店などの日本側参加館・代理店やそのカタロガー、OCLC内外のシステム開発者・ライブラリアンなど、たくさんの人々によるコラボレーションの賜物である、と言えるでしょう。
 また、小鷹さんのお話の中で、「書誌とは、現物に行き着くためのものであるから、現物を見ていない人が、書誌を見ただけでその現物を思い描くことができるように記述されなければならない。そのためには、規則に従って事実を記すというだけではなく、そこにどんな情報を収めるべきかについて考えなければならない。書誌作成はアート&サイエンスである。」というお言葉が、とても印象的でした。

32. 世界最大の図書館情報サービス — OCLC

 2月半ば、オハイオ州・ダブリンにあるOCLCを訪問してきました。
 OCLCは、コンピュータ・ネットワークを通して、書誌情報、オンライン共同目録システム、ILLシステムなど、各図書館での活動に必要な情報・サービスを提供している非営利機関です。1967年の設立当初はオハイオ州内だけを対象としたサービスを行なっていましたが、現在はアメリカ国内だけでなく、ヨーロッパ、アジア、太平洋地域など世界112カ国・6万館以上の図書館に対してサービスを行なっています。代表的なサービスである目録データベース・WorldCatは、2007年3月現在で、書誌レコード8000万件、所蔵レコードは13億件を収録しています。

 OCLC
 http://www.oclc.org/
 WorldCat
 http://worldcat.org/

 ダブリンにあるOCLC構内の3つの建物では約1000人のスタッフが働いていますが、ほかにも全米各地、及び世界数ヶ所に拠点となるオフィスがあります。
 参加館には、データベースの利用だけを契約しているところもあれば、すべての目録作成をOCLCで行なうなどのGoverning memberとして参加するところもあります。日本でOCLCにGoverning memberとして参加しているのは、早稲田大学、慶応大学、愛知淑徳大学などの7館です。

 今回の訪問では、契約によるCatalogingの部署、Language Setと呼ばれるサービスの部署を案内していただきました。

 OCLCの書誌目録データベースはオンライン共同目録システムであり、実際の目録業務は各参加館のカタロガーによって行なわれていますが、このCatalogingの部署では、各館でまかないきれない目録業務をアウトソーシングとして受注しています。OCLCのデータベースに登録する目録業務を、OCLC内で請け負っているのですから、ある意味もっともリーズナブルなあり方と言えるかもしれません。
 ここではあらゆるタイプの資料が書誌・目録作成の対象となっています。私が拝見した限りでは、古い時代の書籍や写本、音楽スコアや絵本、テクニカルレポートや簡易パンフレットのような灰色文献、DVD・VHSのような視聴覚資料などが扱われていました。また、約50人いるカタロガーの中には、アジア、ヨーロッパ、イスラムの各種言語を理解する人たちが含まれていて、あらゆる言語の資料に対応しているとのことでした。
 図書館からは、情報源(標題紙・標題紙裏)のコピーが郵送されてくることもあれば、それがスキャニングイメージデータとして送られることもあります。カードケースがそのまま送られてきて遡及入力が行なわれることもあります。もちろん、資料の現物も多数送られてきていました。
 しかし、この部署でも困難なのは、やはり件名標目の作成であるようです。特に英語以外の言語の資料の場合には、何人かいるネイティヴのカタロガーが中身を読んで、理解してから件名を作成する、ということでした。

 Language Setは、公共図書館が対象の代理選書サービスです。英語以外の言語の資料を蔵書に加えたいが、その言語の専門家がいない、という公共図書館に対して、適切と思われる図書をセレクトし、まとまった数のコレクションとして、その図書の現物及び目録情報を提供する、というものです。現在14ヶ国語(日本語含め)に対応しています。
難しいのは、図書館や言語によってニーズが異なる、ということだそうです。例えば日本語資料の場合、対象となる利用者層が”日本から出張などで来ている家族で、日本の情報をキープアップしておきたい”ということから、生活実用書や子供用・教育関係図書がニーズとなるが、言語によっては”アメリカに移住し、職を得て、市民権を得るにはどうしたらよいか”といったことが中心になるようです。
 当サービスでは「この図書館には日本語の本があります」というサインや、案内用Webページの作成も行なっています。

 また、アジア・パシフィック地域担当のAndrew H. Wang氏、Shu-En Tsai氏にお話をうかがうことができました。
 Wang氏によれば、Googleやその他のサーチエンジンの勢いは誰にも止められない。図書館の組織化された知識の蓄積は、それらに勝り得る。OCLCの使命は、各図書館が固有に持っている情報を、Webに載せてアクセス可能化することによって、ユーザを図書館に導くことである、とのことでした。

31. Sackler Museumの日本古典籍資料

 Arthur M. Sackler Museumはハーバード大学内にある美術館・博物館群のひとつです。美術品を収集している美術館としてはほかにFogg Art Museum、Busch-Reisinger Museumなどがあります。Foggが西欧、Busch-Reisingerが中欧・北欧をメインとしているのに対し、Sackler Museumでは東洋・イスラム世界を中心に収集・研究・公開を行なっています。

 Arthur M. Sackler Museum (Harvard University)
 http://www.artmuseums.harvard.edu/sackler/

 2月6日、朝日新聞文化欄に、ハーバード大学Arthur M. Sackler Museum所蔵の日本古典籍資料についての調査報告が掲載されました。近世以前の書籍資料である絵本、画譜、草双紙の自筆稿本などについて、九州大学の先生方が訪問調査なさったもので、約300点の簡易目録作成が行なわれました。私もその現場で目録作成のお手伝いをさせていただきましたが、それぞれ見た目に美しく面白いだけでなく、保存状態のとてもよいものでした。書誌学的にも価値のある珍しいものばかりのようで、調査中の先生方もしきりに感嘆の声を上げておられました。

 これらは、それまで学内でもその価値があまり知られておらず、Sackler Museumロッカーの中に静かに保管されていました。整理や箱詰めによる保存処置はされていたものの、書籍形態であったため、浮世絵のような美術資料に比べてどうしても調査等が後回しになってしまっていたようです。
 海外ではこのように、日本の古典籍資料が思わぬところに残されていることが少なくありません。日本または東アジア研究専門の図書館でない、資料の内容・価値のわかるライブラリアンがいないなどの理由で整理されていなかったり、今回の例のように美術館であるがために書籍形態の資料がそれほど省みられなかったり、また、長い間中国語資料とごちゃまぜになったまま所蔵されていたりという例もあります。
 それらが、場合によっては日本に保存されているものよりも保存状態がよい、ということも珍しいことではありません。欧米の資料保存専門家には、西洋の資料についてだけでなく、日本・中国などアジア資料の修復・保存についても積極的に知識・技術を習得している人が大勢います。彼ら・彼女らによって、日本ではあまり適切に扱われていない資料が、充分にケアされて保管されている例がたくさんあります。また、価値を評価できるスタッフがいないために、とりあえずすべての資料がひとつひとつ丁寧に取り扱われている例。その資料を使うような研究者・利用者がいないために、長い間人の手に触れられず、そのために保存状態が良いという例。日本の図書館では無造作に処分されてしまっていたような袋(売るときに元の本を納めていたもので、絵入り・色刷りのものもある)が大切に保管されている例も、いくつか拝見しました。また、戦後にこのような古典籍資料を海外へ売り出した当時の書籍取扱者が、特に良い本を取り揃えて送った、というような事情もあったようです。

 これまで知られていなかったこのような資料は、以前は現地へ赴かなければその詳細がわからないということがほとんどでしたが、最近ではホームページ上でその解題や簡易目録を見つけることができたり、総合目録データベースの中に現れたり、一部や全文をデジタル画像として見ることができたりということが増えてきたようです。このようにさまざまなかたちの情報発信によって、必要な資料の存在が必要な人の目に触れるようにすること。そして、その存在を認めることができた資料は、後世の利用者のため、適切な状態で保存することが重要だと思います。

 最近になって、Sackler Museumにあった和装本のうち、幕末期以降の書籍形態の資料の一部がHarvard-Yenching Libraryに移されることになりました。これらは近いうちにデータベースへの目録登録がされ、ひとつひとつの大きさに合わせて作られた箱に納められ、館内の貴重書専門の部署によって適切に管理・提供されることになる予定です。

1 2 3 4