28. Google Library Project — University of Michiganにて

 Google Library Projectは、Googleと提携図書館による蔵書スキャン・インデクシング事業です。Googleが各提携図書館の蔵書をデジタル画像として読み取り、データ化して、全文検索を可能にするというもので、著作権の切れたものや出版者許諾の得られた図書などについては、全文または一部を無料で見ることができます。
 2004年12月、Googleが最初に発表したLibrary Projectの提携先は、Harvard、Stanford、New Yorl Public Library、Oxford、そしてUniversity of Michigan(以下UM)の5つでした。他の多くの提携図書館が、その提供資料を著作権の切れたもの、評価・選択したものに限っているのに対し、このUMでは内容・分野、年代、著作権の有効・無効に関わらず、ほぼすべての図書館蔵書をGoogleに提供しています。2004年の試行段階を経てスタートし、2005年にはGoogle Print(当時)サイトから、2006年にはUMからも順次提供が始まっています。

 University of Michigan Library
 http://www.lib.umich.edu/
 MBooks – Michigan Digitization Project
 http://www.lib.umich.edu/mdp/
 Google Books Library Project
 http://books.google.com/googlebooks/library.html

 1月末、このUniversity of Michiganを訪問し、Google Library Project担当者の方にお話をうかがうことができました。

●概要
・対象となるのは、学内図書館ほぼ全蔵書である約700万冊。2004年から6年間かけてスキャンしていく予定。現在、週あたり3万冊のペースで処理されており、いまのところスケジュールとしては予定通りである。(プロジェクト終了後の蔵書については未定)
・スキャンした後、資料の画像データとOCR処理されたテキストデータが、GoogleからUMに提供される。UMではこのデータを「MBooks」として利用者に提供している。
・蔵書の全文テキスト検索は、原則としてすべての資料で可能。全文閲覧は、著作権の切れたもの、及び、パブリック・ドメインのものについてのみ可能。
・参加への理由。(1)蔵書への検索・アクセスの新しい形をユーザに提供できる。(2)資料保存のための大規模な媒体変換が可能になる。(3)蔵書をデータとして活用することで、単なる蔵書本体へのアクセスを越えた、新しい図書館活動を期待できる。
・あくまで図書の検索・発見のためのものであって、全文をオンラインで無料提供することが第一目的の事業ではない。また、紙媒体としての資料の購入が減ることはないし、提供を減らすこともない。

●対象資料
・学内700万冊の、製本された印刷資料のほとんどがスキャンされる予定。
・対象とならない資料は、製本されていない資料(新聞、パンフレット、地図など)。印刷されていない資料(写本など)。サイズの大きい資料。破損などの理由でスキャンに耐えられない資料。
・2004年発表当時は、プロジェクトのスタートと発表をスムーズにするため、協議・検討に時間をかける必要のある図書館(法学図書館、貴重書図書館など、学内であっても別組織である図書館)は対象としていなかった。が、法学図書館も貴重書図書館も姿勢としては積極的であり、現在では蔵書スキャンを実行する予定である。

●スキャン・データ化作業
・出納・運搬・スキャン・データ化などにかかるすべてのコストを、Googleが負担する。スタッフの雇用もGoogleが行なう。
・スキャンは保存書庫であるBuhr Shelving Facilityの蔵書から開始され、順次、各部局図書館の蔵書にとりかかる。
・UMのあるAnn Arbor近郊の場所に、Googleが専用の建物を設け、作業場としている。(他の提携図書館の場合は、遠隔地の拠点作業所まで資料を運搬してそこでスキャンされる、というようなところもある。)
・スキャンに関する技術、方法、規模は公には発表されておらず、すべて秘密である。スキャン作業場がどこにあるかについては、UMの担当者にも一切知らされていない。
・Googleはスキャンにあたって、製本を解いたり壊したりすることはない。通常の図書館利用と同様に(慎重に)取り扱う。
・Googleスタッフによる資料の取り扱いとスキャン方法については、UM図書館・保存部署の資料保存の専門家が事前にチェックし、問題ないことを確認済みである。
・スキャンにあたっては、まず書架にあるすべての蔵書がGoogle作業場に持ち込まれる。そこで、物理的条件などからスキャンが行なえないもの(例:破損が激しい、紙質がもろい、製本が弱い、サイズが大きい、対象外資料(写本・非製本)など)があれば、スキャンされずに図書館に戻される。図書館は戻されてきた資料について、「製本・修復後再送する」「自前でデジタル化作業を行なう」などを判断する。
・スキャンが可能かどうかの判断は、その本が古い時代のものであるか、貴重であるかどうかよりも、物理的状態やサイズによるところが大きい。
・スキャンのために持ち出された資料は、その資料が現在どこにあるかがOPACに表示される。2-3日から2週間で再び元通り利用可能になる。

●画像データ・テキストデータ
・GoogleからUMに提供されるのは、画像データ(600dpiのTIFF。図版があれば300dpiのJPEG2000(カラー&モノクロ))、OCRで読み取ったテキストデータ(UTF-8)。各ページに関するメタデータ。
・日本語の資料も同様にOCR処理される。読み取りの正確さは、言語・文字種よりもむしろ、紙質や印字の状態、画質がクリアかどうかなどに左右される。
・UMにデータが届くのは、資料スキャンから3-6ヶ月後。

●MBooks
・UMのデジタル化された蔵書を「MBooks」と呼んでいる。
・MBooksは、UMのOPACであるMirlynから検索可能である。
・MBooksのシステム(利用者用閲覧インタフェース、OPACへの自動リンク、著作権管理データベースなど)は、館内の電子図書館の部署で開発したものである。
・Googleに図書を送るときに、書誌レコードとアイテムレコードを添付する。UMに画像データ・テキストデータが届き、MBooksのサーバに格納されると、OPACの書誌レコード・アイテムレコードに各デジタルデータページへのリンクが自動的に形成される。
・Pageturner(利用者用閲覧インタフェース)では、資料内の全文テキスト検索、画像・テキスト閲覧、現物の所蔵場所確認などができる。資料間の横断検索や履歴保存などは今後の課題である。

 MBooksおよびGoogle Books Searchの例
 「Pleasantries of English Courts and Lawyers」(英語・全文閲覧可)
 http://hdl.handle.net/2027/mdp.39015063810850
 http://books.google.com/books?vid=UOM39015063810850
 「5年後、10年後の”経営環境”」(日本語・閲覧不可)
 http://hdl.handle.net/2027/mdp.39015067608540
 http://books.google.com/books?vid=UOM39015067608540&pgis=1

●著作権
・蔵書の全文検索は、原則としてすべての資料で可能。全文閲覧は、著作権の切れたもの、及び、パブリック・ドメインのものについてのみ可能。
・蔵書をデジタル化することによって、資料の購入が減ることはないし、利用者への提供を減らすことも、学生のテキスト購入に影響を与えることもしない。
・権利情報のデータベースを構築し、どの資料はどのように提供すべきか/しないべきかを判断・蓄積している。権利状態は「パブリックドメイン」「米国内ユーザに対してパブリックドメイン」「著作権有効」「著作権者不明」「学内のみ利用可能」「オープンアクセス」など。理由は、「書誌から判断」「契約による」など。
・著作権状態の調査・判断は、UM図書館の専門スタッフ(知的所有権の専門家)が行なっている。Googleの判断や公開状態に倣っているというわけではない。
・著作権に関する調査は継続して行なわれており、その著作が公開可能と判明した時点で随時公開していくかたちになる。
・UM出版局とはまだ提携できておらず、公開の許可はもらっていない。

●その他
・UMはパブリック大学(州立)であり、このGoogle Library Projectについても出来る限りオープンにするよう、MBooksのWebサイト(http://www.lib.umich.edu/mdp/)でドキュメント・FAQなどを適宜公開している。
・Google Library Projectとは別に、デジタル化による保存・公開事業も、引き続きこれまでどおり力を入れてやっていく。Googleの技術・取り扱いにそぐわないようなレアブックコレクションのデジタル化など、現在までに15000冊を実現している。
・このプロジェクトは「資料を利用可能にする」という、図書館の持つ中心的なミッションのひとつを実現させるものである。UMでこのプロジェクトと同じことをやろうとすると、1600年はかかることになり、それが6年で実現できることの意義は非常に大きい。そういった意味でも、日本でこういうプロジェクトに提携できる機会を得たときには、いろいろな問題はあるとは思うが、それでも積極的に参加すべきである。

27. University of Washington

 1月半ば、シアトルにあるUniversity of Washingtonを訪問してきました。

SEA_B_10

 1861年創立のUniversity of Washingtonは、学部生約3万人、院生約1万人、教員・研究者・スタッフ約25000人。海外からの留学生が全体の約1/4を占めているそうで、キャンパス内を歩いていると、たくさんの東アジア・東南アジア系の学生を見かけます。
 学内には計22の図書館があり、全体で図書500万冊、その他の資料を数百万点所蔵しています。
 メインライブラリーにあたるSuzzallo Libraryは、ワシントン州の保存図書館として子供用図書と行政資料を集中的に収集・保存しています。また、州立大学の図書館であるため、一般の人でも自由に入館利用が可能です。
 学部生用図書館であるOdegaard Libraryは、現在ラーニングコモンズとしての機能をメインに持たせており、学内IT部署による学生利用端末とそのサポート、Writing Center、グループ学習室、メディア編集室・撮影室などを提供しています。(ラーニングコモンズについては【20. 学習活動のすべてをまかなう – Learning Commons (UMass Amherst)】を参照。)また、情報リテラシー教育、利用講習会などのインストラクション活動が非常に盛んで、レファレンス・ライブラリアンが文献収集に関する講義を担当するのはもちろん、情報リテラシーに関するデジタルコンテンツの開発・作成などについては専門の部署が担当しています。

 University of Washington Libraries
 http://www.lib.washington.edu/
 UWill
 http://www.lib.washington.edu/uwill/
 Research 101
 http://www.lib.washington.edu/uwill/research101/

 East Asia LibraryのKeiko Yokota-Carterさんに、Suzzallo Library、Odegaard Library、East Asia Libraryを案内していただき、お話をうかがいました。今回は特に、DVDなどの視聴覚資料について、OPAC・目録データベースと、OCLC WorldCatのローカル利用について、ご報告します。

●視聴覚資料の提供と入手
・視聴覚資料の提供・サービスを主に行なっているのは学内のメディアセンター(学部生図書館内にあり)であるが、日本映画DVDの英語版はメディアセンター、日本語版はEast Asia Libraryといったように棲み分けができている。
・メディアセンターでは、所蔵していないDVDへのリクエストに対応するサービスとして、”NETFLIX”を利用している。”NETFLIX”は一般に人気のDVDレンタルサービスで、オンラインでオーダーして、郵送で受け取ることができる。”NETFLIX”との協議で、教員による講義教材用・研究用としてのみ、利用が可能となった。サービス・受付はメディアセンターが行ない、費用もメディアセンターが負担している。(注:通常のILL費用は利用者自身ではなく図書館が負担) 購入するよりも安く、かつ、ILLでは入手し難かったり対応してもらえなかったりというDVDが、都合よく入手できるので非常に便利である。
・East Asia Libraryにおける日本DVD入手については、これまで、著作権や海外販売不許可に関する問題、リージョンコードの問題、字幕・吹き替えに英語がないなどの理由で、なかなか購入できなかった。それでも、例えば語学クラスなどでの利用リクエストが多く、また既存のビデオテープ資料の内容が古くなっていく一方であることもあって、様々な方法で入手している。これまでにあった例としては、舞台演劇のDVDなど一般に流通していないものを購入しようとして、最初図書館相手に販売してもらえなかったものを、交渉の末、研究用資料としてのみの使用を条件に買うことができた。香港のDVD販売サイトで、香港正規版の日本映画DVDを購入。日本のマンガ・映画を英訳・出版・販売する米国内の会社から購入、など。

●East Asia LibraryにおけるOPAC・目録データベース
・目録データベースへの収録率は約80%。現在でもカード目録を現役で提供している。
・現在のOPACでCJK(Unicode)対応が実現したのは、4年ほど前。システムはINNOPACを使用。但し、INNOPACでは韓国語の検索・取り扱いには専用のソフトを用いる必要があったが、当初はそれが搭載されていなかったため、対応に時間がかかったり、その負担者について問題になったりした。
・「Pre-Cat」:OCLCに既存書誌がなかったり、あっても不正確・不備が多いなどの場合、OCLC書誌の登録・ダウンロードをいったん保留し、ローカルのデータベースのみに簡易書誌(書名・著者名・出版事項・形態事項と連番のみ、分類・件名なし、請求記号付与なし)を作る。フルレコードでカタロギングするまで時間がかかる場合でも、これによって利用者への新着図書の提供を可能にしている。
・最近の受入分については、書誌レコードに紀伊国屋書店Bookwebの書誌・内容紹介ページへのリンクを付与している。図書館の書誌レコード、特に「Pre-Cat」だけでは、例えばそれが同じ作品の小説版なのかコミックなのかDVDなのかが、利用者にはわかりにくいことがある。西海岸エリアの紀伊国屋書店Bookwebの注文可能なページにリンクすることで、紀伊国屋書店の理解を得た。
・所蔵・受入している日本語雑誌のうち、オンラインでアクセスできる紀要・CiNii収録雑誌・オープンアクセス誌について、OPACの書誌レコードからのリンクを付与している。所蔵・受入している全タイトルについて、学生バイトによる助けを得て、インターネット上の資源の有無を調査し、書誌レコードに手動で入力した。計400タイトル。全文ファイルがあることが理想だが、抄録・目次情報だけでもリンクを形成している。

●WorldCat Local
・WorldCat Local:OCLCのWorldCatをローカライズして、自館の蔵書検索システムとしての利用が可能になるというもの。現在は試行段階で、University of Washingtonが試行版第1号としての提供を開始している。(2007年4月から)
・ローカルのOPACシステムとして利用できる。検索結果の関連度順表示、利用頻度順表示、版違い資料の一括表示ができる。参加コンソーシアム蔵書やオープンアクセス資料、ERIC・MEDLINE・ArticleFastなどの論文データベースも検索対象にできる。e-resourceであれば全文へのリンクを提供。ファセットによる絞込み・ブラウジングができるなど、OCLC WorldCatが持つ機能をそのまま利用できる。
・現在は試行段階で、従来のOPACとWorldCat版OPACとをともに提供している。これを将来的にWorldCat版のみにしようという動きが学内にはある。が、ローカルデータベースの書誌レコード中に独自に入力しているデータ(自館で入力した件名・分類や、上記の日本語雑誌の全文へのURLなど)や、書誌レコード自体をローカルデータベースのみに作成しているもの(上記のPre-Catの例など)は利用できなくなってしまうため、導入には問題も多い。
 

26. East Asia Library — Yale University Libraryその2

 Yale UniversityのEast Asia Libraryには、日本分野専門のコレクション&レファレンス・ライブラリアンが1人、日本資料専門のカタロガーが1人いらっしゃいます。East Asia Library全体のトップであるキュレーターも、日本研究が専門の方です。

 コレクション&レファレンス・ライブラリアンの中村治子さん、カタロガーの鈴木啓子さん、キュレーター(東アジア図書館館長)のEllen Hammondさんにお話をうかがいました。

●データベース契約における障害・問題点
・Japan knowledge、聞蔵(朝日新聞)などを契約。
・学内の中央組織にデータベース契約専門の部署があり、日本の有料データベースを契約するときにもそこを通さなければならない。が、日本のデータベース業者側の提示している利用規約が、米国側の契約上の基準や利用実態に合致しないため、契約ができなくなってしまうことが多々ある。例えば、米国側では「大学内のメンバーであれば、学外のネットワークからでもアクセス可能であること」が必須の条件であることが多いが、日本側の利用規約にそれを認めない旨が記載されているために、契約が認められない、ということがある。また、日本側の利用規約に「データの転載を認めない」というような文言があることによって、論文の参考文献リストへの記載などが不可能になるおそれがある。日本ではそれほど問題視されずに契約が成立するような規約であっても、米国の契約関連の部署は規則の遵守について極めて厳密に考えるため、少しでも訴訟を受ける可能性のある契約や、規約にあいまいな表現の残る契約は避けようとする。(ハーバード・イェンチン図書館でも、「ユーザの不正利用の責任は図書館が負うこと」という条件のため、契約が許可されない例があったようです。)
・以上のような場合、日本側の業者・代理店と何度も交渉しなおしたり、直接日本に出向いてお互いに意思を確認しあうなど、たいへんな時間とエネルギーを費やすことが多い。それでも、お互いに継続してコミュニケーションを取り合うことが重要である。
・但し、このような交渉は、アメリカの東アジア分野図書館という、日本側から見れば小規模・少数のユーザからの要求・説得だけでは、限界があり非常に難しい。利用規約や契約条件の文言があいまいであったり、実際の利用に即していなかったりといったことは、日本の大学図書館・ユーザにとっても好ましい状態ではないはず。このような場合には、衝突を避けて契約に応じるのではなく、ぜひ日本の大学図書館側からも要求を出し、説得を試みることによって、事態を進行させてほしい。

●日本へのILL依頼
・ILL依頼は、どのような言語・国の資料であれ、すべて館内のILL専門部署が集中して担当する。日本の図書館に資料を依頼する利用者も、直接ILL部署に依頼を送り、依頼業務も館内のILLスタッフが執り行う。ILLスタッフは日本語がわかるわけでも日本の図書館事情に精通しているわけでもないので、ルーチンな処理ではないなどの場合には、日本分野専門ライブラリアンのところに相談が来ることがある。
・GIFは、日本側の参加館が多いのが助かっている。ただ、同じ大学内の資料であっても、別の図書館や部局にあるために使えない、という例が多い。そのためか謝絶されることが多く、結果的に利用しづらくなる。
・NDLのILLサービスは、ILLスタッフが日本語がわからず、NDLのサービスを使いこなせないため、利用されることが少ない。クレジットカード支払いができるのが利点ではある。
・CiNiiのペイパービューは、日本語がわからないILLスタッフでも比較的使いやすいシステムになっており、よく利用されているようである。ただ、CiNiiのライセンス契約条件・規約が、契約部署による基準に合致していないため、契約ができない。

●日本語資料の目録・書誌
・OPACでの日本語文字表示が実現したのは、2006年。但し、書誌自体は長い期間かけて様々な形で作られており、日本語データが入っていないものが多少あったり、分かち書きされているものとされていないものがあったりする。
・OCLCに参加。
・紀伊国屋書店に図書を発注した場合、OCLCに対応する北米基準の書誌がなければ、書誌レコードを作成・納品してくれる。昨年からは一部コピーカタログも依頼している。
・OCLCには早稲田大学からの書誌レコードが収録されており、それを北米の基準に即した形に編集して利用できるので、たいへん助かっている。ただ、昨年夏頃に旧RLIN内の日本語書誌のデータが収録され、結果的に件名・著者標目などの重複したデータ、北米の基準に合致しないデータなどが急増してしまった。書誌レコードやデータが増えること自体はよいのだが、このようにかえって手間が増える結果となってしまう例もある。
・現在の図書館OPAC(Yaleに限らず)は、書誌レコード内のデータをフルに活用しきっていない。もっと有効活用すれば使いやすく、いろいろなサービスを提供できるOPACになるはずである。そういった次世代型OPACへの移行を、Yaleでも準備中である。

●その他
・日本語の図書・論文などのフルテキストデータがオンラインで手に入らない件が、非常にフラストレーションを感じる。
・Yale Universityの図書館には、中国や韓国からはたくさんのvisiting librarianが来ているのに、日本からはまったく来てもらえていない。1日・2日の見学としての訪問だけではなく、長期間の交流・交換プログラムとしてもっと積極的に来てほしい。

1 4 5 6 7 8 15