国民の知的活動における基盤の一翼を担う国立国会図書館。2000年度から図書館サービスのデジタル化、オンライン化のニーズに応えるべく、所蔵資料のデジタル化を進めてきた。2021年に同館はデジタル化業務を加速するべく、デジタル化した資料の管理と、デジタル化作業の進捗管理を行うためにデジタル化業務システムを開発。丸紅情報システムズ(以下MSYS)は、デジタル化業務システムの機器導入作業を受託し、信頼性の高いストレージとしてNetAppを活用してインフラを構築した。同システムにおけるNetAppは、インターネットでデジタル化した資料を検索・閲覧できる国立国会図書館デジタルコレクションのデータをバックアップし、日本の文化や歴史の記録を永年保存する役割を担う。
- 永年保存と検索・閲覧サービスを両立したい
- 増え続けるデータ量に対して柔軟に拡張したい
- 3カ月間の短期間構築を実現したい
01[導入の背景]
増え続けるデジタル化した所蔵資料を保存する大規模ストレージの運用管理が課題に
1948年に、「真理がわれらを自由にする」という設立理念に基づき開館した国立国会図書館。国会に属する日本で唯一の国立の図書館として、国会活動のサポートとともに、日本の文化的資産を広く収集・保存した上で永く保存し、それらの情報資源を広く国民に提供するという役割を担う。近年、重要なテーマとなっているのが、情報技術の発展やコロナ禍がもたらした社会変化による図書館サービスのデジタル化、オンライン化のニーズへの対応だ。
国立国会図書館は、情報資源と様々な知的活動を的確につなげていくために、2021-2025年の5年間を「国立国会図書館のデジタルシフト」推進期間と位置付け、7つの重点事業に取り組んでいる。7つの重点事業は、将来にわたる全ての利用者に多様な情報資源を提供するユニバーサルアクセスを実現する事業と、そのための恒久的なインフラとなる国のデジタル情報基盤の拡充を図る事業から構成されている。
「国立国会図書館のデジタルシフト」は、ユニバーサルアクセスの実現と、それを支える国のデジタル情報基盤の拡充の2つのテーマで、7つの重点事業により構成されている
「国立国会図書館のデジタルシフト」における重点事業の1つである「資料デジタルの加速」では、デジタルですべての国内出版物が読める未来を目指し、2021年度から2025年度の5年間で100万冊以上の所蔵資料のデジタル化を行うことを目標としている。国立国会図書館は、資料の利用と保存の両立を目的に、2000年度から所蔵資料のデジタル化を進めてきた。現在は、「資料デジタル化基本計画2021-2025」、「国立国会図書館デジタル資料長期保存計画」に基づき、デジタル化した資料を原資料の代替として利用者に提供することで、原資料を保存するとともに、検索性や、障害者を含むあらゆる人々の利便性の向上を目指している。
国立国会図書館の蔵書数(2019年)は約4,500万、年間受入点数も約75万に及ぶ。デジタル化の対象は所蔵資料のうち、基本的に国内資料とし紙資料、マイクロ資料のほかアナログ形式の録音・映像資料、さらに歴史的価値の高い日本関係の外国資料なども含まれる。デジタル化対象資料は、唯一性・希少性、資料の利用機会の拡大、デジタル化への社会的・学術的ニーズ、国や世界の体系的なデジタルコレクション構築への貢献などの評価要素から総合的に判断し選定される。
デジタル化資料は、「国立国会図書館デジタルコレクション」を通じて利用提供するとともに、提供・管理に用いる情報システムのストレージへの保存が原則となっている。所蔵資料のデジタル化において、課題となってきたのが増え続けるデジタル資料を保存する大規模ストレージの運用管理だった。
国立国会図書館デジタルコレクションは、総数300万点以上の資料数を有する
出典:「国立国会図書館デジタルコレクション」(国立国会図書館)
(https://www.ndl.go.jp/jp/dlib/project/pdf/digitized_contents.pdf)(2022年3月23日に利用)
オンプレミスは永年保存用、クラウドはサービス提供
国立国会図書館では、ストレージにおける運用管理の効率化を図るべく、パブリッククラウドサービスの活用を検討。しかし、クラウドサービスだけにデジタル化した資料を保存するのは、サービスの持続可能性やロックインの観点から、資料の永年保存という国立国会図書館の使命を全うするのに適さない。そこで、国立国会図書館内のサーバルーム上で運用できるストレージを導入しデジタル化業務のデータと、国立国会図書館デジタルコレクション収録の総数300万点以上の資料をバックアップする永年保存はオンプレミス、インターネットで検索・閲覧できる国立国会図書館デジタルコレクションはクラウドサービスの利用と、用途に合わせてデータ保存の基盤を構築することにした。
デジタル化業務には、デジタル化した資料の管理と、デジタル化作業の進捗管理の大きく2つの業務がある。デジタル化に関しては主に外部委託で実施。原資料からのデジタル画像の作製は、一般的に次の工程で行う。
2021年2月、国立国会図書館はデジタル化業務と永年保存を担うデジタル化業務システムに関するRFP(提案依頼書)を公示。競争入札の結果、MSYSが受託した。※1
※1:デジタル化の工程自体は本件に含まれていない。
03[システムの概要]
NetAppの高信頼性・高可用性で日本の文化資産を守る
DX(デジタルトランスフォーメーション)支援に豊富な実績を持つMSYSは、国立国会図書館が公示したデジタル化業務システムのRFPを実現するべく、ストレージのNetApp FASシリーズをベースとする構成を提案した。永年保存とともに、日本の文化や歴史を記録する資料の重要性を考慮し、信頼性、可用性を重視したからだ。NetApp FASシリーズは、RAID-DPを採用しており、1RAIDあたり2本のパリティディスクを持つことで、同じRAIDの中でディスク2本に同時に障害が発生した場合でもデータを保護できる。
デジタル化業務システムでは、デジタル化した資料の永年保存用(NetApp FAS2720)と、デジタル化した資料の管理やデジタル化作業の進捗管理を行うデジタル化業務用(NetApp FAS2750)と、用途によってストレージを分けた。
永年保存用ストレージは、信頼性を高めるためにクラスタ構成とし可用性を向上。デジタル化業務用ストレージは、誤ってファイルを削除しても復元が簡単に行えるスナップショットや、ディスク容量の最適化を図る重複排除など業務を支援する機能を備えている。さらに、NetApp搭載OS「ONTAP」によりオンラインでの容易な拡張を実現し、増え続けるデジタル化した所蔵資料の永年保存ニーズに応える。
MSYSは、長年にわたりNetAppの豊富な導入実績と知見を有しており、メーカー保守に加え、MSYS独自の保守サービスにより迅速かつ的確なサポートを実現。現在から未来に向けて国立国会図書館の重要な取り組みであるデジタル化業務と永年保存を支援する。
04[導入プロセスと今後の展望]
MSYSの豊富なノウハウにより短期間構築を実現
2021年4月にMSYSは、デジタル化業務システムのインフラ構築を開始し、同年7月に引渡しを完了。同システムでは、デジタル化業務を支える仮想化基盤としてNutanixのHCI(Hyper-Converged Infrastructure)を採用。Nutanixは、外部に独立したストレージを必要としない仮想化環境を実現するHCI分野において、先駆者であり、国内外で豊富な実績を有する。シンプルな構成に加え、GUI(Graphical User Interface)による直感的な操作性で運用業務の効率化が図れる。また、プラットフォームを選ばないため、重量、消費電力など顧客要件に合わせてサーバを選択し提案することが可能だ。さらに、HCIは設計・検証・インストール済みの構成で提供されるため、導入期間を大幅に短縮できる。MSYSは、プロジェクトマネージャーを筆頭に営業や技術部門が一体となって、NetApp、Nutanix、無停電電源装置(UPS)などで構成されるデジタル化業務システムを、わずか3カ月間の短期間構築を実現。また、ストレージ増強も追加で受注し導入した。
2022年8月から、国立国会図書館はデジタル化業務と永年保存を支えるNetAppをベースとするデジタル化業務システムは稼働を開始し安定稼働を続けている。また今回、統合監視ツールを導入し、ストレージの容量や死活の監視なども一元的に行い、システム全体での統合管理を実現。現在、国立国会図書館は、デジタル化業務システム上でデジタル化した資料の検査などを行っているほか、2022年の本稼働に向けて国立国会図書館デジタルコレクションのバックヤード機能のアプリケーション開発を進めている。今後、所蔵資料のデジタル化の進行に合わせて永年保存用ストレージは計画的に拡張する想定である。
デジタル社会が進展する中、日本の豊かな文化的資産を未来に継承する国立国会図書館。MSYSは、デジタル化業務システムの安定稼働、ストレージの拡張を通じて国立国会図書館の取り組みを支援している。
出典:「国立国会図書館デジタルコレクション」(国立国会図書館)(https://dl.ndl.go.jp/)(2022年3月23日に利用)
国立国会図書館デジタルコレクションは、総数300万点以上のデジタル資料をインターネットで検索・閲覧できる