リンク自動管理システム(Hyperlink Management System)
Move To the English Page of HMS
リンク自動管理システム(Hyperlink Management System)は、ライフサイエンス分野の主要なデータベース間のリンクを自動で更新・管理するための仕組みです。ヒトの遺伝子やタンパク質の情報を対象として、データIDの対応表を毎日自動で更新しており、最新のリンク情報を提供しています。
背景
異なる機関で独立に運営されているデータベースの間での密な連携を実現するためには、データの対応関係を調べて相互にリンクを設置することが効果的です。しかし、多数のデータベースの間でのリンクを維持管理するには、データベースの組み合わせが非常に多くなるため、膨大なコストがかかります(図1)。例えば、N個のデータベースがすべて相互にリンクされている状態でひとつのデータベースがデータ更新を行うと、2(N-1)方向のリンクを設定し直す必要が生じます。もし各データベースが年に4回ずつ更新されるとしたら、最大で年に8N(N-1)方向のリンクを設定し直さなくてはならず、リンクを維持するのがいかに大変であるかがわかります。そこで、リンクの管理を完全に自動化するための「リンク自動管理システム」を設計・試作しました。

図1.データベース間の相互リンクの維持コスト。6種類のデータベース間で完全にリンクを作成すると、30方向のリンクの設置が必要となり、その維持には大きな労力が必要となる。
リンク自動管理システムのしくみ
リンク自動管理システムは、主要なライフサイエンス分野のデータベースからデータ識別子(ID)の一覧表を毎日ダウンロードし、それらのデータベースのID同士の対応表を自動作成します(図2)。そして、このID対応表に基づいて、ユーザが指定したあるデータベースの特定のIDに対応する他のデータベースのデータの画面を表示するURLを、表示できるようになっています。このURLは、リンク自動管理システムの用意するCGIで簡単に呼び出せるようにしてあります。
つまり、データベースAの管理者がデータベースAからデータベースBへのリンクを設置したい場合に、普通はデータベースBのIDを使ってリンクを設置するのですが、リンク自動管理システムを使えばデータベースAのIDを用いてデータベースBへのリンクが設置できるようになります。相手先のデータのIDを知らなくても、リンクが簡単に設置できるわけです。したがって、データベースのリンク設置や更新の手間が大幅に省けることになります。

図2.リンク自動管理システムのしくみ。
リンクの記述方法
リンク自動管理システムを使ってリンクを設置するためには、以下のURLをリンク先URLに使います。
http://biodb.jp/hfs.cgi?id=[ID]&type=[ID Type]&db=[Database name]
ここで、[ID]はリンク元(リンク先ではない)のデータベースで使われているID、[ID Type]はIDの種類、[Database name]はリンク先のデータベース名を示す変数です。変数指定の詳細は、リンク自動管理システムのヘルプページの中にあります。例えば、DDBJ/EMBL/GenBankのアクセッション番号BC053657を使ってH-InvDBの対応するデータを表示するには、
<a href="http://biodb.jp/hfs.cgi?id=BC053657&type=ACC_ID&db=TRANSCRIPTVIEW">BC053657</a>
のようにリンクを設置します。実際の動作を見るには、次の行のアクセッション番号をクリックしてみてください。
BC053657
本システムについて
リンク自動管理システムは、文部科学省科学技術振興調整費・科学技術連携施策群の効果的・効率的な推進「生命科学データベース統合に関する調査研究」(平成17−19年度)の支援を受けて、産業技術総合研究所生物情報解析研究センターにて開発されました。平成20年度からは経済産業省統合データベースプロジェクト(ポータルサイト MEDALS.jp)の支援を受けています。本システムに関するお問い合わせは、下記へお願いします。
産業技術総合研究所バイオメディシナル情報研究センター分子システム情報統合チーム
今西 規(いまにし ただし)
Email: t.imanishi [at] aist.go.jp
更新日:2009年4月13日