公益財団法人野口研究所

研究室の紹介Laboratory

リンクトオープンデータ(LOD):データベースを「作る」から「つなぐ」へ

これまで糖鎖科学研究においていくつかの糖鎖構造をデータベースで扱うための表記法や、糖鎖研究における様々な実験事実を収めたデータベースが作られました。しかし、それらは研究分野や実験方法等によって独立しており、実験データや糖鎖構造がそれぞれ違ったルールや表記で登録されていたため、データベース間におけるデータの関連性がわからない、という問題がありました。糖鎖の多くは、タンパク質や脂質など他の分子との間で機能するため、この問題はそのまま、糖鎖の理解の障害となります。
リンクトオープンデータ(LOD)
一方情報科学の分野では、近年、データベース上の様々なデータを相互に連携し、誰もが自由に利用できるようにするための取り組みが進んでいます。このような考え方を、リンクトオープンデータ(LOD)と呼びます。特に研究分野においては、分野ごとの研究者の実験解析等に関する知識をまとめたデータベースを統合化することで、分野を超えて集積された知識を様々な研究者が活用できるようになります。これにより、多くの情報が簡単に得られるようになるだけでなく、分野をまたいだこれまでにない新たな発見や研究の着想にも繋がります。 そこで、糖鎖科学データについてセマンティックウェブ技術を利用してLODを構築し、糖鎖関連データにおいてLODの利用が有用であることを確かめました[1]。次に、国際協働研究として糖鎖関連データを記述する統一ルールである糖鎖オントロジー(GlycoRDF, GlycoCoO)を開発しました[2, 3]。糖鎖オントロジーを利用してデータを記述することにより、LODを構築することが可能となります。我々の開発しているLODとしては、糖鎖研究サポートツールとして開発しているGlycoNAVIで利用しているLOD、国際糖鎖構造リポジトリGlyTouCan[4]で利用しているLOD、日本糖質学会公認ポータルである糖鎖科学ポータルサイトGlyCosmos[5]で利用しているLODがあります。これらのLODは、それぞれSPARQL endpointを用いてコンピュータから利用することができます。また、LODの利点である他のデータベースのデータとの連携も可能となっています。これらのLODはグラフィカルユーザーインターフェースを用いて可視化することによりユーザにデータを提示することで、利便性が向上します。LODを可視化したデータベースについては、「糖鎖のデータベース」の項目で紹介します。
リンクトオープンデータ(LOD)
参考文献
  1. Introducing glycomics data into the Semantic Web. Aoki-Kinoshita KF, Bolleman J, Campbell MP, Kawano S, Kim JD, Lütteke T, Matsubara M, Okuda S, Ranzinger R, Sawaki H, Shikanai T, Shinmachi D, Suzuki Y, Toukach P, Yamada I, Packer NH, Narimatsu H. J Biomed Semantics. 2013 Nov 26;4(1):39. doi: 10.1186/2041-1480-4-39. PMID: 24280648
  2. GlycoRDF: an ontology to standardize glycomics data in RDF. Ranzinger R, Aoki-Kinoshita KF, Campbell MP, Kawano S, Lütteke T, Okuda S, Shinmachi D, Shikanai T, Sawaki H, Toukach P, Matsubara M, Yamada I, Narimatsu H. Bioinformatics. 2015 Mar 15;31(6):919-25. doi: 10.1093/bioinformatics/btu732. PMID: 25388145
  3. The glycoconjugate ontology (GlycoCoO) for standardizing the annotation of glycoconjugate data and its application. Yamada I, Campbell MP, Edwards N, Castro LJ, Lisacek F, Mariethoz J, Ono T, Ranzinger R, Shinmachi D, Aoki-Kinoshita KF. Glycobiology. 2021 Aug 7;31(7):741-750. doi: 10.1093/glycob/cwab013. PMID: 33677548
  4. The international glycan repository GlyTouCan version 3.0. Fujita A, Aoki NP, Shinmachi D, Matsubara M, Tsuchiya S, Shiota M, Ono T, Yamada I, Aoki-Kinoshita KF. Nucleic Acids Res. 2021 Jan 8;49(D1):D1529-D1533. doi: 10.1093/nar/gkaa947. PMID: 33125071
  5. The GlyCosmos Portal: a unified and comprehensive web resource for the glycosciences. Yamada I, Shiota M, Shinmachi D, Ono T, Tsuchiya S, Hosoda M, Fujita A, Aoki NP, Watanabe Y, Fujita N, Angata K, Kaji H, Narimatsu H, Okuda S, Aoki-Kinoshita KF. Nat Methods. 2020 Jul;17(7):649-650. doi: 10.1038/s41592-020-0879-8. PMID: 32572234