公益財団法人野口研究所

研究概要・成果Outline / Result

研究テーマの紹介:Dチーム

情報科学を活用した糖鎖科学基盤の開発研究

1. はじめに - 複雑な糖鎖構造を情報科学する –

 生体高分子の一つである糖鎖は、核酸やタンパク質に次ぐ、「第3の生命鎖」と呼ばれるほど重要な役割を担っていますが、他の分野と比べて研究が遅れています。その理由として挙げられるのが、糖鎖構造の複雑さと、それに起因する情報科学技術の適用の難しさです。特に、情報科学技術は、核酸やタンパク質の研究が飛躍的な発展を遂げられた大きな要因の一つです。
 糖鎖の多様な機能は、その多様性に富んだ複雑な構造に由来します。そのため、核酸やタンパク質の単純な配列構造を扱う場合と比べ、構造を情報として取り扱うことが容易ではありません。また、構造解析や合成などの難易度も高くなるため、実験から得られる情報も少なく、断片的で曖昧なものになりがちです。つまり、糖鎖研究においては、糖鎖の機能や構造に関する情報の量や質が不十分であり、そのことが情報科学技術の適用を阻む大きなハードルとなっているのです。
 本チーム研究では、そのような問題を解決するべく、糖鎖科学研究に対して情報科学からのアプローチを可能にする、情報処理基盤の構築を目指した取り組みを行っています。

2. データベースを「作る」から「つなぐ」へ:LODの実現

 もちろん、糖鎖分野に対する情報科学技術の適用のために、情報科学研究者がこれまで何もしてこなかったわけではありません。いくつかの糖鎖構造をデータベースで扱うための表記法や、糖鎖研究における様々な実験事実を収めたデータベースが作られました。しかし、それらは研究分野や実験方法等によって独立しており、実験データや糖鎖構造がそれぞれ違ったルールや表記で登録されていたため、データベース間におけるデータの関連性がわからない、という問題がありました。糖鎖の多くは、タンパク質や脂質など他の分子との間で機能するため、この問題はそのまま、糖鎖の理解の障害となります。

データベースを「作る」から「つなぐ」へ:LODの実現

 一方情報科学の分野では、近年、データベース上の様々なデータを相互に連携し、誰もが自由に利用できるようにするための取り組みが進んでいます。このような考え方を、リンクトオープンデータ(LOD)と呼びます。特に研究分野においては、分野ごとの研究者の実験解析等に関する知識をまとめたデータベースを統合化することで、分野を超えて集積された知識を様々な研究者が活用できるようになります。これにより、多くの情報が簡単に得られるようになるだけでなく、分野をまたいだこれまでにない新たな発見や研究の着想にも繋がります。
 我々のチームも、糖鎖分野におけるLODの実現を目指した取り組みを行っています。特に、これまで我々が中心となって開発してきた糖鎖構造表記法WURCSを用いて、糖鎖構造のデータ化、それを中心とした情報処理基盤の構築、さらに各種糖鎖関連データベースの連携を進めています。

データベースを「作る」から「つなぐ」へ:LODの実現
3. 糖鎖構造情報をWURCSで集める、つなぐ、使う

 糖鎖構造表記法WURCS(Web3.0 Unique Representation of Carbohydrate Structures)には、LODやその利用環境を構築する上で有利な以下のような特徴があります:
1. 網羅性:実験から得られる様々な構造情報に対応
2. 互換性:他の表記法との相互変換が可能
3. 可搬性:データ化が容易で、コンピュータが扱いやすい

糖鎖構造情報をWURCSで集める、つなぐ、使う

 現在我々は、WURCSの特徴を活かした情報処理基盤とLODの構築を目指し、国際糖鎖リポジトリGlyTouCanや糖鎖研究支援サイトGlycoNAVI、糖鎖科学ポータルGlyCosmosの開発や、PubChemやPDBなど、国内外の糖鎖関連データベースとの連携を行っています。また、糖鎖描画編集ツール等、様々な研究者が糖鎖情報を利用しやすくするためのUI(ユーザーインターフェース)を備えたソフトウェアの開発も行っています。

糖鎖構造情報をWURCSで集める、つなぐ、使う