蛋白質構造データバンク(たんぱくしつこうぞうデータバンク、PDB: Protein Data Bank)は、蛋白質(タンパク質)、核酸、糖鎖など生体高分子の3次元構造の原子座標(立体配座)を蓄積している国際的な公共のデータベースである。PDBに蓄積されている構造データは、結晶解析法、核磁気共鳴法(NMR法)、クライオ電子顕微鏡法の3つの検証可能な手法によって実験的に決定されたデータである。なお、理論的な予測(蛋白質構造予測)で推定されたデータは蓄積していない。
世界中の構造生物学者が決定した構造情報は、論文発表前にPDBに登録することが義務付けられており、論文発表と同時にPDBへ登録済みの構造データが一般公開される仕組みになっている。PDBの運営は日米欧の各拠点機関が国際的に協力することで成り立っており、南北アメリカとオセアニア地区で解析されたデータは米国で、欧州とアフリカ地区からのデータは欧州で、アジア・中東地区で解析されたデータは日本でデータ登録処理が行われる。日本の拠点活動は、大阪大学蛋白質研究所のProtein Data Bank Japan(PDBj)が担当している。PDBに登録されたデータは、事前に日米欧の各拠点間でデータ交換され、パブリックドメインのもとで完全に同一なデータとして一般公開される。
1971年に、アメリカ合衆国のブルックヘブン国立研究所(BNL)と英国のThe Cambridge Crystallographic Data Centre (CCDC)が共同でPDBを設立し、PDBへのデータ登録はブルックヘブン国立研究所が単独で行っていた。設立以来PDBデータの磁気テープによる公開はブルックヘブン国立研究所とCCDCにより行われていたが、1976年に東京大学大型計算機センターもこれに加わった。1979年からは磁気テープによる日本国内へのデータ配布活動は、大阪大学蛋白質研究所が担うことになった。
RCSB PDBとして
1998年に、米国プロジェクトとしてのPDBはブルックヘブン国立研究所から構造バイオインフォマティクス研究共同体 (RCSB; Research Collaboratory for Structural Bioinformatics) に移管され、同研究共同体 (RCSB) がPDBの登録業務を担当し、PDBのマスターファイル管理をすることになった。並行して欧州ではEMBL-EBIにMacromolecular Structure Databaseが立ち上がり、BNLと共同で開発されたAutodepシステムを用いたデータ登録が開始された。2000年には大阪大学蛋白質研究所でもRCSB PDBの協力により、アジア地区からのデータ登録受付を開始した。
wwPDBとして
2003年、日米欧の各拠点で別々にデータ登録が行わていたPDBの運営をより公式なものとし、世界同一の基準でデータ登録を行うことを目的として、RCSBを含む次の3つの研究組織によりWorldwide Protein Data Bank (wwPDB) が結成された。2006年には生体分子磁気共鳴データバンク(BMRB)(英語版)もメンバーに加わり、現在は4つの組織が構成メンバーである。wwPDBは独自に運営諮問会議を毎年開催し、運営諮問委員からの意見に従ってPDBを運営している。wwPDBでは、統一した基準によるデータ登録が行われて完全に同一のデータを公開しているが、データの検索サービスやデータ配布方法には自由度があり、各拠点独自のサービスを提供している。
PDBから提供される構造データには、それぞれ PDB ID という4文字のアルファベットからなる識別子が、割り当てられている。PDB ID は、生体高分子の識別子として使うことはできない。なぜなら、同じ一つの分子が環境/状況に応じて異なる複数の3次元構造をとるということが、蛋白質などの分子ではよくあるためである。その場合、一つの分子がそのとり得る構造ごとに、複数の PDB ID を割り当てられる。
H.M. Berman, K. Henrick, H. Nakamura (2003): Announcing the worldwide Protein Data Bank. Nature Structural Biology 10 (12), p. 980 PMID14634627.
H.M. Berman, J. Westbrook, Z. Feng, G. Gilliland, T.N. Bhat, H. Weissig, I.N. Shindyalov, P.E. Bourne: The Protein Data Bank. Nucleic Acids Research, 28 pp. 235-242 (2000). PMID10592235
Bernstein FC, Koetzle TF, Williams GJ, Meyer Jr EF, Brice MD, Rodgers JR, Kennard O, Shimanouchi T, Tasumi M. The Protein Data Bank: a computer-based archival file for macromolecular structures. J Mol Biol 1977;112:535-542. PMID875032.
Sussman, JL, Lin, D, Jiang, J, Manning, NO, Prilusky, J, Ritter, O & Abola, EE. Protein data bank (PDB): a database of 3D structural information of biological macromolecules. Acta Cryst 1998; D54:1078-1084. PMID10089483.