ブラウザーベース研究の成熟
Tiffany Trader

Webベースの解決策が学術界の将来を構成するだろうか? 統一的で共有可能な拡張性の高いデータセットの利点は有力な論拠に寄与する。Figshareの創設者、Mark Hahnelからの最近の記事で、クラウドは「学術的なすべての製品が棲息する場所として、ますます魅力的になっています。」と言う。
Hahnelは書いている:
クラウドは、その高速なロード時間、スケーラビリティ、自動的なアプリケーションの配置、複数バックアップおよび絶えず更新されるハードウェアで、学術機関が自身のサーバーセンターに伴う関連する運用コストと技術の急速な陳腐化でそれを作る必要のない事を意味する。我々は、単に「 学術データを公開可能とする」段階を超えて、より大きなデータ源から新たな洞察力を得ることができる何処かに動いている。この段階では、ボタンのクリックで数千ものサーバーの処理能力にアクセスするいずれの学術系開発者の能力もまた、商用クラウドクラウド サービスで提供可能な規模の本質的な力を証明する。
その傾向は、学術界に限った事ではない。分析家企業、IDCから丁度出て来た報告では、企業の高性能コンピューティング(HPC)システムのために使われるクラウドは2年間でほぼ倍増、2011年の13.8%から2013年には23.5%へ上昇を示した。
政府と学術機関での科学的なデータが飛躍的に成長していることに伴って、問題はどのようにこの全ての出力を格納し、整理し、広めるかである。クラウドは、効率的かつ効果的なワークフローを有効にする多くのスポークを持つ中央のハブとして機能する。この中央格納庫となるクラウドための膨大な潜在性があるが、ただし、依然としてこれを完全なソリューションにする技術の必要性がある、とHahnelは言う。主な制約は、ストレージ容量では無く、バンド幅制限である。いわゆる消費者インターネットは「研究クラウド」の地位としては非常に遅い。ほとんどのHPCハブは、一方で、はるかに高速な接続と、さらに彼ら自身のInternet2のような高速バックボーンを有効活用している。
クラウドプロバイダーの位置付けが科学分野にある時、HahnelはMicrosoft Researchが積極的にAzureプラットフォームに研究グループを勧誘し、一方AWSは無償でのゲノム解析データを含む公的なデータセットを提供していると指摘する。プロバイダーは、選ばれたグループと強い関係を確立し、いくつかのポイントで顧客が支払うを行ってくれることを願っている。
今後、Hahnelは、「特定のWebベースのアプリケーション開発され、これらがオープンデータセット、または異なる永続的な場所からAPI経由で引き出されるさらに複数のデータセットに大規模に適用されること。」を見てみたいと言う。このアプローチは、世界中の貯蔵庫と化した機関に格納されている多数の冗長コピーを持っている非効率的なコミュニティを緩和するだろう。
「オープンデータ関連付けされている潜在性が、一般的に薬剤発見の効率と学問の進歩に革命を起こすことを過小評価できません。」とHahnelは発言。「実際に残された問題は、これらのブラウザーツールとアプリケーションを構築するのは誰の責任だろうか?」