Microsoftの研究者たちが8月のカンファレンスで発表する予定の新たなホワイトペーパーは、同社のバックエンドクラウドインフラストラクチャについてさらなるヒントを提供している。
「SCOPE: Easy and Efficient Parallel Processing of Massive Data Sets」と題する本ペーパーは、クラウドスケールのサービス構造にとって重要な(検索ログやクリックストリームといった)大量のデータセットを保管、分析するために最適化された新しい宣言型スクリプト言語の詳細を示している。SCOPE(Structure Computations Optimized for Parallel Execution)がその言語の名前である。
Microsoftが8月下旬にVLDB 2008カンファレンスで発表する予定の本ペーパーによると、SCOPEは明らかな並列処理を必要としないが、大きなクラスター全体で「効率的な並列実行の影響を受けやすい」だろうとされている。SCOPEはSQLのようなものだが、それにC#の拡張を備えたものであると、本ペーパーは述べている。
筆者はこの新しいホワイトペーパーを、MicrosoftのLive Labsに務めるGreg Linden氏のブログ内のリンクを通して見つけた。Linden氏はこのようにブログで述べていた:
「ScopeはYahooのHadoopの上位レベルの言語であるPig、あるいはGoogleのMapReduceの上位レベルの言語であるSawzallと似ている。しかしPigではより命令型のプログラミングスタイルに注力、主唱しているのに対し、ScopeはむしろSQLのようだ。」
本ペーパーを読み進んでいくと、SCOPEがMicrosoftのバックエンドストレージ層であるCosmosとどのように関係しているのかについての説明に気がついた。Cosmosは現在、Live Searchやその他のMicrosoftサービスで採用されている。本ペーパーからは以下の通りである:
「Microsoftは大量データセットの保管と分析のために、Cosmosと呼ばれる分散型コンピューティングプラットフォームを開発した。Cosmosは何千ものコモディティサーバで構成される大きなクラスター上で動作するように設計されている。ディスクストレージは、1つ以上の直接付属したディスクを備えた各サーバから分散される。」
(疎結合に関する余談:Pat Helland氏がMicrosoftのSQLチームに異動すると決意したことが、このことと何らかの関係があるかどうかが気になっている。Helland氏の専門知識は、サービス指向アーキテクチャだけでなくトランザクションおよび並列処理にまつわる大局戦略に取り入れられている。)
Microsoftのますます多くの将来的戦略や製品が、ようやく融合しつつあるようだ。さらに多くのチームが、並列/分散型/マルチコアコンピューティングについて考えており、Windowsの実験的後継製品であるコード名Midoriはその多くの例のうち最も新しいものとなっている。Microsoft製品はますます、当初からモデリングを念頭に置いて設計されるようになっているようだ。
多様なMicrosoft製品グループに及ぶ「ドライブのアラインメント」を壊すというチーフソフトウェアアーキテクトのRay Ozzie氏のキャンペーンはどうやらついに根付き始めたようだ…。あるいは単に、クラウドコンピューティングは、真に拡張可能とするためには、ますます拡大する分散型システムのネットワーク全体で機能するように構築される必要があるということなのかもしれない。あるいはその両方の要素が少しずつ入っているのか…。
この記事は海外CNET Networks発のニュースをシーネットネットワークスジャパン編集部が日本向けに編集したものです。海外CNET Networksの記事へ