ヤフーと米トレジャーデータは2014年7月25日、日本市場向けにビッグデータ分析のクラウドサービスを提供することで業務提携したと発表した。ヤフーはトレジャーデータの技術を使って「Yahoo!ビッグデータインサイト」を提供する。サービスのIT基盤には、ヤフーの子会社であるIDCフロンティアのクラウドサービスやクラウドストレージを使用する。

 トレジャーデータは日本人エンジニアが米国で起業したスタートアップで、米国では「Amazon Web Services(AWS)」をIT基盤に採用して「トレジャーデータサービス」を提供している。ヤフーはトレジャーデータからソフトウエアなどのOEM供給を受け、トレジャーデータサービスと同じ機能を備えるビッグデータ分析サービスであるYahoo!ビッグデータインサイトを提供する。IT基盤はAWSではなくIDCフロンティアのクラウドを使用する。ヤフーは同サービスを、マーケティングソリューション事業の一環として展開する。サービス提供時期は未定である。

 Yahoo! ビッグデータインサイトのベースとなるトレジャーデータサービスは、オープンソースソフトウエア(OSS)の分散データ処理ソフト「Hadoop」と、トレジャーデータが開発したカラム型ストレージ「Plazma」を内部で使用する。SQLクエリーを使ってビッグデータの分析ができることが特徴である。

 SQLクエリーとしては、Hadoop用のSQLクエリーである「Hive」以外にも、「Impala」や「Presto」といったアドホック型SQLクエリーも利用できる。また「JDBC」「ODBC」といったデータベースを外部のプログラムから利用するためのインタフェースも備えているため、BI(ビジネスインテリジェンス)ツールを使ったデータ分析も可能である。