AzureCon での 「Cortana Analytics Suite」 を使ったデモ

今週行われた技術イベント AzureCon で「Cortana Analytics Suite (コルタナ アナリティクス スイート)」を使った日本マクドナルド様のデモが発表され、セッション動画が公開されていました。

Transforming Data into intelligent action
https://channel9.msdn.com/Events/Microsoft-Azure/AzureCon-2015/azurecon-ranga-intelligent-org-with-data

Microsoft Azure のサイトでも視聴できます。
https://azure.microsoft.com/en-us/azurecon/

Cortana Analytics Suite は名前に「コルタナ」と入っているので勘違いされるのですが、『音声認識だけにフォーカスしている』とか、『ただの API 群』なんてことはなく、
実際には、「データの入力 (センサーやデジタルサイネージ等からの Azure での受信)、大量の構造化・非構造化データの格納、ETL処理、大規模並列実行をお手軽にできる分析サービスと機械学習、そしていわゆるビジネスインテリジェンス(BI 画面)」を一気通貫で提供するサービスになっています。

Cortana Analytics Suite に関する説明は、セッション動画の開始 29分30秒頃から始まります。Microsoft Partner of the Year 2015 も受賞している VMob 社の CTO である David さんが説明されています。
VMob 社が作ったアプリケーションは以下の3つをターゲットにしていると説明されていました。

  1. お客様ごとに合わせたプロモーション
  2. お客様に合わせたケータイ クーポン
  3. お客様ターゲットに合わせたプッシュ通知

Azure ポータルを参照しながら構成についても説明されており、8つのリージョンにそれぞれ Azure SQL Database を作成し、『Elastic Database Pools』の機能を使うことで、特定のマーケットでのピーク (ランチタイム、イブニング) があっても複数データベースでスループットを共有することでスパイクを回避するよう構成されているとのことです。

さらに、現在 Private Preview 中の「Azure Data Lake Analytics」も Cortana Analytics Suite には含まれていますので、これについてもデモが行われました。
Azure Data Lake Analytics は大量データに対して分析処理を行えるサービスです。分析処理を行う方法として「U-SQL」という SQL 構文 (と .NET Framework) が使えるのが大きな特徴の1つで、デモでも 26 TB の TSV ファイルをインプットにして多数の分析処理を纏めて1つのジョブとして実行していました。
※ マイクロソフト版 Apache Spark SQL とも呼べる とてもすごいサービスです。年内には Public Preview が開始される予定です。

Azure Data Lake Analytics のもう1つの大きな特徴は並列度を簡単に変更できることで、デモの中でも「スライダー」を使って並列度 1 から 1000 までグリグリと変更していました。

さらに、Azure Data Lake Analytics のジョブは各タスクをグラフィカルにも確認することができ、1つ1つのタスクでの統計 (In/Out) なども参照できたりします。

なんでもぶち込める Azure Data Lake (Store) から BI 画面で見たいデータを Azure SQL Data Warehouse に格納して Power BI で参照する、というデモが次に行われました。

デモの最後は、機械学習による商品レコメンドを実演されていました。デモでは、『Kinect センサーから受け取った David さんの立ち姿を基にした性別、年齢』、『センサーで取得した気温、湿度』などを基にデジタルサイネージに表示される広告が変わることを実演されていました。

データの受信から格納、分析、BI 表示までを一気通貫でできる Cortana Analytics Suite ですが、このイベントの発表で晴れて購入できるようになりました。
クラウドサービスなので「購入」という言葉に違和感があるかもしえませんが、Cortana Analytics Suite は、現時点では Azure ポータルからポチっと買えるサービスではなくオンプレミス製品のように購入が必要になります。

いわゆる IoT や超大規模な分析サービスが少しずつ 手の届くところに近づいてきました。大量のノードによる並列実行はクラウドサービスで行い、裾野が広がるように GUI 操作や SQL で実現できるようにしているアプローチはマイクロソフトっぽいところかな、と思っています。
Cortana Analytics Suite を構成するサービスについても別途纏められればと思っています。