2014年 11月 1日

前回、パーキンソンの法則にはバリエーションがあることを述べた。
パーキンソンの第1法則は、「仕事の量は、完成のために与えられた時間をすべて満たすまで膨張する」というものである。これは、仕事が必要以上に膨らみ、組織のサイズも必要以上に肥大化するという官僚制組織の弊害を説いたものである。
そして、このパーキンソンの法則のIT分野のバリエーションが、「データ量は与えられた記憶装置のスペースを満たすまで膨張する」というものである。
これは記憶装置の容量に限らず、CPU資源やメモリー容量、ネットワーク帯域など、コンピューター資源一般に拡張できる。 すなわち「処理量やデータ量は、与えられたコンピュータ・リソースを使い切るまで膨張する」と一般化できる。
この法則が正しいことはパソコンの歴史を振り返れば明らかだ。 昔はCUI(コマンドライン)とテキスト処理だけだったものが、GUIでイメージデータや画像、さらに動画まで扱えるようになった。

最近の事象でこの法則にあてはまるものの1つがビッグデータではないだろうか?
コンピュータは、そのリソースの増強(CPUのマルチコア化や、メモリー容量、ディスク容量の増加)により、 より大量のデータを、よりリアルタイムに処理できるようになってきた。
さらに、クラウド環境を使えば、リソースが不足する都度、ダイナミックにリソースを追加できるようになった。
こうなると、ITベンダーは出来るだけ多くのコンピューター資源をユーザーに使ってもらおうと考えるだろう。 ビッグデーターは、正にこのITベンダーの思惑に合致したセールス・トークだと言える。

ビッグデータの事例としてどのようなシステムが紹介されているかをざっと見てみよう。

  1. 「センサーからのデータ処理システム」
    最近流行のIOTとも関連するが、各種センサーから取得したデータをリアルタイムに処理するタイプのシステムである。
    センサー以外にも、機械やオフィス機器から稼働データを収集・分析して、故障の予防などに役立てるシステムがある。
    最近は、機械学習と組み合わせてコンピューターに画像認識を行わせるなどの試みも行われている。(この技術が成熟すると、監視カメラの映像をリアルタイムに解析して、特定の人物とその行動を追跡できるようになるだろう)※
  2. 「データーマイニング」
    商品の販売データやクレジットカードの利用履歴などを分析し、相関関係やパターンを抽出するタイプのシステムである。
    たびたび紹介される事例に「ビールを買う客は一緒に紙オムツを買うことが多い」という意外性のある関連購買の事例がある。しかし、意外性のある関連購買の事例として、これ以外の事例にはあまりお目にかからない。
    マーケティング分野での適用事例には、天気や地域イベントとの相関から商品の需要を予測したり、 売れ筋商品・死に筋商品を分析するなど、いろいろなバリエーションがある。
  3. 「テキスト・マイニング」
    商品のクレーム情報やアンケート結果など、自由記述の文章からキーワードを抽出し、他の情報と突き合せて相関関係などを分析するタイプのシステムである。

さて、上に掲げた例は、実はそれほど目新しいものではない。
BI(ビジネス・インテリジェンス)やDWH、データー・マイニング、テキスト・マイニングなどのコンピューター利用技術は、 ビッグデータという言葉が流行するよりもずっと以前から存在していた。これは、「なんでもビッグデータ?」に書いたとおりである。

コンピューターリソースの利用率を高めたいベンダーの目論見に対して、ユーザー企業はどのような反応を示しているのだろうか?
日経コンピューター2014年10月16日号に面白い調査結果が出ている。
ユーザー企業に「ビッグデータ活用に本腰を入れているか」と聞いたところ、「本腰を入れていない」と回答した割合が84%と圧倒的に多かった、というのである。
これに続いて、「本腰を入れているが、まだ効果は出ていない」が12%、「本腰を入れており、効果が出ている」はわずか3%となっている。
一方、ITベンダーに対する調査結果も出ている。
ITベンダーを対象に、「ビッグデータ関連ビジネスは活況かどうか」を聞いたところ、最も多かった回答は、ビッグデータ関連ビジネスを「手掛けていない」で40%もいる。
「活況であり、利益が出始めている」は僅か6%、「引き合いは多いが、ビジネスに結びついていない」と「引き合いがない、多くない」がそれぞれ約2割になっている。
この調査結果から見えてくるのは、「 ビッグデータという流行語を冷静に、時には冷淡に眺めているユーザ企業と、ビッグデータを商機としたいが苦戦を強いられているITベンダー」、 という構図である。
何故このような構図になっているのだろうか?
これには以下の理由が考えられよう。

  1. 「定義があいまい」
    「なんでもビッグデータ?」に書いたように、ビッグデータの定義があいまいなため、この言葉が指し示すシステム化の適用領域が非常に広範囲になり得ることである。
    すなわち、ITベンダーにとっては、提案するシステムの的が絞れないことがあげられる。 ユーザー企業にとっても、何をシステム化するのかが漠然としており、目的も判然としていない。
  2. 「いまさら感」
    先に述べたように、ビッグデーターの適用事例と言われるものが、この言葉が流行るより以前からあったシステム機能・システム方式が大半だからである。
    すなわち、ユーザー企業にとっても、ITベンダーにとっても、何を今更という「いまさら感」があるからであろう。

ユーザー企業もITベンダーもビッグデータという言葉に惑わされずに、システム化の目的と効果を明確にすることが今まで以上に重要になってきたと言える。 さもなくば、パーキンソンの法則が指摘するとおり、コンピューター資源を浪費することにもなりかねない。


※ 2014年11月、情報通信研究機構(NICT)が、大阪ステーションシティ(JR大阪駅一帯の商業ビル)において、監視カメラを使用した顔認識の実証実験を部分的に再開することを発表した。

Update

2014年11月
« 10月   12月 »
 12
3456789
10111213141516
17181920212223
24252627282930

Navigation