安田のはてなブログ

サンフランシスコ・シリコンバレーでの投資活動を通して学んだこと、感じたことを書いてます。

AI時代に注目される”データネットワーク効果”

AIを使って様々な業界の問題を解決しようとするスタートアップが世界中で増えてきました!
 
彼らの競争の厳選はアルゴリズム(モデル)。そして、多くの場合、アルゴリズム、つまり機械学習(Machine Learning)や、深層学習(Deep Learning)を教育するためには、大量且つ質の高いデータが必要です。スタートアップは、短期間且つ低コストで必要なデータを集め、独自のアルゴリズムを構築しなければなりません。 
 
そこで注目されているのが、データネットワーク効果 (Data Network Effects) という考え方です。
 
データネットワーク効果は、ネットワーク効果とは違い、データ量を増やす仕組みにフォーカスしています。(ネットワーク効果については「A Guide to MARKETPLACESの日本語訳」を参照ください)
 
データネットワーク効果とは?
 
データネットワーク効果は、以下のサイクルを回す仕組みです:
 
  1. データ量が多くなるほど、アルゴリズムの学習・改善が進む。
  2. 改善されたアルゴリズムによりユーザ体験が向上し、より多くのユーザが使うようになる。
  3. より多くのユーザが使用することにより、データ量が増える。→ 1へ
 
データネットワーク効果は、データがデータを生む仕組みです。図にしてみると以下のような感じになります。
 

     f:id:mikihiro_yasuda:20170506065240p:plain

データネットワーク効果がプロダクトに組み込まれている具体的な事例ですと、
 
  • Farmers Business Network :農家が自分の畑・作物のデータを入力すると、他の農家のデータとの比較ができる。参加農家が多いほど、収穫量の予想などのアルゴリズムの精度が上がる。

 

  • Mendel.ai (※): 患者さんの電子カルテと遺伝子情報をアップロードすると、最適な臨床試試験がマッチングされる。データ量が増えるほど、アルゴリズムの学習が進みマッチングの精度が向上する。

  ※DeNA投資先

 

  • Numer.ai :データサイエンティスト達が金融商品の将来の動向機械学習を使って独自に予想。Numer.aiは、それらの予想を集約し金融商品取引を行う。良いモデルを作る参加者が増えるほど、取引の利益が上がる。
 
 などがあります。
 
興味深いのは、上記のようなデータネットワーク効果のあるプロダクトは、ユーザにデータを入力するインセンティブを与えていることです。Farmers Business Networkであれば、収穫予想、Mendel.aiは、患者さんに合った臨床試験、Numer.aiは予測に参加したデータサイエンティストへ、モデルのパフォーマンスに応じた成功報酬を支払っています。
 
データネットワーク効果のあるプロダクトは、データを購入するために貴重な資金を使う必要が無いため資本効率が高く、投資家からの受けもよくなります。
 
ただし、創業当初は、ユーザがデータを入力するインセンティブになるようなアルゴリズムがまだできていないため、オープンデータを利用したり、ある程度アルゴリズムが磨き上がるまで手作業でサービスするなどの工夫が必要です。
 
このテーマは、今後ももう少し掘っていきたいと思います!
 
参考コンテンツ: