「戦略的データマイニング」 池尾恭一・井上哲浩 2008年 日経BP社

 慶応の大学院の先生二人が書いた本。程度が低すぎて、驚愕です!日本のデータマイニングの水準の低さは承知しておりますが、ここまで酷い物を見せつけられると呆れ果てる以外にはありません。じゃあ、生禿の出身校である早稲田はどうかというと、もっと状態は悪いというのが実態。日本のMBAには行っても無駄というのは事実なのでしょう。生禿も修士課程を教えている人間。気を引き締めて取り組んでいきたいと思います。

 それでも、データマイニングを全く知らない学生には参考になるでしょう。 以下は、この本要約と引用です。また、*印の部分は、生禿の見解です。


基礎編

1.オープン型マーケティングの展開

 家電品の流通においても、90年代からは、系列小売店が他メーカーの製品を扱うようになった。生命保険会社の販売員が他社の癌保険を販売したり、銀行が他系列の年金保険を販売したりしている。現在は、メーカー系列に属さない専門量販店や総合量販店があ台頭している。

*流通系列化は製品のフルライン化を必然とするが、その結果として不採算な製品ラインを多く抱えることになります。取引先や消費者への対応力を高めようとするならば、他社製品を取り込んだフルラインな品揃えが必要になります。

 アスクルは起業の翌年、1994年には、プラスの製品に縛られないオープンな調達に移行し、1995年には、プラスの既存チャネルにとらわれずに、価格訴求に向かった。アスクルは流通業者として成長し、分社化によって決定的なものとなった。あアスクルは、製販分離により、オープン化を前提に製品力の強化を図るオープン型マーケティングを推進している。

*著者は、「購買の関与度」とか「製品の判断力」とかいう、科学の事実の根拠のない理屈で購買行動を説明しています。事実無根の言葉遊びはマーケッターの得意技とは言え、学生に教える立場としてはいかがなものかと思われます。少しでもいいから、認知科学を勉強されることをお勧めします。

 メーカーは、重点分野に資源投資を集中して、競争力を高めていこうとします。選択と集中は、切り捨ての断行が前提条件です。

2.購買代理業としての流通業者

 流通業者が購買代理業として機能するためには、新製品や無名製品の発掘や、専門商品やPB商品の投入などにより、標的顧客のニーズを基点とする視点が不可欠である。顧客に代わってニーズにあった製品を探し出し、推奨する機能は、情報縮約である。

3.データベースによる顧客の囲い込み

 市場細分化の推進は、生産・物流・販売の全てで費用の増大をもたらす。また、多品種の製品に対して、いつどれだけの需要があるかを予測する必要が生じる。

*製品の絞込みは、費用の削減に直結します。

 顧客への個別対応は、業務用製品については行われていた。旅館や飲食店では、上顧客への個別サービスが行われてきた。

 関係性マーケティングは、ヨーロッパに端を発する。消費者との継続取引関係による顧客占拠率と顧客資産が強調される。

4.顧客囲い込みの条件

 顧客の探索・選択努力を削減させるメリットは大きい。

*顧客層ごとに特定の品種の最小選択肢が存在し、それ以下の品揃えでは購買は発生しない。ニーズに適合する商品の絞込みは、その最小選択肢を目指して絞り込まれる。

手法編

5.データマイニングの基礎

 データを構造化したデータウェアハウスから、分析用にデータマートを合成する。

 テキストマイニングの分かち書き処理は、意味を持つ最小の言語単位である形態素に分解すること。

 データクリーニングは、欠損値や異常値と重複の確認(データチェック)と、コード化や変数加工や加重化などの処理方法の選択。

 ロジスティック回帰分析は、離散変量を対象とする。二値の離散変量の場合は、二項ロジットとも呼ばれる。

 階層的クラスター分析は、計算時間が膨大になる。K平均法のクラスター分析は、セグメント数を設定し、各セグメントの平均値の初期値を設定する。K平均法を実施する前に、階層的クラスタリングのウォード法などにより初期値を設定する。

7.データマイニングのための機械学習系手法

 マーケットバスケットは、共起性に基づく連環ルールを最小確信度に基づき作成する。

 エントロピ関数は、[−Σj=1~k(pj・logkpj pj:K種類ある事象jの出現率]。

 ニューラルネットワークでは、出力層の各ノードは、その下位層にある全てのノード中間層の関数として、中間層の各ノードはその下位層にある中間層の全てのノード入力の関数として算出される。ジグモイド型のロジスティック関数を各層間の関係に設定する。

応用編

 アスクルのデータを用いて分析を行った。脱落防止品目の識別では、ある期に購買を行った顧客の内、次の期に購買を行った顧客と購買をしなかった顧客を識別するある期の購買品目を判別する。脱落を阻止するためには、購買間隔が短い商品に魅力ある品揃えをすることが求められる。より頻繁に購買している顧客は脱落しにくい。

 トラフィック・ビルダーとは、顧客を吸引している品目。購買金額を拡大する品目は、アスクルの翌日配達が便利な品目であった。ペットボトル飲料は、配送を魅力とするトラフィック・ビルダーである。

 人気機種でないプリンター・カートリッジは、取り扱いそのものがトラフィック・ビルダーとなり得る。しかし、購買間隔が長いため、トラフィク・ビルダーとしての役割は限られたものになる。

9.購買構造と顧客クラスター

 ライトユーザーからヘビーユーザーへのクラスター間移行を識別する購買品領域を特定する。購買金額が高いライトユーザーは、他頻度ミドルには移行しにくい。単価の低い商品を購買する顧客ほど多頻度ミドルに移行しやすい。顧客資産を高めるには、購買頻度を高める経路と、大量購買を誘導する(購買金額を高める)経路がある。

10.マーケット・バスケットとトラフィック・ビルダー

 併買類型(パターン)の識別は、店舗の商品陳列(配置)、カタログやWEBサイトの設計、配送センターの配列(レイアウト)に貢献する。 トラフィック・ビルダーが、どの商品と併買されているかは重要である

*著者たちは、生禿が行っているような通常の直接に併買を抽出する「併買分析」を行う能力が欠如しているので、回帰分析などを用いて併買を識別している。これには驚いた!とは言え、生禿が教えた分析者の中でも、併買分析を自在に使いこなしているのは、限られてはいるが。