見当のためのWekaの操作手順
1.要因(変数)の選択
1)概要
目的は、どの要因を作用させれば達成できるのか?それを見定めるのが、変数の選択です。
通常のマーケティング課題では、2つの方法で目的変数に対する作用を評価します。
GeneticSearch :遺伝的アルゴリズムによる探索
GainRatioAttributeEval:情報利得比による評価
遺伝的アルゴリズムによる探索で、目的変数に対して「効いている」変数を分け、情報利得比で「どの程度」効いているかで並べます。『分析とは、分けて並べること』です。
2)操作
Select attributesタブを選択
→ Chooseボタンを押下 → CfsSubsetEvalを選択
→ Chooseボタンを押下 → GeneticSearchを選択
→ プルダウンで目的変数を選択 → Startを押下
→ Chooseボタンを押下 → GainRatioAttributeEvalを選択
→ Chooseボタンを押下 → Rankerを選択
→ プルダウンで目的変数を選択 → Startを押下
3)結果
遺伝的アルゴリズムによる探索により、5つの変数が、目的に作用する要因として候補に挙がりました。
情報利得比による評価により、候補に選らばれた5つの要因が、相対的に高い説明力(目的に対する作用)を持っていることが確認されました。
Search Method: Genetic search(遺伝的アルゴリズムによる探索)
Probability of crossover: 0.6
交叉確率はどのくらいの頻度で交叉が行われるかを示しています。もし交叉が起こらなければ、子孫は両親の完全なコピーとなります。もし交叉が起これば、子孫は両親質の染色体の一部分づつからできあがります。もし交叉確率が100%であれば、すべての子孫は交叉によりできあがります。もし0%であれば、新しい世代は前の個体群の染色体の完全なコピーとなります。(しかしこれは新しい世代が同じ物であるということではありません!)
交叉は新しい染色体が古い染色体の良い部分をもっているという期待と、新しいものがよりよくなるという期待を込めてつくられます。しかしながら個体群のいくつかの部分を次の世代へ残すのもよいことです。
Probability of mutation: 0.033
突然変異確率は染色体の一部がどれくらいの頻度で突然変異を起こすかをあらわしています。もし突然変異がなければ子孫はなんの変更もなしに交叉(またはコピー)をbe taken after 突然変異が行われると染色体の一部分が変更されます。もし0%であると変更されません。突然変異はGAが局所解に陥るのを防ぐために作られています、しかしあまりそれは頻繁にはおこりません、なぜならGAは実際はランダムサーチに変更されているからです。
Attribute Subset Evaluator (supervised, Class (nominal): 17 FL):
Selected attributes: 2,3,5,10,15 : 5
F02
F03
F05
F10
F15
Search Method: Gain Ratio feature evaluator(情報利得比による評価)
Ranked attributes:
----------------
0.40679 15 F15
0.28652 10 F10
0.21274 3 F03
0.04417 2 F02
0.03473 5 F05
----------------
0.02176 9 F09
0.02093 1 F01
0.01803 6 F06
0.01625 13 F13
0.01609 7 F07
0.01374 12 F12
0.01329 14 F14
0.00815 8 F08
0.00413 11 F11
0.00122 4 F04
0 16 F16
1.要因(変数)の選択
1)概要
目的は、どの要因を作用させれば達成できるのか?それを見定めるのが、変数の選択です。
通常のマーケティング課題では、2つの方法で目的変数に対する作用を評価します。
GeneticSearch :遺伝的アルゴリズムによる探索
GainRatioAttributeEval:情報利得比による評価
遺伝的アルゴリズムによる探索で、目的変数に対して「効いている」変数を分け、情報利得比で「どの程度」効いているかで並べます。『分析とは、分けて並べること』です。
2)操作
Select attributesタブを選択
→ Chooseボタンを押下 → CfsSubsetEvalを選択
→ Chooseボタンを押下 → GeneticSearchを選択
→ プルダウンで目的変数を選択 → Startを押下
→ Chooseボタンを押下 → GainRatioAttributeEvalを選択
→ Chooseボタンを押下 → Rankerを選択
→ プルダウンで目的変数を選択 → Startを押下
3)結果
遺伝的アルゴリズムによる探索により、5つの変数が、目的に作用する要因として候補に挙がりました。
情報利得比による評価により、候補に選らばれた5つの要因が、相対的に高い説明力(目的に対する作用)を持っていることが確認されました。
Search Method: Genetic search(遺伝的アルゴリズムによる探索)
Probability of crossover: 0.6
交叉確率はどのくらいの頻度で交叉が行われるかを示しています。もし交叉が起こらなければ、子孫は両親の完全なコピーとなります。もし交叉が起これば、子孫は両親質の染色体の一部分づつからできあがります。もし交叉確率が100%であれば、すべての子孫は交叉によりできあがります。もし0%であれば、新しい世代は前の個体群の染色体の完全なコピーとなります。(しかしこれは新しい世代が同じ物であるということではありません!)
交叉は新しい染色体が古い染色体の良い部分をもっているという期待と、新しいものがよりよくなるという期待を込めてつくられます。しかしながら個体群のいくつかの部分を次の世代へ残すのもよいことです。
Probability of mutation: 0.033
突然変異確率は染色体の一部がどれくらいの頻度で突然変異を起こすかをあらわしています。もし突然変異がなければ子孫はなんの変更もなしに交叉(またはコピー)をbe taken after 突然変異が行われると染色体の一部分が変更されます。もし0%であると変更されません。突然変異はGAが局所解に陥るのを防ぐために作られています、しかしあまりそれは頻繁にはおこりません、なぜならGAは実際はランダムサーチに変更されているからです。
Attribute Subset Evaluator (supervised, Class (nominal): 17 FL):
Selected attributes: 2,3,5,10,15 : 5
F02
F03
F05
F10
F15
Search Method: Gain Ratio feature evaluator(情報利得比による評価)
Ranked attributes:
----------------
0.40679 15 F15
0.28652 10 F10
0.21274 3 F03
0.04417 2 F02
0.03473 5 F05
----------------
0.02176 9 F09
0.02093 1 F01
0.01803 6 F06
0.01625 13 F13
0.01609 7 F07
0.01374 12 F12
0.01329 14 F14
0.00815 8 F08
0.00413 11 F11
0.00122 4 F04
0 16 F16
決定計算1 − その数学が戦略を決める
決定計算2 − その数学が戦略を決める
決定計算3 − その数学が戦略を決める
決定計算4 − その数学が戦略を決める
決定計算5 − 相関解析
決定計算6 − WEKAの概要
決定計算7 − Wekaを使おう
決定計算8 − WEKAを使う2
決定計算9 − Wekaを使う3
決定計算10 − Wekaを使う4
決定計算11 − Wekaを使う5
決定計算12 − データマイニング再考
決定計算13 − 多重共線性
決定計算14 − WEKAの操作手順1
決定計算15 − WEKAの操作手順2
決定計算16 − WEKAの操作手順3
決定計算17 − WEKAの操作手順4
決定計算18 − 一般線形モデル