2013年4月3日水曜日

HeadFirstデータ分析を読む。

データアナリストのための入門書。データアナリストの仕事内容が模倣されたストーリーが展開されていて、読んでて楽しい。
この本では解決するべき問題に応じて解析ツールを使い分けることと、そのツールの一端を紹介している。ツールは多岐にわたる。
  • 実験計画法
  • 最適化
  • 適切な視覚化
  • 仮説検定
    • 現実の世界の事象の「要因」はネットワーク上に複雑に絡み合っているということを忘れてはいけない。また、その要因の絡まりを書き下して整理することで、見えてくるものもあることを忘れてはいけない。
    • 複数の仮説のどれが正しいのかを検証するときは、「反証(立証されない仮説を取り除く)」によって行わないといけない。
      • 最も適当だと思われる仮説を選ぶと、「満足化」してしまう。
  • ベイズの定理
    • 事後確率の概念は大事だ。
  • 主観確率
    • 主観の言葉(必ず、おそらく、ほぼ・・・など)を数値の確率で表わすことで、事実が見え課題解決の突破口が見えてくるストーリーは面白かった。また、数値の確率で表わすことで、ベイズの定理を応用できるようになる。
  • ヒューリスティック分析
    • 必ずしも課題解決のために必要なデータはそろわない。ならば、手に入れられるデータから(最適解である保障はないものの・・・)最善の結論を得ないといけない。
    • 「高速で倹約的なロジックツリー」を描いて問題を整理する手法は、「なるほど」と関心したし実践していきたい。
    • 問題の最適解を保証できないことは、計算アルゴリズムでもあって、保証はできないけれど経験的に最適解を得られるアルゴリズムを「ヒューリスティックアルゴリズム」という。
  • その他、統計に関する全般のトピック
  • RやExcelの分析機能
次は、「HeadFirst Statistics」を読む。


0 件のコメント:

コメントを投稿