読者です 読者をやめる 読者になる 読者になる

データ・サイエンティストは可視化の夢を見るか?

Does Data Scientist Dream of Visualization?

駆け足の限界 ——ではペースを落として——

“Data Science from Scratch”、第 15 章 “Multiple Regression” 、第 16 章 “Logistic Regression” まで進みましたが、そろそろ駆け足で跳ばしてきた限界が出ています。

Data Science from Scratch

Data Science from Scratch

まあ、取り扱うデータの次元が微妙に増えて、あまり図示できないところが面白くないのでしょう、個人的に。

たとえば重回帰分析、ざっくりとは理解できるんです。当然ですよね。
そこで次の本を取り出して例題を解いていくと “AIC赤池情報量規準)” に遭遇する。重回帰分析で複数ある説明変数のうち、どれを採用するかを AIC の多寡(低い値のモデルのほうが良い)で決定しているんですよね。でも、それがなんだか天下りの知見に思えて得心できません。説明が通りいっぺんなおかげです。

Rによるデータサイエンス-データ解析の基礎から最新手法まで

Rによるデータサイエンス-データ解析の基礎から最新手法まで

類書にもあたってみましたが、ますます分からなくなるばかりです。

統計的学習の基礎 ―データマイニング・推論・予測―

統計的学習の基礎 ―データマイニング・推論・予測―

  • 作者: Trevor Hastie,Robert Tibshirani,Jerome Friedman,杉山将,井手剛,神嶌敏弘,栗田多喜夫,前田英作,井尻善久,岩田具治,金森敬文,兼村厚範,烏山昌幸,河原吉伸,木村昭悟,小西嘉典,酒井智弥,鈴木大慈,竹内一郎,玉木徹,出口大輔,冨岡亮太,波部斉,前田新一,持橋大地,山田誠
  • 出版社/メーカー: 共立出版
  • 発売日: 2014/06/25
  • メディア: 単行本
  • この商品を含むブログ (3件) を見る


こういうときはジタバタしても仕方ないので、じっくりと腰を据えて取り組みます。変にカッコつけて、嘘で誤魔化したくないので。


追記;
ネットを検索したら小島寛之先生のこんなエントリを見つけました。
d.hatena.ne.jp
成る程、これは簡単に分かる話ではないようです。折を見て、勉強を続けていきます。