読者です 読者をやめる 読者になる 読者になる

データ・サイエンティストは可視化の夢を見るか?

Does Data Scientist Dream of Visualization?

思わしくないスタート

さて、恩師が読んでいた洋書からスタートしてみたデータ・サイエンスの再勉強、どうも思わしくない進捗です。いま第8章まで進んで、ようやく「機械学習」の項に入ったのですが、そこまでは NumPy だの pandas だのの基本的な使い方(データ操作)ばかりで通りいっぺんの説明でした。随分と雑駁な感じがします。まあ Python が初めてのプログラミング言語、といった読者層も居ることでしょうから、致し方ない展開なのでしょう。

 

第8章に入って、教師付き学習と教師なし学習に大きく二分されたところから、主成分分析やサポート・ヴェクター・マシーン、K 最近傍法といったそれぞれの手法の説明に入ってます。紙幅の関係もあるのかちょっと軽いタッチですね。

 

(追記:そのあと、とりあえずすべての残りページも眺めてみましたが、此の本は各種統計手法(機械学習)について踏み込むより、例題を通じて『概観』を掴ませようとするガイド・マップのような存在であることが理解できました。巻末付録の資料サイト一覧は(特に英語圏のデータを分析する際には)かなり便利なリファレンスになっているようです。)

 

 

Jupyter をセット・アップしたので notebook 上に Markdown でメモを取りながら例題を実行しています。Excel にグラフを転記したりするより、その場で実行結果を変化させたりできるので便利です。でも、cell をまたいだ矢印などの注釈も自由にできると、さらに便利だなあ、こういった web アプリとドロー系ツールの連携も比較的簡単に実装できそうな気がするけれど……ちょっと、そっち方面を勉強しないとイケないですよね。

 

 

データ・サイエンスというか Python での機械学習は以前に、こんな類書を買っています。途中までやってみたんですが、某ラボに復帰してしばらく忙殺されていたので、手が止まっていました。

Python Machine Learning

Python Machine Learning

 

 

何故か、Packt Publishing の入門書にはお気に入りのものが多く、これもそのひとつです。こっちのほうが文法などの説明は「てきとー」で、最初から Machine Learning のトピックをひとつひとつ例題をもとに、数式たっぷりで説明していく構成になっているので、ある程度プログラミング言語や統計分析の基礎知識のある方にはオススメかも知れません。

前掲書はあと数日で大体さらってしまえるようですから、そのあと此の本をやり直します。

 

 

あと、今晩は小用があって出掛けたのですが、その往路、電車に揺られて先日取り寄せた大冊をパラパラと眺めました。

統計的学習の基礎 ―データマイニング・推論・予測―

統計的学習の基礎 ―データマイニング・推論・予測―

  • 作者: Trevor Hastie,Robert Tibshirani,Jerome Friedman,杉山将,井手剛,神嶌敏弘,栗田多喜夫,前田英作,井尻善久,岩田具治,金森敬文,兼村厚範,烏山昌幸,河原吉伸,木村昭悟,小西嘉典,酒井智弥,鈴木大慈,竹内一郎,玉木徹,出口大輔,冨岡亮太,波部斉,前田新一,持橋大地,山田誠
  • 出版社/メーカー: 共立出版
  • 発売日: 2014/06/25
  • メディア: 単行本
  • この商品を含むブログ (3件) を見る
 

 

これ、本体価格 ¥14,000- と高額ですし、原書の PDF は著者が無料で公開していますが、まだ統計科学の専門用語に英語で慣れていない場合は、なかなか良い教科書である気がします。プログラミングの仕方やツールの使い方は別途学ぶ、ということですが、その基盤にある基礎理論を学習するには打ってつけの本のようです。なにぶん 900 ページ弱の大冊ですが、図版はカラーが多く、多くの訳者たちの苦労が忍ばれる出来です。私程度のレヴェルだと、あまり深い理解はできないかも知れませんが、それでもこれからデータ・サイエンスの独習をしていくにあたって、ぜひとも座右の書として傍に置いておきたい一冊。まあ昨今の出版状況でこういう本はあまり売れず、近いうちに絶版になりかねないので余裕のある方々はいまのうちに購入しておくことをオススメしておきます(とかいって 4 刷にはなってます)。

 

 

高校時代、大恩ある老数学教師に教わったのが「参考書を買うときは同じ分野について数冊買いなさい。そして読み比べながら勉強すると good ですよ」という助言です。あまり積ん読本が増えるのもアタマが痛いところですが、古典や良書を買い求めて、それらを比較しながら独学していくっていうのは、基本的な学習法のひとつだと考えています。