【書評】データサイエンティスト養成読本




Share on FacebookTweet about this on TwitterShare on Google+Share on LinkedInEmail this to someone

初版の発売は2013年と3年前ですが、多分データサイエンス分野の最初の一冊として重宝できそう(されてそう)なので書いときます。

僕が「統計をもっとWeb解析に取り入れなれないか?」と思い始めたのが2007年くらい。当時、多変量解析やテキストマイニングをメインにSPSSと併せてRに触れ始めました。

その時はGUIツールを使っていたのが、ここ最近になってから「キチンとR Studio使えるようになりたいなぁ」と思ったのと、プログラマじゃないけどPythonくらいは理解しときたいというのがあって書籍を物色していた時、この本に遭遇。チラ見して即買い。

内容も、思いの外ごりごりプログラミングさせるものでもなくマーケティング要素も高め。データサイエンティストの基本スキルセット紹介からRやPython、決定木やk-meansといった統計的な話、mixiにおけるデータマイニング手法などが展開されています。その辺りは「データサイエンス」をうたっているだけあるのでしょうか。書ける・分析できるようになる、と言うよりは、広く概念を学ぶと言った方が近い気がします。

実際にR Studioが使えるようになったか?と言われると、本書でサラッと触れた後、オンライン学習でハンズオン的に手を動かして覚えたようなものなので、しっかり学びたいのなら別のコンテンツも併用するのがよいかと思います。

難易度は、全くプログラミングや統計知識がゼロだと厳しいかもしれませんが、「現状のマーケティング活動に対し、新たな知見や予測を得たい」と思う方ならピッタリな内容じゃないでしょうか。

データマイニングや機械学習を用いたマーケティングは、実際は裏側のロジックよりもそこで得た予測から行動パターンを増やす事が大事なところもあります。この手の書籍で分析手法を理解した上で、その手法を用いるツールで行動して見るのも良いかと思います。

個人的にちょっと気になるは、月刊誌的な装丁とか紙質が、もう少し保存版的だったらよかったなぁ…といったところぐらいでしょうか。まぁボロボロになるかもしれないけど、何度か読み直しつつ、データサイエンスをしっかり自分のものにしていくのに十分な内容じゃないかと思います。

データサイエンティスト養成読本

Share on FacebookTweet about this on TwitterShare on Google+Share on LinkedInEmail this to someone