Kaggleで伸び悩んだら読む!書評「データ分析のための数理モデル入門」のすすめ

私は、Kaggleのコンペでスコアが上がらなくなってきたら、他の人のカーネルを見ます。

「最適化」「微分」「ベイズ」などの言葉が出てきますが、実はなんとなくしかわかっていないことがほとんどでした。

そもそもどのような考えで特徴量を使えば良いのか、わかっていなかったりします。

一度、思考の整理したいと思ったときに出会ったのが、江崎貴裕さん著書「データ分析のための数理モデル入門」という本です。

データーサイエンス初心者、kaggleでスコアが伸び悩んだときに読むと良いかもしれません。

「データ分析のための数理モデル入門」の概要

著者:

東京大学先端科学技術研究センター

江崎貴裕

アマゾンレビュー:

5点満点中4.3という高得点

この本は、機械学習を始めデータ分析に必要な知識を網羅的に解説してくれています。本の内容のほとんどが図解で読みやすいといえます。

たとえば、以下のような内容です(ほんの一部です)。

  1. 線型モデル
  2. 微分方程式モデル
  3. 確率論
  4. マルコフ課程
  5. 待ち行列理論
  6. 正規分布
  7. 時系列モデル
  8. 分類問題
  9. 回帰問題
  10. ニューラルネットワーク
  11. 次元削除
  12. ディープラーニング
  13. 強化学習
  14. モデルの最適化

「データ分析のための数理モデル入門」を選んだ理由

私が「データ分析のための数理モデル入門」を選んだ理由は、ざっくり以下の通りです。

  1. Kaggleで得点が伸び悩んだ
  2. 「最適化」「微分」「そもそもなんで行列が出てくるの?」わかっているようでわかっていないところを整理したい
  3. Twitterで評判だった

どんな人にオススメ?

本の内容は大変わかりやすく、網羅的にかいてある印象です。

こんな人にオススメです

  1. kaggleでスコアが伸びや悩んだときに読む
  2. データーサイエンス初心者でどこから手をつけたら良いかわからない
  3. AIを学べるプログラミングスクールにいく前に前知識として学習しておきたい

AI系のスクールについては、以下の通り。

合わせて読みたい!

機械学習は、プログラミング経験があればすぐにできるだろう?と思ったことはないだろうか?残念ながらAIに関しては、プログラミング言語を一つ取得することと全く別でした。では、どのように習得すればよいかと考えたときに、ひとつの解決策がAIジョブカレに通うことです。

感想

本を読んだ感想を網羅します。

  • わかりやすい!
    • 図解がたくさんあってわかりやすい
    • 一般事例を使ってわかりやすく解説している
    • 大事なところは黄色い線で補足している
    • 微分の意味がアヤフヤだったが、「変化量」というキーワードで納得
  • 機械学習のロジックは、概要がわかる程度
    • ロジックについて深掘りしたいときは、機械学習専門の本を読むと良い
  • 基礎的な統計学の知識を整理できた
    • 正規分布、回帰分析など、よくわからないときに読むと整理できる
    • 正規分布、標準偏差、分散についても整理できた
  • kaggleでスコアが上がらないときに参考になった
    • 無駄な特徴量はモデルに含まない(当たり前の話しだが再確認できた)
    • 最適化問題のところがスコアアップの役に立つ
    • 本のヒントをKaggleに反映させたら、スコアアップした。
  • 最初から読む必要は無い
    • 本の構成としては、最初から読む必要は無い。知りたいところから読めば良いので時間短縮になる

まとめ

「データ分析のための数理モデル入門」は、データサイエンスの観点からオススメといえます。もし気になったら、手に取ってみてはいかがでしょうか?

スポンサーリンク
PR




PR




シェアする

  • このエントリーをはてなブックマークに追加

フォローする

スポンサーリンク
PR