たなブログ 人生リア充化を目指すブログ(`・ω・´)

【厳選6冊】pythonでデータ分析をしたい方にオススメの本を紹介【初心者から上級者まで】

Pythonを学ぶ 自分の可能性を広げる

エンジニアさん「pythonを使ってデータ分析の力をレベルアップさせたいんだけど、何かおすすめの良い本ないかな~」


今回はそんな悩みにお答えします。

最近では、データサイエンティストやAIエンジニアに興味を持ち、pythonの学習を始めた方も多いのではないでしょうか?今回は「これからpythonを使ったデータ分析を出来るようにしていきたい!」という方向けにオススメの本を「6冊厳選 」して紹介していきます。

本記事の内容

  • データ分析の全体像
  • データ分析に関するおすすめ本
  • データ分析力を高める方法

まず目線を合わせます

本記事では「ある程度pythonは使える」「更なるレベルアップを目指したい」という方を対象にしています。そのため、python初学者の方はまず【完全ガイド】pythonの学習サイトをレベル別に紹介!【基礎から機械学習・人工知能までのロードマップ】を参考にしてください。

また、データ分析と言いつつAIエンジニアに興味がある方も見かけます。データサイエンスやAI(人工知能)との違いは意外とわかりにくいんですよね。もしAIエンジニア系に興味があるなら【厳選10冊】AIエンジニアを目指したい方にオススメの本を紹介【目的に応じて勉強しよう】がおすすめです。

これで目線は合ったかと思います。おすすめのデータ分析本、紹介していきます。

データ分析にオススメの本「6冊」を紹介


データ分析と言っても、学ぶことが多く迷子になりがちです。
そこで最初に全体像を把握し、その上で自分に合う一冊を見つけていきましょう。

「データ分析」の全体像

まずデータ分析の全体像を確認しておきます。すでにpythonのデータ分析を熟知している方は読み飛ばして頂いて構いません。

全体像を把握する目的は「学習の迷子防止」です。僕も経験ありますが、色々興味があると多くの本を読みあさりがち。すると「今何やってるんだっけ?」という状態になってしまいます。

せっかくのやる気と時間を分散させないためにも、全体像を知り、効率的に学んでいきましょう。pythonを使ったデータ分析の全体像をざっくり表してみました。

「pythonデータ分析」を学習する前に知っておきたい全体イメージ

色々書いてありますが、まずは「赤枠」の部分をおさえてください。

  • 【論点①】ライブラリの学習:データ分析で使うツールを学ぶ
  • 【論点②】機械学習の各論点:モデルの構築や予測方法を学ぶ

この2つです。

ライブラリを学んだ後に機械学習に進む

データ分析と聞くと「機械学習」を思い浮かべる方も多いかと思いますが、いきなり機械学習に手を出すとケガします。理由は機械学習の学習内容は広く、データ分析のライブラリが駆使できて当然の上で成り立っているからです。

「機械学習の本を買ってみたけど、numpyってなに?」みたいな方は、論点①のライブラリの学習からじっくり学習されることをおすすめします。なので、まずは基本を学んだ上で機械学習に進むという点を意識しておきましょう。

pythonデータ分析のおすすめ本【6選】

全体像を踏まえた上でオススメ本を6冊紹介していきます。それぞれ、全体像でいうところの「論点①」と「論点②」のどちらに主眼を置いているかにも触れていきますね。

pythonによるデータ分析入門

1冊目は「pythonによるデータ分析入門」です。

特徴はこんな感じ。

  • 論点①(データ分析用ライブラリ)に主観を置いた本
  • numpyやpandasといったデータ分析の基本を学べる
  • データ可視化に必須のmatplotlibを学べる

numpyやpandasはデータ分析における基本中の基本となる論点です。ここをしっかり理解して使えるようにしておくと、その先の学習がかなり楽になります。なので、pythonを使って初めてデータ分析をする方が最初に取る本としておすすめです。


辞書代わりにも使える本です。わからない時に繰り返し見返すことで、データ分析の基礎力アップにもつながります。

pythonではじめる機械学習

2冊目は「pythonではじめる機械学習」という本。

こちらも特徴まとめてみます。

  • 論点②(機械学習の主要論点)に主観を置いた本
  • 機械学習ライブラリ(scikit-learn)を学べる
  • モデルの構築や予測といった基礎的な流れを学べる

先ほどの本と異なり、論点②にフォーカスしている本となります。

pandasやnumpyといったライブラリの知識を前提として機械学習の内容に触れているので、1冊目を読み終えた方が2冊目に取る本としてもおすすめです。

機械学習では専用のライブラリを使うことが一般的なのですが、それが「scikit-learn」と言われるもの。本書で紹介されているコードを写経する(マネして書き写す)ことで、モデルの構築から予測といった機械学習の流れをしっかりと理解出来ます。

機械学習の基本について学習していきたい方、必見です。

データサイエンスハンドブック

3冊目は「データサイエンスハンドブック」という本です。

この本の特徴はこんな感じ。

  • 論点①(データ分析用ライブラリ)が中心。論点②(機械学習)にも触れる本
  • データ分析で必要なライブラリを網羅的に学べる
  • データ分析から機械学習までの一連の流れを学べる

1冊目と2冊目の本をあわせたような本です。良書ではあるので、余裕のある方は復習用として学習されてみてもいいかと思います。

機械学習についても触れていますが、機械学習の論点すべてを網羅しているといった感じではありません。より深く勉強されたい方は、最後に紹介する6冊目の本をチェックしてみてください。

実践データ分析100本ノック

4冊目のおすすめ本は「実践データ分析100本ノック」。

  • 論点①(ライブラリ)と論点②(機械学習)をアウトプット形式で扱っている本
  • 今まで学習した内容の総復習として活用できる
  • データ分析の現場の入り口を知ることができる

これがこの本の特徴です。

「100本ノック」という言葉からも想像出来るように、実際のビジネス現場を想定した100の例題が用意されています。ビジネス現場とはいえ、初心者の方にもわかりやすく書かれている本です。

文系出身でデータサイエンティストを目指している方やデータ分析のアウトプット力を高めたい方にはおすすめです。


ちなみに同じ「100本ノック」シリーズも登場しています。この本がタメになった方や余裕のある方には以下の本もおすすめです。

Kaggleで勝つデータ分析の技術

徐々にレベルが上がってきます。

5冊目に紹介するのは「Kaggleで勝つデータ分析の技術」という本。

Kaggleというのは有名なデータ分析コンペです。Kaggleはデータ分析の力を磨くための実践的な方法と言えますが、「Kaggleで精度の高いモデルを構築したい」「コンペで上位を取るための考え方を身に付けたい」という方には最適な一冊です。

  • 論点②(機械学習)の実践とも言えるKaggle専用の本
  • 精度の高いモデルの構築方法を学べる
  • スコアの高い予測数値を出すための方法を学べる

こんな一冊になります。

実践向けの少し特殊な部類にはなりますが、データ分析力をあげるためにKaggleトライは大ありです。これから始めてみたいという方もぜひ。

達人データサイエンティストによる理論と実践

最後に紹介するのは「機械学習プログラミング~達人データサイエンティストによる理論と実践」です。

もうタイトルからして凄そうですが、機械学習の決定版と言っても過言ではない一冊です。僕が買った頃は第2版でしたが、今は第3版も出ているので買うなら最新版が良いでしょう。

  • 論点②(機械学習)の基礎から応用まで学べる本
  • 機械学習に関する数式や理論についても学べる
  • 機械学習やアルゴリズムを極めたい方向けの決定版

特徴をまとめるとこんな感じでしょう。

これまで紹介した本は「わかりやすさ」を優先する傾向にあったので、数式や理論的な背景については割愛されていることが多いです。ですがこの本はタイトルからわかるように、機械学習に関する理論部分を数式を含めてガッツリ説明しているのが特徴的です。

なので、初学者の方がいきなり背伸びして読むとおそらく挫折します。

ある程度データ分析の基本が身についた段階で、少しずつ読み進めるようにするのが得策です。これ一冊を理解できれば、かなり凄腕のデータサイエンティストに近づくこと間違いなしです。辞書代わりにも使えるので、基本論点を他の本で学び、その理論や背景をこの本で補完するという使い方も出来ます。

まとめ:データ分析の全体像を把握した上で、自分に合った一冊を見つけよう


本記事をまとめます。

  • データ分析には大きく分けて2つの論点がある
  • 1つめの論点:データ分析の基本となるライブラリの学習
  • 2つめの論点:機械学習に関するモデル構築や予測に関する学習
  • 今のレベルを確認しながら最適な一冊を見つけよう

こんな感じですね。

「データ分析」という言葉以上にpythonで学ぶべきことは多岐に渡ります。それでも焦らず、一つずつ学びを深めるキッカケにしていただければと思います。

ある程度データ分析についての知見を高めたら、副業としてリモート案件を獲得していくのもおすすめです。収入を得ながら、仕事で多くのデータ分析経験を養えるからです。これは【フリーエンジニア向け】在宅やリモート案件を獲得し続ける方法を紹介【3ステップで仕組みを構築する】という記事で紹介しているのであわせて読んでみてください。

良いデータ分析ライフを。