Python言語によるビジネスアナリティクス

「Python言語によるビジネスアナリティクス-実務家のための最適化,統計分析,機械学習」(近代科学社)  Amazonで購入

著者

久保幹雄,小林和博,斉藤努,並木誠,橋本英樹

目次 

 練習問題 (Jupyter Notebook): github , Anaconda Cloud

序文  pptx
第1章 なぜ今Python か? pptx video
第2章 環境を整備しよう– Docker とAnaconda –
第3章 対話型シェルIPython とJypyter (IPython Notebook)
第4章 数値計算モジュールNumPy pptx 
第5章 可視化モジュール matplotlib,seaborn, bokeh pptx
第6章 科学技術計算モジュールSciPy pptx
第7章 データ解析モジュール pandas, blaze, dask pptx 
第8章 統計モジュールstatsmodels pptx
第9章 機械学習モジュールscikit-learn pptx(for lecture) pptx
第10章 最適化
第11章 数理最適化モジュールPuLP とOpenOpt pptx video
第12章 ネットワークモジュールNetworkX pptx video
第13章 制約最適化モジュールSCOP  pptx  video 追加問題集
第14章 スケジューリング最適化モジュールOptSeq pptx video 追加問題集
第15章 動的最適化
第16章 Excel連携モジュールxlwings
付録A Python の基礎と標準モジュール pptx

  • Python 3 Part 1 video イントロ
  • Python 3 Part 2 video 型と文字列
  • Python 3 Part 3 video リストとタプル
  • Python 3 Part 4 video 辞書と集合
  • Python 3 Part 5 video 演算子
  • Python 3 Part 6 video 関数
  • Python 3 Part 7 video 内包表記
  • Python 3 Part 8 video クラスと継承
  • Python 3 Part 9 video モジュール

付録B 機械学習 pptx
付録C 計算量とデータ構造

関連リンク

  • Docker ToolBox : 本書の開発環境を再現するためにDockerイメージを準備しました.Docker ToolBoxをインストールした後で,本書に記述されたDockerイメージとパスワードを用いると,本書で用いたプログラム(xlwingsを除く)を含んだJupyter Notebookを使うことができます.
  • Jupyter notebook ファイル : bookpy.zip 。Dockerイメージに収録されているファイルです.パスワードは本書に記述されたDockerイメージ用のものと同じです.こちらのファイルは,本書に記述されている稼働環境(バージョン)と同じでないと,動作しない場合がありますので,ご注意ください.
  • Anaconda : Jupyter/Pythonを含んだ統合環境 Anacondaを用いて環境を自分で整えることもできます.OpenOptのインストールについては,こちらを参照してください.
  • Amazon.co.jpから購入

 誤植など(数式はLaTeX表記)

  1. p.34 12行目から18行目:a4 = [[[0]] [[1]] [[2]] [[3]]] ndim: 3 shape: (4, 1, 1) size: 4
  2. p.37 1行目: full(shpae, ⇒ full(shape,
  3. p.48 3行目:xの成分は-(m-1)以上(m-1)以下、yの成分は-(n-1)以上(n-1)以下             => xの成分は-m以上(m-1)以下、yの成分は-n以上(n-1)以下
  4. p.52 コード4.29 12行目: 10000 ⇒ 1000
  5. p.60 表4.8 3行目,p.61 下から4行目:revel => ravel
  6. p.80 3,5行目,コード5.23タイトル内, p.82 4行目, p.83 1行目, p. 485 索引内 FaceGrid => FacetGrid
  7. コード5.29 のキャプション:irisデータの読み込み => irisデータの描画
  8. p.114 コード6.20 5行目:elif x<113: ⇒ else:
  9. p.116 対数正規分布の説明の6行目の後に,「SciPyの公式マニュアルでは記述が不完全だが,$\mu$ は引数scaleに $e^{\mu}$ で,$\sigma$ は引数s(第1引数)で入れる.」を追記.
  10. p.160:cacdat => concat(2箇所)
  11. p.170 6行目:組みごと =>組ごと
  12. p.194 下から6行目:汎用的に => 汎用的な
  13. p.207 コード9.2 4行目および本文5行目: LinearSVC ⇒ SVC
  14. p.207 コード9.3 3行目:np.c_[xx.ravel, yy.ravel] ⇒ np.c_[xx.ravel(), yy.ravel()]
  15. p.207 コード9.3 9行目:plt.axis([xx.min, xx.max, yy.min, yy.max]) ⇒ plt.axis([xx.min(), xx.max(), yy.min(), yy.max()])
  16. p.209 コード9.5 6,7行目の間に以下を追加.x = x.reshape(-1, 1)
  17. p.212 コード9.8(つづき) 8行目:np.c_[xx.ravel, yy.ravel] ⇒ np.c_[xx.ravel(), yy.ravel()]
  18. p.212 コード9.8(つづき) 18,19行目:plt.xlim(xx.min, xx.max) ⇒ plt.xlim(xx.min(), xx.max()) plt.ylim(yy.min, yy.max) ⇒ plt.ylim(yy.min(), yy.max())
  19. p.215 3行目からのアルゴリズム(1) Step 1 => Step 2, Step 2 => Step 3 (2) Step 0: 各点 xi(i = 1,2,…,n) ・・(中略)・・ を計算する. => Step 0: 各点 xi(i=1,2,…,n) をランダムに Cj(j=1,2,…,k) に割り当てる. Step 1: 各クラスタ Cj の代表点(通常は算術平均) cj(j=1,2,…,k) を計算する.
  20. p.298  2行目:点リストの =>点集合の
  21. p.298 最初のプログラムの出力: リストでなく集合,つまり [ ] を{ } に直す.{0, 1, 2, 3} {‘c’, ‘b’, ‘a’}
  22. p.351 3行目:requirementはモードの実行の資源・資源タイプと必要量を表す辞書である.キーは資源名と資源タイプ(None:通常,’break’:中断中,’max’:並列作業中の最大資源量)のタプルであり,値は資源必要量を表す辞書である.この辞書のキーはタプル(開始時刻,終了時刻)であり,値は資源の使用量を表す正数値である.
  23. p.351 5行目:breakableは中断の情報を表す辞書である.辞書のキーはタプル(開始時刻,終了時刻)であり,値は中断可能時間を表す正数値である.
  24. p.351 7行目:parallelは並列作業の情報を表す辞書である.辞書のキーはタプル(開始小作業番号,終了小作業番号)であり,値は最大並列可能数を表す正数値である.
  25. p.352 下から3行目: type => tempType (p.490の索引も tempType 352 に修正; ただしtype 442は残す.)
  26. p.460 正規化 = 正則化(索引 p.494も同様)
  27. p.490 右段11行目:to_picklel => to_pickle