読者です 読者をやめる 読者になる 読者になる

Python問題を解く

この本、積ん読にしてたんだけどその名の通り実践的で良い。写経に学びがあった

実践力を身につける Pythonの教科書

実践力を身につける Pythonの教科書

問題を日々解いて、コードを組み立てるアタマを作りたい。

言語処理100本ノック 2015

第1章をしっかり理解するところからスタート。zipやらenumerateの理解の不十分さを認識する。内包表記をちゃんと身につけたい。

回答例は以下が良かった。

他にもたくさんある

n-gramあたりからちょっと厳し目になる

書籍のたぐい

入門Python3の演習問題を解く。この書籍はなんとなく問題からスタートして読んだほうが進みやすい気がした。

入門 Python 3

入門 Python 3

オンラインラーニング

CodingBat Python

機会学習との向き合い方

つまみ食いによる全体感把握に取り組む。比較的難しい書籍をコアにして、周辺情報を仕入れるのと、Qiitaに投下された応用例の同時読解。これが効率的な勉強の仕方がよくわからないが、いちおう自分なりの工夫。いまはこれにチャレンジ

Python機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear)

Python機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear)

黄色本(パターン認識と機械学習 上)を読破したGooglerに見てもらったら、上記良い本とのことなので読み始め。作者が読み方について指南してくれているが、けっこうヘヴィ。

ブック・インサイド―『Python機械学習プログラミング』学び方ガイド | Think IT(シンクイット)

というわけで、Stanfordの講義を受け始めた。日本語のテロップも出るので良い

Machine Learning - Stanford University | Coursera

Pythonの基本については、入門Pythonが良い。いまP106で、ややこしいところはない。ムダもなく、良い

入門 Python 3

入門 Python 3

いちおう理系学部卒なので、線形代数や偏微分は理解しているつもりなんだけど、Python機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear)はすんなりいかないでござる。紙に書いて、脳に叩き込まないとムリめ。

というわけで

  • クローリングによる大量情報収集
  • supervised learningによる適切な分類
  • 自社データで適用

みたいなかんじで進められるとHappy。なんとなく総合格闘技みたいなかんじで、あちこち鍛えられるので頑張る

目標は決まったけど、どうやろうか

学ぶことは膨大なので、いくつかステップに分ける

  • Pythonの基本を学習する
    • いろいろ見たが、入門Python3
      入門 Python 3

      入門 Python 3

      がやっぱり良さげ
    • Rubyもそうだったが、オライリーの本が一番読みやすいことに気づく
  • データ分析の基礎を学ぶ
    • 「データ解析の実務プロセス入門
      データ解析の実務プロセス入門

      データ解析の実務プロセス入門

      」を読む。基本となる知見をさらりとしなければ、ただデータとって楽しいねで終わる
    • 分析地獄に陥らないことが大事。自己満にしたくない
  • Jupyter NotebookにSQL書いて、データ取ってきてグラフまで自動化する
    • 回しておくべきスクリプトはちゃんとPythonで書いておく
  • 機械学習系を学ぶ
    • ゼロから作るDeepLearning、びっくりするくらいわかりやすくて感動。一気に身近になった感があり、Qiitaでもそれ系によく目を通すように
    • Python機会学習プログラミング買ったけど、手強そう
  • 自然言語処理を学ぶ
    • Word2Vecを使って、類似度判定や類語リストアップをしておきたい
    • 競合調査をしてみよう

ゴール:KPIモニタリングシステムの構築

Jupyterを社内共有するモニタリングシステム、ちゃんとやればうまくできそうな印象なので、MySQL・BigQueryから引っ張ってきて構築する。Kintone(いずれSalesForce)からも引っ張っていきたい。

Pythonやり始めたから読み始めたけど、すごくわかりやすい。

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

自然言語処理のところ理解しておかないと、サービス運営で支障をきたすのでそこも勉強する。

しかしPython勢いすごいな。Rubyをあっというまに突き放しそう。

ちゃんと読むべきネット文献を上げてみる

Pythonでデータ分析やる

師匠に相談したらRubyでなくPythonをすすめられ、pandasの可能性について熱く語られたので、この本を買って読み始めることにした。

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理

ドットインストールもPython3を2/3見終わる。Rubyに似ているから理解しやすい。

開発環境の導入に大変手間取ってしまったのが、今週。Jupyter Notebookはメモ帳みたいなものだからローカルにそのまま入れてしまってよかったけど、社内ubuntuに入れようとしてハマった。

これでデータをゴリゴリいじることができるようになる。楽しみだ