機械学習入門
便利な部品が入っている道具箱みたいなイメージです。
Pythonには2つの種類のライブラリがあります。
標準ライブラリ:付属していてすぐに使えるライブラリ
外部ライブラリ:すぐには使えない「import」文が必要なライブラリ
外部ライブラリの書き方は以下のような感じです。
import ライブラリの名前 as 別名(ライブラリを呼び出し際のショートネーム)
機械学習で用いるライブラリ
pythonには機械学習に用いる事ができるライブラリが多くあります。
よく使われるライブラリをご紹介します!
① scikit-learn(サイキット・ラーン)
Pythonで機械学習を学ぶ時に最初に使い方を学ぶと言えるくらいです。
機械学習のほぼ全てのジャンルに適応できる人気のライブラリです。
② TensorFlow(テンソルフロー)
ハイレベルな機能で計算をデータフローやグラフで表すことができます。
より実践で、複雑な問題に対処できるライブラリです。
Googleが開発しmGoogleの音声検索や言語翻訳、画像検索に使用しています。
③ Keras(ケラス)
TensorFlow等の他のディープラーニングのライブラリ上で動くような作りになっています。
誰でもすぐにディープラーニングができるといえるほど簡単なライブラリで、何かを試すとかをする時に使用するといいかもです。
④ Chainer (チェイナー)
深層学習に関連する画像分類や、物体検出等のディープラーニングに用いるライブラリです。
記載方法が直感的かつシンプルなので、単純なものから複雑なディープラーニングまで幅広く対応しています。
⑤ Pandas(パンダス)
データ分析の前処理に便利な機能を提供するライブラリです。
CSVファイル、Excelファイルのデータなど扱えるデータの種類が多いです。
⑥ Matplotlib(マットプロットリブ)
グラフを描画するライブラリです。
データをグラフ化(可視化)することで、データの規則性を確認する事ができます。
⑦ NumPy(ナムパイ)
多次元配列や行列などの演算を行う数値計算ライブラリです。
NumPyは機械学習をしようと思うと、必ず必要な知識になります。
⑧ PyTorch(パイトーチ)
動的な計算グラフが特徴のライブラリです。
※動的とは入力データのサイズや次元数に合わせてニューラルネットワークの形や計算方法を変更できるという意味です。
計算速度も早く、ソースコードが見やすく扱いやすいです。
Facebook社が開発し、2016年後半に発表された比較的新しい&最近人気なライブラリになります。
まとめ
機械学習よくある流れとしては、PandasでCSVファイル、Excelファイルからデータを取ってきて、前処理を行う。
その後にNumPyの行列の形に変換して、scikit-learn、Kerasに学習させる流れです。
自分が実装したいライブラリを知るところからとなりますが、少しずつ頑張っていきたいですね!
それでは今日はここまで。
プログラミングを始めようと思った際は独学で勉強すると挫折する可能性が高いため、スクールも考えてもいいと思います!