tensorflowを使ってブログにタグを付けるプログラムを書く
私はtensorflowだけでなくpythonも初心者だ。
しかしtensorflowが気になり、これらの勉強を兼ねてtensorflowを試す。
私が適当に理解したtensorflowは
- 行列計算ができる
- エントロピーを最小化するようにモデルをトレーニングする
- 解きたい問題をモデル化(=tensorflowで扱える形式に変換すること)すれば、tensorflowに任せられる
というものだw
エントロピーはその系における秩序の度合いを意味する。
これが最大のとき、系は最も無秩序な状態である。
熱力学は自然界をエントロピー増大の原理に従うものとして扱う。
一方で、エントロピーが最小ならば系は最も秩序がある状態だ。
tensorflowは最も秩序があるようにしてモデルをトレーニングする。
とにかくtensorflowを使ってみたい。
私のブログのタグ付けをtensorflowにさせることを題材にする。
モデル化は
- ブログのタグはそのブログのタイトルと本文に含まれる名詞(一般・固有)、動詞、形容詞(以下、ワードと言う)により決定される
- 1つのブログに複数のタグをつけている場合、それらを連結した文字列を1つのタグとして扱う
- すべてのタグの数の次元を持つ列ベクトル(行列計算で変数に列ベクトルを使う私は便宜的に列ベクトルと言う)とすべてのワードの数の次元を持つ列ベクトルを扱う
- 各ブログについてタグまたはワードに対応する列ベクトルを作る
とする。
ワードの抽出に、
python で形態素解析。Janome が簡単。pip 一発でインストールを参考にして、
Janomeを使う。
参考になるサイトは本当にありがたい…
そして
python&tensorflow初心者の私が書いたプログラムを動かす。
プログラムは私が付けるタグに近いタグを付ける。
…しかし正直に言うと、結果は微妙だw
モデル化やトレーニングする方法の改良は必要だ。
2016/09/10 13:10