自然言語処理

tf-idfを用いてWEBページの特徴語を抽出する

tf-idf まぁ、やってることはこちらでやってることと何一つ変わらない。 ただ、対象テキストがWEBページってだけ。 なので内容については上記リンク先で。 http://ja.wikipedia.org/wiki/Tf-idfを引数にしてテスト テスト結果 Array ( [ノート] => 70.550270…

Twitterでマルコフ連鎖

MeCab使うついでにPythonで書いた。 素材は自分の今までのTweet2000件。中でもおもしろかったものを↓に。 会社 ごと に し て 絵 的 に マッチ する の 人 たち 。 笑止 。 とりあえず アカウント の 活動 の は 約 12 km Time : そういや 俺 の が こんな …