php

Macでphp_mecabを使えるようにした

だけなのに、2回もクリーンインストールしたっていうね... いろいろ試したけど、 結局、こちらを参考にMacportsで全部入れた。 Ubuntuなら30分で終わる作業だよ、これ。 php_mecabを使えるようにする 上でpearを入れたので、pear経由でphp_mecab0.4.1を入…

日本語の文章を形態素解析するときのノイズ処理

をする必要があるんだけど、 半角記号 1、2文字のひらがな とくにやっかいな上記2つの処理方法はphpでは // 半角記号を除去 (!preg_match("/[[:punct:]]/", $token)) // 1,2文字のひらがなを除去 (!preg_match("/^[ぁ-んー]{1,2}$/u", $token)) という正規表…

tf-idfを用いてWEBページの特徴語を抽出する

tf-idf まぁ、やってることはこちらでやってることと何一つ変わらない。 ただ、対象テキストがWEBページってだけ。 なので内容については上記リンク先で。 http://ja.wikipedia.org/wiki/Tf-idfを引数にしてテスト テスト結果 Array ( [ノート] => 70.550270…

php_mecab0.3.0でmakeが通らない >> 解決

環境 Ubuntu 10.04 LTS PHP Version 5.3.2-1ubuntu4.2 MeCab 0.98 追記(2010/07/08) 開発者のid:rskyさんからコメントいただきました。 PHP5.3に対応したphp_mecab0.4.1がこちらで公開されています。 $cd mecab-0.4.1/ $phpize $./configure --with-mecab $l…

PHP Naive Bayesian Filterを使ったときにハマったこと

PHPでベイジアンフィルタ を使うならPHP Naive Bayesian Filterなるものがある。 使い方はこちらが非常に参考になる。 日本語を扱うときの注意 追記(2010/07/04) Connection内部だとうまくいかないときはWHEREが直接かかわってくる select,execute内部に明記…

PHPからpostgreSQL呼び出し

POD設定 PHPからDBを呼び出すのにPODなるものを使うらしい。 のだが、PHPもpostgreSQLも初めてだから全くわからない…とりあえずここでやってることを、自分の環境でもやってみたメモ php.iniの編集 PDOはphp5.1以降はデフォルトで入っているので、設定を弄っ…