メモ

日本語の文章を形態素解析するときのノイズ処理

をする必要があるんだけど、 半角記号 1、2文字のひらがな とくにやっかいな上記2つの処理方法はphpでは // 半角記号を除去 (!preg_match("/[[:punct:]]/", $token)) // 1,2文字のひらがなを除去 (!preg_match("/^[ぁ-んー]{1,2}$/u", $token)) という正規表…

mysqlでcsvファイルの読み込み

phpmyadminだと、インポート可能なファイルサイズは最長: 2,048KiBという制限があるので、 それ以上のファイルをインポートするには端末からmysqlコマンドでインポートする。 大体のcsvファイルに該当しそうなコマンドは以下 mysql> load data local infile …

php_mecab0.3.0でmakeが通らない >> 解決

環境 Ubuntu 10.04 LTS PHP Version 5.3.2-1ubuntu4.2 MeCab 0.98 追記(2010/07/08) 開発者のid:rskyさんからコメントいただきました。 PHP5.3に対応したphp_mecab0.4.1がこちらで公開されています。 $cd mecab-0.4.1/ $phpize $./configure --with-mecab $l…

PHP Naive Bayesian Filterを使ったときにハマったこと

PHPでベイジアンフィルタ を使うならPHP Naive Bayesian Filterなるものがある。 使い方はこちらが非常に参考になる。 日本語を扱うときの注意 追記(2010/07/04) Connection内部だとうまくいかないときはWHEREが直接かかわってくる select,execute内部に明記…

document.element.styleで着飾る

DOMでstyle属性まで弄れるんだ。 あずにゃん可愛いよ、あずにゃん!間違えた。js可愛いよ、js! javascript:var l=document.getElementById('header').style.backgroundImage='url(http://gyazo.com/82e5a40d5252fb0864464a192bef33b0.png)'; ハマったところ…

PHPからpostgreSQL呼び出し

POD設定 PHPからDBを呼び出すのにPODなるものを使うらしい。 のだが、PHPもpostgreSQLも初めてだから全くわからない…とりあえずここでやってることを、自分の環境でもやってみたメモ php.iniの編集 PDOはphp5.1以降はデフォルトで入っているので、設定を弄っ…

Ubuntuにgyazoを導入

便利な便利なgyazoを入れよう! winでお世話になっているgyazoをubuntuに入れたのでメモメモ。 スクリプトが公開されているので、とっても簡単にできたよ。 自分のようなubuntu初心者向けです。 まずは - スクリプトをDL Gyazoへようこそ : スクリーンショッ…