自分マイニング

SUFARY は Cygwin 上でもさくっとコンパイルとおった.

日記を CSV でエクスポートして語句を抽出してまとめてみる(昨年の6月アタマから下のエントリまで).

 sang -t 50 -n 14 stereocat.csv | sort -nr | sed -e "/.*[<>].*/d"

最後の sed フィルタは html タグを避けるってだけ(いいかげん).

順位出現回数フレーズ
1129とりあえず
2 80セキュリティ
3 74プログラム
4 72ということで
5 62るんだけど
5 62たんだけど
7 60インストール
7 60でしょうか
9 52スラッシュドット
"はははははははは" とかは重複カウントが多そうなのでカット. 典型的な文を作るとこんなもんか?

とりあえずセキュリティということで,インストールしてたんだけど,
このプログラムでしょうか.

セキュリティの話ってそんなにしてるつもりはないんだけど……関連のメモとかが多いからかな.