自分マイニング
SUFARY は Cygwin 上でもさくっとコンパイルとおった.
日記を CSV でエクスポートして語句を抽出してまとめてみる(昨年の6月アタマから下のエントリまで).
sang -t 50 -n 14 stereocat.csv | sort -nr | sed -e "/.*[<>].*/d"
最後の sed フィルタは html タグを避けるってだけ(いいかげん).
順位 | 出現回数 | フレーズ |
---|---|---|
1 | 129 | とりあえず |
2 | 80 | セキュリティ |
3 | 74 | プログラム |
4 | 72 | ということで |
5 | 62 | るんだけど |
5 | 62 | たんだけど |
7 | 60 | インストール |
7 | 60 | でしょうか |
9 | 52 | スラッシュドット |
とりあえずセキュリティということで,インストールしてたんだけど, このプログラムでしょうか.
セキュリティの話ってそんなにしてるつもりはないんだけど……関連のメモとかが多いからかな.