こちらやっぱりののヲタのページです
id:inabaatsukoさん経由して、ひたちなか運動公園のいばらぎさんが作った「娘。の名前を数えるアプリ」を試してみました。
早速私の日記を全部張り込んでカウントすると、ほっほー、プログラムって正直ですね。
順位:
- 辻希美 95
- 後藤真希 36
- 松浦亜弥 33
- 安倍なつみ 25
- 加護亜依 23
- 矢口真里 17
- 田中れいな 15
- 亀井絵里 14
- 石川梨華 13
- 藤本美貴 12
- 飯田圭織 12
- 吉澤ひとみ 8
- 紺野あさ美 7
(以下略)
分析
もちろんののたんトップ。2位より三倍ほど多い。ごっちんとあややは意外に多いね。最近娘。関連の日記はハロモニ。中心なので、あまり番組で見えないごっちんとあややはこんな数があることに正直びっくり。
なっちは4位なのは、多分ハロモニ。司会のため(笑)。
5位以下の順番は相当に納得できる。もしかしたらこのソフトは自分さえわからない2推し以下の順番を探してくれるかも。
問題点
私はイメージ式のAAを多用しているため、これらは検出できない。(もちろん、このソフトはキーワードを設定自由なんですから、設定すればいい。今度AAなどを設定してまたカウントします。)「W」の数も数えさせたいけど、Wだとすごく誤爆されやすいキーワードだと思います。より正確なWの検出方法について、またじっくり考えないと・・・。
結論
すばらしいソフトですね。最高。マネソフトを書きたい位に。補足
はてなユーザへの建議。検出用のテキストはCSVファイルより、最近提供するようになった「エクスポート」機能で出力したxmlデータはより正確。
CSVファイルには日記データはHTML・テキスト二種類保存されているので、カウント結果は倍になる。
一方、xmlデータはコメントを含まないので、コメントも検出したいときは向きません。
いまのところ、両立できる方法がない模様です。もっといい方法がご存知だったら、ぜひ教えてください。