2008年11月04日 [PC][Web] いわゆる「2chスレ紹介ブログ」の自動化は可能か
_ [PC][Web] いわゆる「2chスレ紹介ブログ」の自動化は可能か
今更かと突っ込まれることを覚悟で。
「2chスレ紹介ブログ」へは賛否両論(一部が白熱しているだけ?)あるみたいですが、『Web2.0(笑)』で自動化すればみんなハッピー(ただしアフィリエイト系涙目)になれるんじゃないかと思いました。
以下、思いつき。
感情ベクトル
レス数・レス速度だけで判別するのは不適切だと思うので、感情を加味します。XYZの3次元ベクトルを用意して、「どれくらい(それなりに)」「どんなふうな(笑える)」スレッドか、というのを判定します。単に各感情ごとの大きさを見るだけなので、3次元とか5次元とかベクトルとか、そんなの持ち出さなくていい気がするけど…
判定方法
- 「この単語が含まれているレスは『面白い』確率が○%ある」みたいな感じで判定。ベイジアンが使えそう。
- 判定結果から「スレッドの得点」を出す。一定以上なら紹介することにする。
- ベイジアンで「『面白い』確率が○%以上のレス」を抽出したりして、そのスレッドの紹介完成。
欠点
「その単語が面白い確率」のデータを与えてやらないといけないのと、時代の流れ(?)や精度向上のために随時データを更新しないといけないのが欠点。結局、完全自動化とはいかない。
ここらへんをユーザ参加型にして集合知を活用すると『Web2.0(笑)』サービスのできあがり。
というわけで
すが、ベイジアンの実装がワケワカラン。原理はともかく、どうやって過去の状況を数値化して、それを確率として出すんだろう? 勉強不足です。
「『ごはん』という単語は、面白いときが9回、そうでないときが1回だったから、面白い確率90%」とかでいいの? >えらいひと