トップ «前の日記(2008-11-03) 最新 次の日記(2008-11-09)» 編集

のろのろのろ雑記

2006|05|06|07|08|09|11|12|
2007|01|03|04|05|10|
2008|01|02|03|04|05|06|08|09|10|11|12|
2009|02|03|04|05|
2012|08|09|11|12|
2016|04|09|11|

2008-11-04 [PC][Web] いわゆる「2chスレ紹介ブログ」の自動化は可能か

_ [PC][Web] いわゆる「2chスレ紹介ブログ」の自動化は可能か

 今更かと突っ込まれることを覚悟で。

 「2chスレ紹介ブログ」へは賛否両論(一部が白熱しているだけ?)あるみたいですが、『Web2.0(笑)』で自動化すればみんなハッピー(ただしアフィリエイト系涙目)になれるんじゃないかと思いました。

 以下、思いつき。

感情ベクトル

 レス数・レス速度だけで判別するのは不適切だと思うので、感情を加味します。XYZの3次元ベクトルを用意して、「どれくらい(それなりに)」「どんなふうな(笑える)」スレッドか、というのを判定します。単に各感情ごとの大きさを見るだけなので、3次元とか5次元とかベクトルとか、そんなの持ち出さなくていい気がするけど…

081104_feelvektor.png

判定方法

  1. 「この単語が含まれているレスは『面白い』確率が○%ある」みたいな感じで判定。ベイジアンが使えそう。
  2. 判定結果から「スレッドの得点」を出す。一定以上なら紹介することにする。
  3. ベイジアンで「『面白い』確率が○%以上のレス」を抽出したりして、そのスレッドの紹介完成。

欠点

 「その単語が面白い確率」のデータを与えてやらないといけないのと、時代の流れ(?)や精度向上のために随時データを更新しないといけないのが欠点。結局、完全自動化とはいかない。

 ここらへんをユーザ参加型にして集合知を活用すると『Web2.0(笑)』サービスのできあがり。

というわけで

 すが、ベイジアンの実装がワケワカラン。原理はともかく、どうやって過去の状況を数値化して、それを確率として出すんだろう? 勉強不足です。

 「『ごはん』という単語は、面白いときが9回、そうでないときが1回だったから、面白い確率90%」とかでいいの? >えらいひと