Diary Blog of Dary

temtanが書いた文章

はてブ新着のアルゴリズムが誰に対してアカンのかの説明

日系パワハラのスパム行為の根拠とか、他いくつか - Diary of Dary

この記事のコメントで kyoumoe さんが質問をしてくださいました。

はてなアルゴリズムのどこが誰に対してアカンのか頭の良い小学生以下の私に教えてください!

この質問は先の記事の最後の部分に関する質問だと思いました。

何が問題って、ユーザ数が 4 年前に 100 万人突破したサービスが未だに短時間の間に 3 人がブクマしたら新着とかいうちょっと頭の良い小学生でも「アカンやろ」と思うアルゴリズムを 2013 年にもなって使い続けてる京都の会社のセンスが一番問題だと思っています(本気)。

この話は具体的なので一般化して話すと「第三者から簡単にコントロールできるようなアルゴリズムでは駄目」という事です。コレについて何故駄目なのかを順を追って説明します。ちなみに「ちょっと頭の良い小学生」というのは誰かを罵倒する目的でした誇張表現ですし、読んでいる人の殆どが本気にすると思っていませんでしたのでそこを論点にされると困ります。

まずは、はてブの新着エントリーとは何か?

http://b.hatena.ne.jp/help/feature

上記ページでははてなはてなブックマークの特徴を説明しています。はてながこういった特徴があるとアピールしている以上、はてなブックマークユーザが上記の件や、上記の件から想定できる件を期待するのは自然だと思います。

それで以下の点に注目してみます。

このページは是非他の人にも見て欲しい、そう思ったページはどんどんブックマークしましょう。いっしょに感想や要約をコメントしておけば、必ず誰かの目に触れるはずです。

ユーザの使い方の想定とも言えますがが、はてブの主な使い方の一つとして「人に勧めたい記事をブックマークする」という点を挙げています。

人気エントリーや新着エントリーをチェックすれば、みんなが読んでいる情報、旬な情報がすぐに手に入ります。話題のあの情報、もう見逃しません。

そして、この文章では人気エントリーや新着エントリーでは、「みんなが読んでいる情報」「旬な情報」がありますよと紹介しています。

この 2 点を組み合わせて推察も含めて考えますと、人気エントリーや新着エントリーははてブユーザ達が「人に勧めたい記事をブックマークする」をした結果集まったデータから「みんなが読んでいる情報」や「旬な情報」を抽出しているのだろうと考える事ができると思います。少なくとも、自分はそうだろうと考えてました。

ここで、仮に自分が意志で操作すればどんな記事でも新着エントリーに載せる事が出来たとしましょう。そうすると例えば「今日おしっこ100Lでたわー(震え声)」とだけ書いたしょうもない記事であっても新着エントリーに載せる事が出来る訳です。それでこの記事を新着エントリーに載せた場合、「みんなが読んでいる情報」でも「旬な情報」でも無いワケでそれは新着エントリーに「みんなが読んでいる情報」か「旬な情報」を期待していたユーザの期待を裏切る事になりますね。

それで、はてブが「短時間の間に 3 人がブクマしたら新着」というアルゴリズム(だと想像される)なのですが、これではアカウントを 3 つ作ってちょいと操作すれば新着エントリーに載せる事が出来る状態でして、第三者が「みんなが読んでいる情報」でも「旬な情報」でもない記事を新着エントリーに載せる事が出来るワケで(それで実際にやっている連中が沢山いる)、それはさっきのおしっこの記事の話と同様にユーザの期待を裏切るワケですよ。この理屈から一般化して言うと「第三者から簡単にコントロールできるようなアルゴリズム」だと結局はユーザの期待を裏切るということなので、どこの誰に対してアカンかというと新着エントリーに「みんなが読んでいる情報」か「旬な情報」を期待しているユーザです。
ちなみにアルゴリズムを改善する以外にも対策は沢山あるかもしれません(実際に事後対策なら結構やってるっぽい)が、ユーザ数がサービス開始時より桁違いに増えているのにも関わらずその部分がサービス開始から変わってないというのはちょっとどうかなーと思いますし、IT 技術を売りにしている営利企業なのだったらアルゴリズムの改善という技術的解決を期待したいところですね。

追伸

人のブログで(ネタ臭いとはいえ)質問形式でコメントしておいて、見ませんって言うのはちょっとどうなんでしょうか…。といいつつも id:kyoumoe さんは見てしまうんですよね。知ってる知ってる。