Diary Blog of Dary

temtanが書いた文章

はてブの API の日付指定によるフィード取得で全てを取得できるようにして欲しい

まずはFTTHさんの記事を見習って ID コール。

id:hatenabookmark

id:hatenatech


はてなアイデアにも投稿済み。

はてなアイデア

本題。

はてなブックマークフィード仕様 - クエリパラメータによるフィードの絞り込み機能

上記の仕様によると、特定ユーザのブックマーク情報の Atom フィードをクエリパラメータによって絞り込んで取得ができるようになっていますが、該当するブクマが 20 件以上ある場合でも 20 件までしか取得できないです。
絞り込まないのならページング機能を使って取得できるのですが、絞り込んだ結果にはページング機能がないので絞り込んだら 20 件しか取得できないということになっています。
なので、絞り込んだ結果を 20 件以上取得できるようにして欲しい。もっと言うと、絞り込んだ結果にページング機能を付けって感じなのをあればそれでいいんじゃないのかなとかそんな感じ。ぶっちゃけ、タグとか日付で絞り込んでも 20 件しか取得できないんじゃ「何に使うの?」って感じです。
やろうと思えば普通の最新のから取得するやつのページング機能を使って目的の日付のエントリ全部取得はできるのだけど、それだと無駄にはてブにアクセスして無駄な負荷がかかっちゃってよくないと思うのですよね。

以下、このような機能を希望する動機について。

まずは、はてブの人気エントリ・新着エントリの変化が発端。人気エントリはユーザが増えたことによる大衆化で自分とは合わなくなってきたこと。あと、新着エントリはスパムの温床になっていること(特におもしろカテゴリの2chまとめ系が酷い)。スパムに関しては、最初の数ブクマのユーザを調べると総ブクマ数が 100 にも満たないユーザである事が非常に多い。それも数日おきにブクマして目立たないようにしている場合も多い。同時にそういうエントリはプライベートブクマがついている場合が非常に多い。多いパターンはプライベートブクマが 1 〜 2 ブクマで総ブクマ数が 100 にも満たないユーザが 1 〜 2 ブクマしている場合多い。そんで、その記事の最初の数ユーザを超えた後にブクマしているユーザを調べると、そういうユーザがまるで居ないって状況。こんなん明らかにスパムでしょ。ほかのサイトで例えば新聞社とかのブクマ傾向とかと見比べても明らかにおかしい訳なのよね。まあ、これをスパムって断定するのは難しいと思うのだけど、そんな重要性が塵にも満たないユーザを参照した新着エントリとか役に立たない訳で。

そんで、はてなブックマークでは API が公開されてるからそれを利用して自分なりに村はてブとかBL Hatena Bookmarkとかいろいろやってるのだけど、その API に不備があると困るって訳なんです。