Diary Blog of Dary

temtanが書いた文章

「きれいなはてブ」こと BL Hatena Bookmark(ブラックリスト除外機能付きはてブ新着・人気)を改良した。

「きれいなはてブ」の元ネタはこちら → Twitter. It's what's happening.

BL Hatena Bookmark はこちら → http://childs.squares.net/blhatebu/

バージョンを上げて 1.0.3 → 1.1.0 になりました。

更新内容

ブラックリスト2chまとめブログ系、エロ系、スパム疑惑系、糞ネットメディア系に分離しました。さらにユーザが設定でそれぞれを選択できるようにしました。やろうと思えばブラックリスト無しも可能です。ブラックリストのジャンル追加等は要望があったらまあ良さそうなのが有ればやりたいっすね。
あと、ゆくゆくは(例えばブラックリストの URL を指定するとかで)ユーザ個別のブラックリストを指定したいなあとか思ってます。

  • ブラックリスト適合したものを削除ではなく取消線で表示できるようにした。

見た目のインパクト狙い*1で、ブラックリストに適合したのを削除しないで取消線で表示できるようにしました。設定から選んで下さい。どの程度削除されているのか一目瞭然だと思います。とくにおもしろカテゴリの2chまとめブログ系の占有具合は凄いですね。

  • エントリが被ってしまう事があった不具合を修正

前のバージョンでは RSS から取得したエントリを保存する処理が結構適当にやってまして、その辺を一から作り直したのでましたので、まあ今回にのはそういった変な動きは無くなったと思います。

  • 他色々(一から作り直した感じなので)

技術的な話も含めて。前のを部分的にコピーしたものの、基本的にはクラス設計から一から作り直した感じになってます。一番違う点は、以前は RSS から取得した時にブラックリスト適合処理をして削除した結果をキャッシュしていたのを、RSS から取得したのは全部キャッシュしていて、表示するときにブラックリスト適合処理をするようにした。ブラックリストがどんなのなのかはアクセスする時にしか判らないので、そうなってしまうのは必然。
あと、これは前からだけど、アクセスがあったときに前回アクセスから(新着なら)10分後以降なら RSS を読みに行く作りになっているんですが、前回アクセスから時間が空いてしまうと、その間の新着が取れないので、連続性が失われてしまう問題がありまして、これは定期的なアクセスが有ればいい訳で*2、これを広めて皆がアクセスするようにして欲しいのでこれを広めて欲しいっちゃ欲しいのですてそのへんよろしく尾根ギアしたい。まあ軽く対策はしていますが。

  • 細かいの
    • HTML コメントで各ジャンルの RSSアクセス時間のログがあります
    • 削除したエントリはコメントアウトにしてあります
    • キャッシュの件数は 128 件に設定してあります。(各カテゴリ毎)
    • 「おもしろ」カテゴリのキャッシュだけは他カテゴリの 8 倍にしてあります(2ch まとめブログ系が占有しすぎている為)
  • 内部的な話(今後の拡張性を考えて作ってある)
    • 内部的には各カテゴリごとに適合するブラックリストを指定できるが、外部機能としては指定できない
    • 内部的には全カテゴリジャンルではなく個別カテゴリ(単数でも複数でも)表示できるようにしているが、外部機能としては指定できない
    • というか内部的に各カテゴリ毎に色々(表示件数とかキャッシュする件数とか時間とか)設定できるのだけど、インターフェイス用意するのめんどいからやってない

参考

はてブ新着・人気エントリからブラックリストに載ってるのを除外して表示するのを作った - Diary of Dary

*1:実用性は低いと思うけどね。だって前のエントリで結構自信あったのにぜんぜんブクマつかないんだもん…

*2:まあデーモンとかで定期的にアクセスすればいいのだけど、鯖的にデーモン設置できないのよね