Diary Blog of Dary

temtanが書いた文章

Donca というユーザのブックマークについての調査

Donca というユーザのブックマークについて調べました。動機は「このbotうぜえ。どうにかして規約違反の証拠ねえかな」です。

調査対象のブックマークは 2011 年 1 月 1 日〜 9 月 27 日の270日間のブックマークである。

投稿間隔。

ブクマしてから次のブクマまでの時間

投稿間隔範囲 割合
0 分 〜 5 分 35430 70.9%
5 分 〜 30 分 10863 21.7%
30 分 〜 1 時間 2981 6.0%
1 時間 〜 3 時間 629 1.3%
3 時間 〜 6 時間 66 0.1%
6 時間 〜 12 時間 6 0.0%
12 時間 〜 24 時間 0 0.0%

見ての通り、7 割が 5 分以内に投稿、9 割以上が 30 分以内でのブクマ。また、6 時間以上間隔が開くことはまれで、12 時間以上間隔が開くことは無かった。これにより bot で投稿しているのは確実であると言える。

月間ブクマ数
1 月 2853
2 月 3510
3 月 3705
4 月 5718
5 月 6952
6 月 7375
7 月 6684
8 月 7161
9 月 6018

見ての通り 4 月から急増している。ここには省略するが週間ブクマ数を調べてみたら 4 月中旬に急増している。

曜日別ブクマ数
曜日 日数 合計 平均 簡易グラフ
39 4189 107.4 ★★★★★★★★★★★
39 6816 174.8 ★★★★★★★★★★★★★★★★★
39 8522 218.5 ★★★★★★★★★★★★★★★★★★★★★★
38 8901 234.2 ★★★★★★★★★★★★★★★★★★★★★★★
38 8409 221.3 ★★★★★★★★★★★★★★★★★★★★★★
38 8057 212.0 ★★★★★★★★★★★★★★★★★★★★★
39 5082 130.3 ★★★★★★★★★★★★★

平日は日曜日の倍近くのブクマをしている。平日更新するサイトをブクマしている結果だと予想される。

サイト別ブクマ数、月毎のブクマ数

サイトは 1 日1ブクマ以上、つまり 270 件以上のサイトをここに出します。

サイト 全件数 1月 2月 3月 4月 5月 6月 7月 8月 9月
www.applelinkage.com 4090 104 178 188 423 441 697 673 691 695
gs.inside-games.jp 2741 69 106 95 309 408 506 428 487 333
www.lifehacker.jp 2211 99 91 152 232 266 365 337 380 289
taisyo.seesaa.net 2166 60 156 137 247 300 362 310 304 290
jp.techcrunch.com 1608 77 65 112 191 253 250 236 241 183
instagr.am 1518 62 33 131 171 354 272 260 194 41
vocaloid.blog120.fc2.com 1513 83 90 99 162 188 214 204 235 238
blog.livedoor.jp/amd646464 1353 53 66 47 148 226 180 213 242 178
www.socialnetworking.jp 1262 51 63 51 155 169 237 155 212 169
www.i-mezzo.net 1250 27 65 60 145 185 190 175 190 213
サイト 全件数 1月 2月 3月 4月 5月 6月 7月 8月 9月
japanese.engadget.com 1124 70 67 55 137 182 164 130 170 149
www.nationalgeographic.co.jp 950 23 41 43 117 152 165 123 157 129
foursquare.com 818 67 71 55 121 68 59 89 179 109
ipodtouchlab.com 699 31 25 19 89 115 105 104 105 106
blog.livedoor.jp/applebrothers 671 27 39 40 129 154 119 101 21 41
northwood.blog60.fc2.com 566 14 32 23 72 102 76 77 81 89
www.gizmodo.jp 524 105 139 260 20 0 0 0 0 0
blog.livedoor.jp/manamerit 524 42 27 30 61 73 79 75 70 67
kuracyan.net 451 23 30 31 70 75 65 62 50 45
www.appbank.net 429 165 137 127 0 0 0 0 0 0
サイト 全件数 1月 2月 3月 4月 5月 6月 7月 8月 9月
digimaga.net 425 22 16 27 117 60 27 78 49 29
so-mo.net 389 8 13 11 23 30 72 76 98 58
www.jp.sonystyle.com 383 20 34 16 0 54 61 65 79 54
slodive.com 382 3 6 12 32 81 58 67 65 58
www1.jp.sonystyle.com 382 30 65 13 0 14 54 48 74 84
kjx130.blog19.fc2.com 370 9 18 21 44 62 56 59 56 45
gigazine.net 369 86 123 150 10 0 0 0 0 0
techwave.jp 366 10 25 13 47 62 64 47 51 47
ma2mars.org 339 13 24 11 18 30 56 78 59 50
shimajiro.sakura.ne.jp 335 31 21 21 58 75 66 56 7 0
サイト 全件数 1月 2月 3月 4月 5月 6月 7月 8月 9月
wiredvision.jp 334 24 30 28 82 136 34 0 0 0
rdp.blog52.fc2.com 330 22 27 28 31 31 43 47 44 57
juggly.cn 309 88 114 91 16 0 0 0 0 0
slashdot.jp 292 91 72 129 0 0 0 0 0 0
veadardiary.blog29.fc2.com 283 12 8 13 34 30 40 50 55 41
newsroom.intel.com 282 31 20 21 40 35 35 28 28 44
japan.digitaldj-network.com 270 21 33 11 28 49 36 12 52 28


全体的に 4 月からブクマ数が大幅に増えていることから、4 月からブクマ数が急増したのは bot の性能を変えたからだと思われる。この変更後の件数から、各サイトのほぼ全てのエントリをブクマしていると考えられる。
また、ここに載っているサイトだけでなく 3 月末〜4月頭あたりでブクマしなくなったサイトがいくつか見られ、bot が巡回するサイトもちょくちょくと変更している模様。

件数の一番多い www.applelinkage.com のブクマに関して考察

一番多くブクマしている www.applelinkage.com について、APPLE LINKAGE | ARCHIVESにある 2011 年 8 月の記事件数は 438 件であった。それに対し8月のブクマ数は 691 件であった。ブックマークエントリ内容について調べたところ、どうもトップページの記事と ACHIVES の記事の両方にブクマをしており、いくつかの漏れがあることから記事 438 件に対し約 1.5 倍のブクマになっている。
また、ここのトップページの各記事は新着何件かを表示するようになっているので、トップページの各記事へブックマークをしても 数時間〜2日程度で無意味なものになってしまう。これにより、「とりあえずブクマしておいて後で何かする」という目的には利用するのが非常に難しいというか実質できないであろう。

まとめ
  • bot による自動投稿を行っているのは確実
  • 対象サイトのエントリのほぼ全て*1をブクマしている
    • つまり、エントリの内容を見ないでブクマしていると言える*2
  • 少なくとも www.applelinkage.com の記事に対しては「ブクマしておいて後で何かする」という目的には使ってない
    • ほかのサイトに対しては同様だと予想される*3
結論

Donca というユーザは bot による自動投稿で特定サイトの記事を事前に見ることなく、また後で見る目的でもなくブックマークしていると考えられる。この件がはてな利用規約 - はてなの第 6 条の6-3の「広告、宣伝および検索サイト最適化を目的としてブックマークに登録する行為」に該当するかどうかはよくわかんなーい。

*1:もしかしたら簡単なフィルタリングはしてるかも

*2:あるサイトについて20件程度調べたところ、記事が投稿されてからほぼ全てが 15分以内にブクマされていたことからもそうだといえる

*3:後で使う目的の場合、一番ブクマ数の多い www.applelinkage.com の記事がノイズになるし、後で使う発想があるなら無意味なブクマはそもそもしないと考えられるため