Праздник оптимизатора. Подарки от AOL.
Подарком являются данные живых запросов пользователей AOL Search. Вникать в происхождение этих данных мне честно говоря неохота. Брать тут. Я половину уже скачал, через полчаса начну их мучать. Видимо в БД заливка всю ночь производиться будет 🙂
Первые данные по обработке данных — количество кликов в зависимости от позиции:
Results in:
Total Searches:9,038,794
Total Clicks: 4,926,623Click Rank1: 2,075,765
Click Rank2: 586,100 = 3.5x less
Click Rank3: 418,643 = 4.9x less
Click Rank4: 298,532 = 6.9x less
Click Rank5: 242,169 = 8.5x less
Click Rank6: 199,541 = 10.4x less
Click Rank7: 168,080 = 12.3x less
Click Rank8: 148,489 = 14.0x less
Click Rank9: 140,356 = 14.8x less
Click Rank10: 147,551 = 14.1x less
Подтверждено небольшое преимущество 10-го места над 9-м.
А вот на первые три места приходится ок 60% кликов, а не 75-80%, как считали некоторые.
Удачных исследований.
Update:
А вот и информация о происхождении данных:
This collection consists of ~20M web queries collected from ~650k users over three months…
Basic Collection Statistics
Dates:
01 March, 2006 — 31 May, 2006Normalized queries:
36,389,567 lines of data
21,011,340 instances of new queries (w/ or w/o click-through)
7,887,022 requests for «next page» of results
19,442,629 user click-through events
16,946,938 queries w/o user click-through
10,154,742 unique (normalized) queries
657,426 unique user ID’sPlease reference the following publication when using this collection:
G. Pass, A. Chowdhury, C. Torgeson, «A Picture of Search» The First
International Conference on Scalable Information Systems, Hong Kong, June,
2006.