Без предисловий:

KNOWN PAGES FROM domain.tld -> [13] | Google indexed -> [12] | [92%]
/page1.html -> 3 visits
        Sun Jan 28 11:10:20 2007 -> 66.249.72.107
        Tue Jan 30 00:18:49 2007 -> 66.249.72.107
        Sun Feb  4 08:22:15 2007 -> 66.249.72.138
        Tue Jan 30 00:18:49 2007 <- Google CACHE TIME

/page2.html -> 3 visits
        Sun Jan 28 23:34:42 2007 -> 66.249.72.107
        Fri Feb  2 08:13:20 2007 -> 66.249.72.138
        Tue Feb  6 13:40:58 2007 -> 66.249.72.138
        Fri Feb  2 08:13:18 2007 <- Google CACHE TIME
/page3.html -> 2 visits
        Tue Jan 30 00:37:08 2007 -> 66.249.72.107
        Sun Feb  4 08:41:26 2007 -> 66.249.72.138
        Tue Jan 30 00:37:08 2007 <- Google CACHE TIME
/page4.html -> 2 visits
        Tue Jan 30 00:37:14 2007 -> 66.249.72.107
        Sun Feb  4 08:42:12 2007 -> 66.249.72.138
        Sun Dec 24 20:33:05 2006 <- Google CACHE TIME
/ -> 2 visits
        Tue Jan 30 00:37:20 2007 -> 66.249.72.107
        Sun Feb  4 08:41:32 2007 -> 66.249.72.138
        Sun Feb  4 08:41:31 2007 <- Google CACHE TIME
/page5.html -> 2 visits
        Tue Jan 30 00:37:26 2007 -> 66.249.72.107
        Sun Feb  4 08:41:52 2007 -> 66.249.72.138
        Sun Feb  4 08:41:51 2007 <- Google CACHE TIME
/page6.html -> 2 visits
        Tue Jan 30 00:37:32 2007 -> 66.249.72.107
        Sun Feb  4 08:42:05 2007 -> 66.249.72.138
        Tue Jan 30 00:37:33 2007 <- Google CACHE TIME
/page7.html -> 2 visits
        Tue Jan 30 00:37:39 2007 -> 66.249.72.107
        Sun Feb  4 08:41:45 2007 -> 66.249.72.138
        Tue Jan 30 00:37:39 2007 <- Google CACHE TIME
/page8.html -> 2 visits
        Tue Jan 30 00:37:45 2007 -> 66.249.72.107
        Sun Feb  4 08:41:25 2007 -> 66.249.72.138
        Tue Jan 30 00:37:45 2007 <- Google CACHE TIME
/page9.html -> 2 visits
        Tue Jan 30 00:37:59 2007 -> 66.249.72.107
        Sun Feb  4 08:41:58 2007 -> 66.249.72.138
        Sun Feb  4 08:41:57 2007 <- Google CACHE TIME
/page10.html -> 1 visits
        Wed Jan 31 01:55:00 2007 -> 66.249.72.107
        Wed Jan 31 01:54:59 2007 <- Google CACHE TIME
/page11.html -> 1 visits
        Sun Feb  4 08:42:19 2007 -> 66.249.72.138
        Tue Jan 30 00:37:54 2007 <- Google CACHE TIME
/page12.html -> 1 visits
        Sun Feb  4 14:59:08 2007 -> 66.249.72.138
        Thu Jan  1 03:00:01 1970 <- Google CACHE TIME

Небольшая выдержка из текстовой статистики для одного из доменов в системе.

  • "Thu Jan 1 03:00:01 1970" - эквивалентно отсутствию кеша, сделано для того, чтобы удобнее было хранить в базе в виде unixtime. ( то есть $time = 1; -> с учетом GMT +3 получается 3 часа ночи первого января 1970 года.)
  • "/page1.html -> 3 visits" - URI страницы, и количество известных системе заходов Googlebot’a.
  • "[92%]" - (кешированые Google’ом страницы) / ( известные системе страницы) * 100%.

Очень много интересного можно откопать, главное SQL запрос по-хитрее придумать. К примеру:

  • Какой из Гуглботов больше всего любит кешировать.
  • Средняя частота визитов Гуглбота на страницу.
  • Средняя частота обновления кеша страницы.
  • История изменений количества проиндексированных страниц.
  • Какой Гуглбот самый частый гость, и какой - самый редковстречающийся.
  • Есть ли разделение функций Гуглботов, в зависимости от IP.
  • и т.д.

На эти вопросы мы постараемся ответить в следующих выпусках нашей "Google Панорамы".

Print del.icio.us:Analyze this! digg:Analyze this! reddit:Analyze this! Y!:Analyze this! news2.ru:Analyze this!

1 Star2 Stars3 Stars4 Stars5 Stars (No Ratings Yet)


Comments

Leave a Reply