Кроме общей статистики сайта - количества уникальных посетителей, количества открытых ими веб-страниц и т.д. большое значение для веб-мастеров имеет и другая информация, например: какие страницы сайта посещаются наиболее часто, какие поисковые запросы приводят посетителей на сайт, какими браузерами и операционными системами пользуются посетители, какое разрешение экрана на компьютерах посетителей.
Те, кто хостится на платном хостинге, могут также обрабатывать всю информацию по посещению сайта самостоятельно: ведь веб-мастер имеет полный доступ к лог-файлам своего сайта.
Лог-файл веб-сайта (log file, log-файл, лог-файл, лог) - это текстовый файл, в котором регистрируются все запросы к сайту, а также все ошибки, связанные с этими запросами.
Как происходит запись событий в лог-файл сайта:
Интернет-пользователь набирает в своем веб-браузере адрес какого-либо сайта (веб-страницы) и нажимает Enter;
- браузер пользователя передает на сервер (на котором находится сайт) запрос на выдачу веб-страницы (в лог-файле это оформляется записью «GET <адрес_ресурса>»);
- на сервер передается следующая информация:
• IP-адрес посетителя;
• дата и время запроса;
• используемый пользователем браузер;
• используемая пользовауелем операционная система;
• запрашиваемый URL;
• адрес страницы, с которой зашел посетитель;
- сервер выдает посетителю запрашиваемый документ/страницу/ картинку/файл (если он существует);
- сервер записывает информацию о произошедшей транзакции в журнал событий (лог-файл).
Как прочесть запись лог-файла сайта:
Например, запись в лог-файле
78.123.67.3 - - [21/Jul/2009:01:01:34 +0400] "GET http://<адрес_ресурса>/ news.xml» 304 0 «http://<адрес_ресурса>» «Mozilla/4.0 (compatible; MSIE 8.0; Windows NT6.0; Trident/4.0; SLCC1; .NET CLR 2.0.50727; Media Center PC 5.0; lnfoPath.2; .NET CLR 3.5.30729; OfficeLiveConnector. 1.4; OfficeLivePatch. 1.3; .NET CLR 3.0.30729)» 127.0.0.1
означает, что 21 июля 2009 г. в 01:01:34 (по местному времени хостинг-провайдера) с ip-адреса 78.123.67.3 к RSS-ленте news.xml сайта http://<адрес_ресурса> обращался встроенный RSS-ридер браузера Internet Explorer 8 (при этом операционная система - Windows Vista). Код 304 означает, что записей о новых вебстраницах сайта http://<адрес_ресурса> в RSS-ленте не появилось, поэтому браузер не загружал файл news.xml (о чем красноречиво свидетельствует 0).
Что можно выяснить, анализируя логи веб-сайта:
• Посещаемость. Конечно, этот показатель отражает и простой счетчик, устанавливаемый на каждой странице, но лог-файлы позволяют анализировать посещаемость более детально, например по месяцам (Monthly Statistics), дням (Daily Statistics), часам (Hourly Statistics). Этот показатель позволяет выявлять часы всплеска посещаемости (пики посещаемости) и часы затишья, что очень важно знать при обслуживании сайта.
• Трафик - суммарный и отдельно по страницам.
• Уровень конверсии. Показывает, как посетители перемещаются по сайту, то есть смотрят ли они одну страницу или несколько. Уровень конверсии позволяет косвенно оценивать качество сайта.
• Точки входа (Entry, Entry Pages) -это веб-страницы, с которых пользователи начинают работу с сайтом. Это очень ценная информация! Например, если 80% посетителей «не видят» главную страницу вашего сайта, есть ли смысл тратить время и средства для ее украшения и улучшения? Кроме того, точки входа показывают наиболее значимые страницы вашего сайта. Точки входа, как правило, соответствуют наиболее популярным страницам сайта.
• Точки выхода (Exit, Exit Pages) -это веб-страницы, с которых пользователи покидают ваш сайт. Позволяют анализировать ситуацию: хорошо, если пользователь нашел то, что искал и потому уходит (довольный!), а если нет? Есть повод задуматься!
• «Заброшенные» страницы - это веб-страницы, посещаемые очень-очень редко. Требуется тщательный анализ ситуации: может быть, страницы неинтересны или их трудно отыскать на вашем сайте (например, они не указаны на карте сайта или не связаны ссылками с другими страницами сайта).
• Популярные страницы (URLs) -это веб-страницы, посещаемые наиболее часто. Можно использовать их как образец при создании других страниц сайта. Можно также направлять пользователей с этих страниц к другим, менее популярным или «заброшенным» страницам.
• Поисковики (Searches). Показывает, с каких поисковиков пришло больше всего посетителей.
• Поисковые запросы, приводящие на сайт (Search String). Этот показатель демонстрирует эффективность используемых вами названий вебстраниц, метатегов, ключевых слов...
• Рефереры (Referrers) - ссылающиеся на сайт ресурсы.
• География посетителей. Показывает, из каких стран приходят посетители на сайт.
• Информация о посетителях: IP-адрес посетителя, используемые браузер и операционная система и т.д.
Программы для анализа лог-файлов сайта:
Лог сайта - это текстовый файл, поэтому можно работать с ним, открыв вручную в текстовом редакторе. Однако просматривать логи вручную - весьма утомительно, так как лог-файлы очень объемные: например, если сайт посещают около 6 тыс. посетителей ежедневно, которые просматривают около 10 тыс. страниц, то объем лог-файла за день составляет более 9 МБ!
Для работы с лог-файлами предназначены специальные программы - анализаторы лог-файлов. Например, Analog, AWStats, loganalyzer, NetPromoter, Webalizer, WebAnalizer, WebHound, Webtrends и др.