Программы Xenu’s Link Sleuth и Netpeak Spider
Доброго времени суток! На прошлой неделе вернулась из деревни, где провела незабываемое время полного релакса! Погода выстояла отличная, дни напролет мы проводили в реках, озерах, лесах, полях. Свежий воздух и ни души вокруг - вот это настоящий отдых!
Продолжаем изучать тему оптимизации блога на WordPress. Ранее мы детально рассмотрели вопрос проверки сайта на дубли страниц и битые ссылки вручную и с помощью плагина. Сегодня мы подробно остановимся на 2х десктопных программах, выполняющих эти задачи автоматически, разберем их основные настройки и параметры технического аудита. Это - Xenu’s Link Sleuth и Netpeak Spider, бесплатные инструменты для seo-анализа блога.
Содержание:
Как пользоваться программой Xenu.
Работать с этой программой не сложно, а в результате получается подробный и обстоятельный отчет обо всех имеющихся на сайте ссылках. Помимо своего основного предназначения, проверки битых ссылок, Xenu может выполнять и другие задачи:
- составление карты сайта;
- определение времени загрузки страниц;
- поиск неуникальных тайтлов;
- выявление страниц со значительным уровнем вложенности;
- определение количества внешних и внутренних ссылок на сайте;
- выявление картинок без атрибута alt.
Обозначенные моменты весьма немаловажны для развития ресурса. Решение данных задач послужит для оптимизации вашего вордпресс-блога. Поэтому предлагаю вам внимательно изучить инструкцию по работе с Xenu Link Sleuth. Начнем.
Данное приложение является бесплатным. Скачать программу Xenu можно по ссылке: xenus-link-sleuth.en.softonic.com.
Разархивируем файл и запускаем Setup.exe. После установки программы можно приступать к настройке её основных параметров. Следует отметить, что Xenu написана для Windows и не работает с другими операционными системами.
Интерфейс приложения англоязычный, но он лаконичен и достаточно прост. Чтобы создать новую проверку, нужно кликнуть по первой пиктограмме в левом верхнем углу окна программы или пройти по пути «File» - «Check URL». В результате откроется окно «Xenu’s starting point» с базовыми настройками:
Вверху вписываем адрес инспектируемого ресурса. Если вы хотите включить в проверку ссылки на внешние ресурсы, следует оставить галочку возле пункта «Check external links». Кнопка «Local file» предназначена для выбора файла на вашем компьютере, если вы хотите проанализировать таковой.
В поле «Consider URLs beginning with this as ‘internal’:» вы можете добавить такие страницы, которые относятся непосредственно к проверяемому сайту, но имеют отличный от главной страницы адрес. Например, https://forum.ВашСайт.ru.
В поле же «Do not check any URLs beginning with this:» можно перечислить те линки, которые вы хотите исключить из проверки программой Xenu.
В нижней части расположена кнопка «e- mail». Она потребуется вам в том случае, если вы захотите получить отчет о проделанном анализе блога на свой e-mail с помощью SMTP-Server:
«e- mail report and quit when done» - выберите этот пункт, если хотите получить весь отчет сразу по завершению работы приложения;
«e- mail only if there are broken links» - при выборе этого варианта отчет придёт, если будут найдены битые ссылки.
Помимо этого, в Xenu предусмотрено большое количество дополнительных настроек. Их можно вызвать, кликнув по кнопке «More options».
Перед нами открывается вкладка «Basic Options». Первый параметр - «Parallel Threads». Он регулирует количество параллельных синхронных запросов. Другими словами, какое число ссылок будет проверяться одновременно. Рекомендуется не превышать значение по умолчанию, чтобы не перегружать сервер и не влиять на корректность проводимого аудита. Пункт «Maximum Depth» устанавливает максимальную глубину вложенности страниц, на которой будет проводиться работа программы Xenu. Здесь тоже можно оставить дефолтное значение. Если поле «Treat redirections as error» отметить галочкой, редиректы будут рассматриваться приложением как ошибка.
Справа расположен блок чекбоксов «Report». Он служит для того, чтобы настроить вывод отчета после сканирования сайта. Выберите те параметры, показатели которых вы хотите видеть в итоге:
«Broken links, ordered by links» - битые ссылки, сгруппированные по URL-адресам;
«Broken links, ordered by page» - аналогично, битые ссылки, но сгруппированные по страницам;
«Broken local links» - внутренние битые ссылки;
«Redirected URLs» - адреса с 301-ым и 302-ым редиректами;
«Ftp and gopher URLs» - URL с протоколами, отличными от http;
«Valid text URLs» - не битые (рабочие) ссылки;
«Site Map», «Statistics» - добавить в отчет карту сайта, статистику;
«Orphan files» - файлы-одиночки, т.е. те, на которые ссылок нет.
Если мы хотим применять данные настройки для всех проектов, нужно отметить галочкой поле «Apply to all jobs».
Сделав настройки Xenu, жмем «ОК». Программа начинает аудит сайта. Она проходит по всему блогу и определяет наличие ссылок. Если возникает необходимость приостановить работу приложения, на панели вверху есть кнопки «Pause» (приостановить), «Stop» (прервать), «Continue» (продолжить). Сколько будет длиться анализ ресурса, зависит от количества страниц, одновременных потоков, скорости соединения и загруженности сервера. По завершению работы, появляется диалоговое окно, сообщающее об этом и предлагающее вывести отчет.
Если соглашаемся, Xenu формирует htm-документ с результатами проделанного анализа в режиме реального времени.
Теперь разберем, как можно пользоваться данными, полученными с помощью Xenu Link Sleuth, в самой программе. Результаты seo-анализа сайта расположены в нескольких столбцах. «Address» содержит список всех найденных URL. Для того, чтобы получить более детальную информацию о какой-то конкретной ссылке, кликаем по ней правой кнопкой мыши, в появившемся контекстном меню выбираем пункт «URL properties». Открывается окно, в котором отображены следующие характеристики линка:
- «Page URL» - страница, на которую ведет ссылка;
- «Title or link text» - атрибут title или анкор ссылки в материале нашего блога;
- «1 page linking to this one» - URL страницы, где находится ссылка.
Далее идет столбец «Status», где указаны статусы всех ссылок. Если мы хотим отфильтровать битые ссылки, достаточно просто кликнуть по названию колонки. Нерабочие ссылки, выделенные красным цветом, будут сгруппированы программой Xenu в верхней части страницы.
Битые ссылки могут иметь такие статусы:
- not found - ссылка не найдена;
- no such host – данный URL не существует;
- no connection – сервер не отвечает. В данном случае следует уменьшить количество одновременных потоков в настройках и повторить проверку.
Закладка «Type» позволяет сортировать файлы по типу расширения: картинки, html/css-файлы и т.д.
Во вкладке «Size» собрана информация о весе файлов в Кб. Этими данными можно воспользоваться, чтобы найти и сжать самые тяжелые изображения на блоге.
В колонке «Title» можно отсортировать результаты по одноименному мета-тегу title. Это дает возможность найти дубли страниц по визуальному совпадению заголовков.
Также приложение предоставляет информацию по таким параметрам:
«Date» - дата появления ссылки;
«Level» - глубина вложенности страницы, на которой находится URL;
«Out Links» - количество исходящих ссылок на конкретной странице;
«In Links» - входящие ссылки, ведущие на определенную страницу.
Воспользовавшись инструкцией по работе с Xenu Link Sleuth и проанализировав результаты seo-анализа, вы с легкостью сможете устранить все битые ссылки и большинство дублей на вашем блоге.
Netpeak Spider: определение основных сео-параметров сайта.
Данная программа является аналогом Xenu. Она позволяет просканировать сайт на наличие ошибок, связанных с внутренней оптимизацией. При этом приложение имеет русскоязычный интерфейс, что значительно упрощает работу с ним. И если вы уже знакомы с программой Xenu, выполнить настройки Netpeak Spider для вас не составит труда.
Вот список тех параметров, которые можно получить в результате аудита сайта с помощью данной программы:
- «URL» — адрес просканированной страницы;
- «Глубина» — уровень вложенности страницы;
- «LinkCanonical» – наличие атрибута rel =”canonical” и адрес, на который он указывает;
- «Ответ» — ответ сервера (3ХХ-5ХХ);
- «Title», «Description», «Keywords» — содержание соответствующих мета-тегов;
- «robots.txt» — разрешена или запрещена (allowed/disallowed) индексация страницы;
- «MetaRobots» — наличие мета-тега «robots»;
- «Редиректы» — количество перенаправлений со страницы;
- «Заголовки (H1)» — количество заголовков первого уровня;
- «Ссылки с этой страницы», «Ссылки на эту страницу» — количество всех ссылок, исходящих с этой страницы и ведущих на эту страницу соответственно;
- «Внутренние ссылки»;
- «Внешние ссылки»;
- «PR», «PR (без сквозных ссылок)» — внутренний показатель Page Rank страницы, внутренний показатель Page Rank страницы без учета сквозных ссылок;
- «Дубли по Title», «Дубли по Description», «Дубли по Keywords» — группы страниц с соответственным повторяющимся мета-тегом.
Скачать программу можно по ссылке — netpeak.ua/software/netpeak-spider. Приложение бесплатное, но необходимо пройти несложную регистрацию. После этого на электронную почту нам будет выслан ключ активации, которым надо воспользоваться при установке программы. Сам процесс установки стандартный: запускаем файл .exe и следуем инструкциям Netpeak Spider.
После запуска приложения, открываем окно с необходимыми настройками: «Настройки» — «Сканирование». Выбираем необходимые параметры, сохраняем.
В основном окне программы прописываем адрес проверяемого ресурса, указываем количество параллельных потоков и глубину вложенности страниц. Запускаем сканирование (пиктограмма справа от поля для вставки URL).
Полученные результаты можно фильтровать по такому же принципу, как и в программе Xenu. Для доступа к детальной информации об интересующем нас показателе достаточно вызвать контекстное меню кликом правой кнопки мыши. Так, к примеру, если мы хотим увидеть список всех исходящих ссылок на конкретной странице, кликаем по количеству и выбираем в появившемся окне пункт «Посмотреть все ссылки с этой страницы».
Для поиска дублей справа от основного размещено окно поменьше. Здесь предлагается кнопка «Найти дубли» и возможность выбрать критерий фильтрации – «По title», «По description» или «По keywords». Результаты аудита можно сохранить в виде файла Excel. Для этого следует кликнуть по основному меню в верхней области окна «Экспорт в Excel».
В заключение следует упомянуть, что и Xenu Link Sleuth, и Netpeak Spider зарекомендовали себя как отличные инструменты для проверки битых ссылок и имеют множество положительных отзывов среди веб-мастеров. Отмечу, что хотя функционал Netpeak Spider несколько шире, в отличии от Xenu, в ней нет возможности повторно открыть проверяемый файл.
Спайдер уже давно стал платным. А Xenu всегда была платной (в бесплатной ограничение до 500 урлов).
Сорри, перепутал. Это в Screaming Frog ограничение до 500 урлов. А Xenu бесплатная, да. Но Спайдер платный:)
За все хорошее нужно платить))) Но здесь главное, что Spider реально удобный.
К сожалению, ребята из Xenu’s не так активно откликаются на изменения в SEO и апгрейдят программу. Так что, думаю, нетпиковский Spider вполне обоснованно является платным. За такое грех не заплатить. Да и сумма не ахти какая.