Разбираемся, как на сайте найти страницы с ошибкой 404: расширения, плагины, приложения и программы
Один из главнейших факторов, который отталкивает пользователя от сайта ,— это появление страниц с ошибкой 404 Not Found. Появление таких ошибок негативно сказывается на отношении к сайту с точки зрения поисковых систем Яндекса и Google.
Лучший инструмент для автоматизации Facebook | Забирай скидку 20%
Во-первых, из-за этого внешние ссылки теряют свой вес, что ухудшает ранжированность и всего сайта.
Во-вторых, теряется вес внутренней перелинковки — особенно при круговой перелинковке — что также снижает трастовый вес других, действующих страниц.
Почему появляется ошибка 404
Наиболее частотный случай появления такой ошибки вызван неправильным вводом адреса страницы со стороны пользователя. Однако здесь ничего нельзя поделать — повлиять на них и научить вводить правильные адреса проблематично. Поэтому, очевидно, стоит сосредоточиться на других вариантах — когда появление 404 ошибки вызвано проблемами на стороне сайта.
Таких проблем может быть две:
- Страница по каким-либо причинам была удалена;
- У страницы был изменен URL без настройки редиректа на новый — поэтому абсолютно все внешние ссылки на такую страницу перестали быть рабочими.
Как уже было сказано выше, такие страницы нужно находить и ошибки исправлять. Сделать это можно несколькими способами.
Поиск ошибки 404 через Яндекс Вебмастер
У Вебмастера есть специальный инструмент для поиска ошибок 404. Для этого вам будет достаточно перейти в раздел «Индексирование» → «Статистика обхода»
Поиск ошибки 404 в панели вебмастеров Google
Аналогичная возможность поиска 404 ошибки представлена и у Google. Для этого нужно открыть раздел «Обзор» и перейти там во вкладку «Покрытие». Здесь будут сразу представлены все страницы с ошибкой, которые были найдены поисковой системой.
Необходимо отметить, что это достаточно быстрый и удобный способ поиска страниц с ошибкой 404. Однако ни Яндекс, ни Google не находят их все. Поэтому есть смысл попробовать воспользоваться другими способами.
Поиск ошибки 404 с помощью программы Netpeak Spider
Если у вас уже установлен этот сервис, то вы сможете легко найти все ошибки 404 на вашем сайте.
Последовательность действий такая:
- Откройте программу;
- Во вкладке «Параметры» выберите «Минимум», чтобы искать только 404 ошибку;
- Нажмите старт.
В полученном отчете будут указаны два параметра:
Это непосредственно сами страницы с ошибкой 404 и, что очень важно, ссылки, которые ведут на такие страницы.
Поиск ошибки 404 с помощью сервиса Serpstat
- Пройдите процесс регистрации и добавьте свой сайт в проект;
- В колонке «Аудит сайта» нажмите «Запустить аудит»;
- Нажмите «Начать анализ».
После завершения обработки откройте отчет «Код ответа: 4xx». Там вы найдете все страницы с ошибкой 404.
Что делать с ошибкой 404
Порядок действий достаточно прост:
- Все ссылки на страницы с 404 ошибкой нужно заменить на рабочие;
- Если ссылку заменить не получится (например, потому что страница была удалена), то и ссылку нужно просто удалить.
Проверьте, не нужно ли удалить страницу с такой битой ссылкой из индекса поисковых систем, чтобы Яндекс и Google перестали приводить к вам пользователей на несуществующую страницу.
Однако полностью избавиться от появления 404 ошибки у вас не получится — ведь довольно часто ошибка появляется по причине того, что сами пользователи неверно вводят URL.
Однако и здесь вы сможете максимально улучшить опыт использования вашего сайта. Для этого достаточно наполнить страницу с 404 ошибкой полезной информацией:
- Дайте ссылку на главную страницу;
- Выложите другую полезную информацию;
- Дайте доступ к возможности поиска по сайту;
- Если это необходимо, оставьте свои контакты для связи.
Благодаря этому пользователю не захочется убежать сразу же с вашего сайта и начать искать информацию где-нибудь ещё.
Заключение
Ошибка 404 может серьезно повлиять на трафик вашего сайта, поэтому так важно вовремя ее «найти и обезвредить». Посему мы советуем вам регулярно проводить подобные «облавы» — то есть проверки на наличие ошибок. Тем самым вы позитивно повлияете на отношение к вашему сайту как с точки зрения поисковиков, так и пользователей.
Довольно широко распространена ситуация, когда мы, пользователи, натыкаемся на несуществующие страницы с кодом ответа 404 Not Found. Такие страницы есть на любом сайте, достаточно лишь вбить в адресную строку URL с ошибкой. Но вот проблема — наличие внутренних ссылок на них обязательно к исправлению, и вот почему.
- Поисковые роботы расходуют краулинговый бюджет при переходе на 404. Это приводит к тому, что они с меньшей вероятностью просканируют действительно полезные страницы с новым контентом.
- Потеря веса внешних ссылок, которая несомненно скажется на ухудшении в ранжировании этой страницы, а возможно и всего сайта.
- Ухудшение пользовательского опыта. Если на каждом углу посетитель сайта наталкивается на 404 страницу с грустной надписью «Not Found» он с большой вероятностью покинет сайт.
Какие причины приводят к 404
Вызывать эту ошибку могут следующие причины:
- Неправильный URL-адрес. Довольно часто пользователи просто опечатываются.
- Страница была удалена.
- URL-адрес страницы был изменен без настройки редиректов. Это привело к тому, что если пытаться перейти по старому адресу (например, по ссылке с другого сайта или закладок) возникнет ошибка 404.
Помочь найти страницы с 404 ошибкой помогут панели для вебмастеров.
Что делать
Сами по себе 404 ошибки являются нормальной практикой, но те ссылки, которые на них ведут — довольно неприятное явление. Постарайтесь как можно быстрее от них избавиться, изменив на корректные либо вовсе удалив. Так вы значительно меньше будете растрачивать краулинговый бюджет поисковых роботов, а чтобы сократить вероятность ухода с сайта живых людей, при попадании на такую страницу, правильно оформляйте страницу 404. Это тема нашей следующей статьи.
Как узнать сколько пользователей зашли на 404 страницу
Наиболее эффективный способ — создать цель в Яндекс.Метрике и отслеживать её.
После создания цели в Метрике установите на 404 страницу следующий код:
<script> window.onl oad = function (){ yaCounterXXXXXXX.reachGoal(‘404’); } </script>
XXXXXXX — номер вашего счетчика.
После этого вы сможете отслеживать трафик на 404 странице. Подобным образом можно сделать и в Google Analytics.
Содержание статьи
- Чем вредны страницы 404 для сайта?
- Как появляются страницы 404?
- Как обнаружить страницы 404?
- Поиск ошибок в Google Search Console
- Поиск ошибок в Google Analytics
- Анализ сайта программой ScreamingFrog
- Поиск ошибок с помощью расширения Check My Links
- Что делать со страницами 404?
- Примеры оригинального оформления страницы с 404 ошибкой
- Заключение
Появление страницы 404 означает, что сайт не смог найти запрошенную страницу, поскольку она не существует. Эта ошибка создает много проблем при оптимизации сайта. В этой статье мы хотим рассказать какими способами можно их находить и устранять.
Чем вредны страницы 404 для сайта?
Страницы с кодом ответа сервера 404 есть на любом сайте, чтобы на них попасть нужно ввести в адресную строку браузера несуществующий адрес страницы.
Если ошибка 404 возникает из-за удаления страницы или «битой» ссылке на сайте, это плохо сказывается на продвижении.
А все потому, что:
- Потерпают поведенческие факторы
Пользователям не нравятся сайты с неработающими страницами. Они быстро покидают такие сайты и редко возвращаются. - «Сливается» впустую краулинговый бюджет
Любой сайт имеет ограниченный краулинговый бюджет и поисковые роботы не могут проиндексировать много страниц сразу. И если при сканировании сайта возникает много 404 страниц – низкая вероятность того, что роботы доберутся до новых или обновленных страниц. - Утрачивается ссылочный вес
При удалении страницы все ссылки, которые ведут на нее или с нее уходят в никуда.
Ссылки ведущие на страницы 404 носят название «битые» и плохо влияют на раскрутку сайта. Таким образом, при удалении страниц, удаляйте или заменяйте ссылки ведущие на них.
Как появляются страницы 404?
Причин возникновения 404 ошибок несколько:
- Неправильное написание УРЛа.
- Удаление страницы.
- Страница переведена на новый адрес, а редирект не настроен.
В независимости от причины возникновения страниц 404 их обязательно нужно исправлять.
Как обнаружить страницы 404?
Существует много способов проверить сайт на наличие страниц 404, но мы рекомендуем использовать сразу все описанные ниже.
Поиск ошибок в Google Search Console
- Зайдите в панель для вебмастеров Google и перейдите на вкладку «Покрытие».
- Если кликните по вкладке «Ошибка» – Вам откроется список страниц с ошибкой 404.
Поиск ошибок в Google Analytics
Узнать сколько пользователей столкнулось с ошибкой на сайте можно в сводке по страницам.
- Нажмите на пункт меню Поведение/Контент сайта/Все страницы.
- Отсортируйте страницы по названию «Страница не найдена» или «404» в зависимости от того, как она называется на Вашем сайте.
- Нажмите «Название страницы» и с помощью кнопки «Еще» воспользуйтесь поиском по запросу «404» (или «Страница не найдена»):
- GA отфильтрует все страницы по заданному заголовку и покажет отчет по количеству сеансов, получивших код ответа 404:
- Нажмите по названию страницы и получите список УРЛов с ошибкой 404, который нужно будет проработать:
Анализ сайта программой ScreamingFrog
- Пропишите адрес сайта и нажмите кнопку «Start».
- После завершения процесса сканирования перейдите во вкладку «Response Codes» — там Вы увидите список всех страниц с кодом 404.
Поиск ошибок с помощью расширения Check My Links
- Установите в Google Chrome специальное расширение Check My Links.
- Введите в поисковую строку Google адрес сайта с оператором «site:»
и увидите все проиндексированные страницы Вашего сайта и коды их ответа:
Что делать со страницами 404?
Если Вы обнаружили страницы 404 – нужно немедленно от них избавляться.
Способы устранения ошибок 404:
- Замена неработающих ссылок на работающие.
- Удаление всех ссылок ведущих на страницы 404.
- Удаление страниц 404 из индекса поисковых систем.
О том, как удалить страницы из индекса Google узнаете в справке.
Примеры оригинального оформления страницы с 404 ошибкой:
Заключение
От страниц 404 полностью избавится невозможно, ведь их могут допускать и сами посетители сайта. Но нужно сделать все, чтобы уменьшить их негативное влияние. Также важно правильно оформить неработающую страницу:
- Написать почему посетитель здесь очутился и что ему дальше делать.
- Предложить посетить главную страницу сайта или самые популярные разделы.
- Добавить форму поиска по сайту.
- Дизайн страницы 404 должен соответствовать оформлению сайта.
- Можно оставить контактную информацию.
Проводите регулярный аудит сайта для быстрого обнаружения и устранения 404 страниц! Если нужна помощь – обращайтесь!
12.2К
просмотров
Если у вас крупный сайт с большим количеством страниц, то поисковое продвижение такого проекта зачастую сводится к выявлению и устранению множества технических проблем.
Одной из распространенных ошибок является наличие битых ссылок на страницы с кодом ответа «404 not found». Более того, на страницы с 404 ошибкой могут вести ссылки с других сайтов, при этом их вес будет потерян. В этой статье вы узнаете как вернуть потерянный вес внешней ссылочной массы.
«Я вам точно могу сказать, что на более или менее крупном сайте все время что-то ломается»
— Михаил Сливинский (Wikimart.ru), SEO Conference 2014.
Суть метода
Ссылки с других сайтов не передают вес, если ведут на битые страницы на вашем сайте. Задача состоит в том, чтобы настроить перенаправление (301 редирект) с несуществующих страниц, имеющих входящие ссылки, на другие подходящие страницы на сайте. Таким образом, вес входящих внешних ссылок начнет передаваться сайту.
Этот метод подойдет скорее проектам с возрастом и большим количеством страниц. Алгоритм работы следующий:
1. Поиск и составление списка страниц с 404 ошибкой.
2. Проверка полученных url-адресов на наличие входящих внешних ссылок.
3. Установка 301 редиректа с битых страниц на подходящие рабочие страницы.
На этом этапе нужно выявить на сайте несуществующие страницы, страницы с ошибками и составить как можно более подробный список url-адресов. Для этого есть несколько инструментов, которые далее будут рассмотрены подробно.
Панели Яндекс.Вебмастер и Google Webmaster Tools
Если ваш сайт еще не добавлен в панели для вебмастеров Яндекс и Google, то обязательно добавьте его сейчас. Так вы сможете своевременно выявлять битые ссылки и другие ошибки индексации.
Чтобы получить список страниц с 404 ошибкой в панели Яндекс.Вебмастер, перейдите на http://webmaster.yandex.ru/sites/ в раздел «Индексирование сайта» → «Исключенные страницы».
(кликните на изображение для увеличения)
Перейдя по ссылке «HTTP-статус: Ресурс не найден (404)» вы получите список найденных страниц с 404 ошибкой. Данный список можно экспортировать в удобном для вас формате.
(кликните на изображение для увеличения)
Для получения списка несуществующих страниц из панели Google Webmaster Tools (https://www.google.com/webmasters/tools/) перейдите в по ссылке «Ошибки сканирования».
(кликните на изображение для увеличения)
На странице будет список url-адресов с ошибками. Экспортировать список можно, нажав кнопку «Загрузка» и выбрав удобный формат выгрузки.
(кликните на изображение для увеличения)
Программы «краулеры»
Тут можно выделить известные программы для поиска битых ссылок и дубликатов:
— Xenu Link Sleuth
— Screaming Frog Seo Spider
— Netpeak Spider
Все они позволяют найти на сайте и выгрузить список страниц с 404 ошибкой. Я для этих целей пользуюсь Screaming Frog Seo Spider, так как у него есть версия под Mac, в отличие от остальных. На примере Screaming Frog список 404 страниц выгружается так:
(кликните на изображение для увеличения)
Журнал ошибок сервера
Если есть такая возможность, то стоит просмотреть журнал ошибок сервера. Обычно это файл «error_log». В зависимости от используемого ПО на сервере, журнал ошибок может отличаться. Но суть все равно одна — просмотреть журнал ошибок сервера и выгрузить из него список url-адресов с 404 ошибкой.
Полученные списки ссылок нужно объединить в один список и удалить дубликаты. Для этого есть множество способов, но я использую текстовый редактор Sublime Text 2 (на Windows рекомендую Notepad++ с плагином TextFX).
(кликните на изображение для увеличения)
Проверка списка битых страниц на наличие входящих ссылок
Для проверки итогового списка url-адресов на наличие входящих ссылок с других сайтов используется сервис Ahrefs.com, а именно раздел «Batch Analysis» – https://ahrefs.com/labs/batch-analysis/.
(кликните на изображение для увеличения)
К сожалению, у данной функции есть ограничение в 200 url за 1 запрос на платных тарифах и в 2 url за 1 запрос на бесплатном. Поэтому нужно вбить свой список в несколько порций по 200 адресов. После каждой проверки нужно сделать экспорт в файл.
(кликните на изображение для увеличения)
Полученные выгрузки по 200 url нужно объединить в 1 таблицу. Для этого нужно открыть 1 файл и копировать в конец содержимое других файлов. Лишние столбцы можно удалить. Нас интересует только столбец «Total», он означает общее количество внешних ссылок на страницу.
(кликните на изображение для увеличения)
Полученный список нужно отсортировать и удалить строки, в которых «Total» равен нулю. В итоге у вас получится список битых страниц, которые имеют входящие ссылки с других сайтов.
Подбор страниц для редиректа
Полученный список нужно снова загрузить в Batch Analysis на Ahrefs, чтобы можно было посмотреть с каких сайтов и с какими анкорами стоят ссылки на каждую страницу нашего списка. Для этого используем иконку рядом с url-адресом.
(кликните на изображение для увеличения)
Далее нужно посмотреть с каких страниц и с какими анкорами ссылались внешние сайты. Для удобства создайте таблицу с двумя колонками, в которой будет список битых адресов и список «живых» адресов, на которые будет идти редирект. Если у страницы на вашем сайте просто изменился url, то вписывайте новый url страницы. В иных случаях, подберите самую релевантную на ваш взгляд страницу, основываясь на тексте страницы-донора и анкоре.
(кликните на изображение для увеличения)
Настройка 301 редиректа на новые страницы
В конце осталось добавить в файл «.htaccess» необходимые команды для редиректа. Для перенаправления с одной страницы на другую используется следующая команда:
Redirect 301 /bityj-adres.html http://site.ru/novyi-klassnyi-adres.html
Для каждого адреса итоговой таблицы нужно написать такую команду и добавить в файл «.htaccess». На этом этапе я рекомендую воспользоваться услугами программиста, чтобы все работало правильно.
В итоге мы бесплатно получим ссылочный вес, просто за счет того, что не будем его терять.
Автор: Nikita Sawinyh, руководитель SEO студии sawinyh.ru, специалист по продвижению крупных проектов.
Nikita в соцсетях: Facebook | Twitter
Обновлено 19.01.2017
Всем привет сегодня расскажу, что такое error 404 pages на сайте и как нам сделать, чтобы их было меньше. Рассмотрим, хорошо это или плохо. Как найти у вас на сайте все не существующие страницы error 404 pages. Поверьте моему опыту, если вы за этим не следите, то вы сами, своими руками топите ваш проект, так как интернет и поисковые роботы постоянно изменяются, вводя новые алгоритмы и никогда не знаешь, где и когда может появится в индексе куча мусора, ведущего на ваш сайт.
Что такое error 404 not found
И так сообщение error 404 pages, означает, что при попадании на нужный вам ресурс, страница которую вы искали уже не существует или ее не было. 404 код сообщает браузеру, что не то ты ищешь, нет меня уже. Сделана специально, для донесения браузерам и поисковым ботам, что страницы не существует.
Хорошо или плохо когда выскакивает ошибка 404
Как я и писал выше сама директива в себе ничего плохого не несет, а вот большое их количество в поисковой выдаче очень плохо, так как отсылает пользователя на не существующие ресурсы, тем самым понижая доверие к ресурсу. Еще представим у вас была страница, но вы ее в последствии удалили, а ссылка на нее есть в поисковой выдаче, у этой страницы раньше был некий статический вес, некая такая пискомерка, по которой поисковики смотрят крутость страницы, и если ее нет то и этот вес утекает в никуда и его хорошо бы пока страница полностью не вылетела из индекса, перевести в нужное вам место, для этого придуманы перенаправления или redirect.
Как найти страницы с error 404
Вариантов, на самом деле очень много, приведу самые полезные и бесплатные с моей точки зрения.
Google.com/webmasters
Гугл webmasters, это личный кабинет куда вы добавляете свой сайт. В данном кабинете можно мониторить сайт по различным параметрам, таким как
- Сколько страниц проиндексировалось
- Какие проблемы есть с HTML
- Количество поисковых запросов в месяц
- Ошибок сканирования
Нам как раз и нужен пункт ошибки сканирования, они нам и покажут все страницы найденные ботами гугла, которые отдают код 404.
Со временем бот может еще находить страницы, так, что периодически поглядывайте туда
Можно посмотреть более детально, что именно не найдено, сверху вы увидите ссылку, если вы ее поправили можно нажать кнопку Отметить как исправленный.
Webmaster.yandex.ru
У Яндекса так же можно найти не существующие страницы (error 404 pages), так же переходим по адресу указанному в заголовке. Тут нас будет интересовать пункт Исключенные страницы, со статусом Ресурс не найден (404)
Посмотрите их более детально, удобно сделан график показывающий, какая тенденция у вас не существующих страниц, она должна стремиться к нулю.
Утилита XENU
Есть бесплатная утилитка XENU. Скачать XENU можно тут. Смысл ее во в чем, вы указываете какой сайт нужно сканировать
Начнется, довольно продолжительное сканирование, все зависит от размера сайта. В итоге вы получите список ссылок. Где вы увидите зеленые и красные, как понятно, все в идеале должно быть зеленым, кроме того, что вы сами заблокировали.
Для фильтрации, только красных ссылок, откройте View > Show broken links only
В итоге вы уже получаете список с краснотой, который следует изучить и фиксить, тем самым вы будите делать ваш сайт лучше в глазах поисковых систем.
Как победить error 404 pages
И так напомню у меня сайт на движке wordpress, а это значит, что эту задачу уже давно решили. Самый правильный вариант это использование файла htaccess, в котором нужно сделать 301 редирект (при 301 редиректе произойдет склейка старого и нового адресов: параметры вроде PageRank и тИЦ), но для новичков это бывает сложновато, это требует знать синтаксис и лезть на ftp сервер хостинга. Нас же спасет простой плагин, не нагружающий сервер, который в два клика победит данную проблему. Плагин Redirection нам поможет. Как устанавливать плагины WordPress я рассказывал вот тут, советую ознакомиться. После установки вы идете в Инструменты > Перенаправления
Предположим у меня есть вот такая страница выдающая 404 ошибку, копирую ее адрес.
Создаю новое правило, в котором в источнике пишу страницу, которой уже не существует, а в адресе назначения главную страницу сайта, на нее я и буду перенаправлять.
Новое перенаправление добавлено.
Проверяем его, должно все работать. Если все ок не забудьте в гугле пометить, что вы это исправили.
Выводы
- Старайтесь минимизировать количество не существующих страниц в индексе сайта, делайте 301 редирект
- Не забывайте отмечать исправлено в кабинете Гугл
- К сожалению Яндекс не дает такую возможность пометки, но в любом случае исправляйте, что он нашел
- Закрывайте от индексации в файле robots.txt, все не нужное, нечего ему делать в индексе
Материал сайта pyatilistnik.org