Как найти все 404 страницы на сайте

Разбираемся, как на сайте найти страницы с ошибкой 404: расширения, плагины, приложения и программы

Один из главнейших факторов, который отталкивает пользователя от сайта ,— это появление страниц с ошибкой 404 Not Found. Появление таких ошибок негативно сказывается на отношении к сайту с точки зрения поисковых систем Яндекса и Google.

Лучший инструмент для автоматизации Facebook | Забирай скидку 20%

Лучший инструмент для автоматизации Facebook | Забирай скидку 20%

Во-первых, из-за этого внешние ссылки теряют свой вес, что ухудшает ранжированность и всего сайта.

Во-вторых, теряется вес внутренней перелинковки — особенно при круговой перелинковке — что также снижает трастовый вес других, действующих страниц.

Почему появляется ошибка 404

Наиболее частотный случай появления такой ошибки вызван неправильным вводом адреса страницы со стороны пользователя. Однако здесь ничего нельзя поделать — повлиять на них и научить вводить правильные адреса проблематично. Поэтому, очевидно, стоит сосредоточиться на других вариантах — когда появление 404 ошибки вызвано проблемами на стороне сайта.

Таких проблем может быть две:

  1. Страница по каким-либо причинам была удалена;
  2. У страницы был изменен URL без настройки редиректа на новый — поэтому абсолютно все внешние ссылки на такую страницу перестали быть рабочими.

Как уже было сказано выше, такие страницы нужно находить и ошибки исправлять. Сделать это можно несколькими способами.

Поиск ошибки 404 через Яндекс Вебмастер

У Вебмастера есть специальный инструмент для поиска ошибок 404. Для этого вам будет достаточно перейти в раздел «Индексирование» → «Статистика обхода»

Поиск ошибки 404 через Яндекс Вебмастер

Поиск ошибки 404 в панели вебмастеров Google

Аналогичная возможность поиска 404 ошибки представлена и у Google. Для этого нужно открыть раздел «Обзор» и перейти там во вкладку «Покрытие». Здесь будут сразу представлены все страницы с ошибкой, которые были найдены поисковой системой.

Поиск ошибки 404 в панели вебмастеров Google

Необходимо отметить, что это достаточно быстрый и удобный способ поиска страниц с ошибкой 404. Однако ни Яндекс, ни Google не находят их все. Поэтому есть смысл попробовать воспользоваться другими способами.

Поиск ошибки 404 с помощью программы Netpeak Spider

Если у вас уже установлен этот сервис, то вы сможете легко найти все ошибки 404 на вашем сайте. 

Последовательность действий такая:

  1. Откройте программу;
  2. Во вкладке «Параметры» выберите «Минимум», чтобы искать только 404 ошибку;
  3. Нажмите старт.

В полученном отчете будут указаны два параметра:

Поиск ошибки 404 с помощью программы Netpeak Spider

Это непосредственно сами страницы с ошибкой 404 и, что очень важно, ссылки, которые ведут на такие страницы.    

Поиск ошибки 404 с помощью сервиса Serpstat

  1. Пройдите процесс регистрации и добавьте свой сайт в проект;
  2. В колонке «Аудит сайта» нажмите «Запустить аудит»;
  3. Нажмите «Начать анализ».

Поиск ошибки 404 с помощью сервиса Serpstat

После завершения обработки откройте отчет «Код ответа: 4xx». Там вы найдете все страницы с ошибкой 404.

Что делать с ошибкой 404

Порядок действий достаточно прост:

  • Все ссылки на страницы с 404 ошибкой нужно заменить на рабочие;
  • Если ссылку заменить не получится (например, потому что страница была удалена), то и ссылку нужно просто удалить.

Проверьте, не нужно ли удалить страницу с такой битой ссылкой из индекса поисковых систем, чтобы Яндекс и Google перестали приводить к вам пользователей на несуществующую страницу.

Однако полностью избавиться от появления 404 ошибки у вас не получится — ведь довольно часто ошибка появляется по причине того, что сами пользователи неверно вводят URL.

Однако и здесь вы сможете максимально улучшить опыт использования вашего сайта. Для этого достаточно наполнить страницу с 404 ошибкой полезной информацией:

  • Дайте ссылку на главную страницу;
  • Выложите другую полезную информацию;
  • Дайте доступ к возможности поиска по сайту;
  • Если это необходимо, оставьте свои контакты для связи.

Благодаря этому пользователю не захочется убежать сразу же с вашего сайта и начать искать информацию где-нибудь ещё.

Заключение

Ошибка 404 может серьезно повлиять на трафик вашего сайта, поэтому так важно вовремя ее «найти и обезвредить». Посему мы советуем вам регулярно проводить подобные «облавы» — то есть проверки на наличие ошибок. Тем самым вы позитивно повлияете на отношение к вашему сайту как с точки зрения поисковиков, так и пользователей.

Довольно широко распространена ситуация, когда мы, пользователи, натыкаемся на несуществующие страницы с кодом ответа 404 Not Found. Такие страницы есть на любом сайте, достаточно лишь вбить в адресную строку URL с ошибкой. Но вот проблема — наличие внутренних ссылок на них обязательно к исправлению, и вот почему.

  • Поисковые роботы расходуют краулинговый бюджет при переходе на 404. Это приводит к тому, что они с меньшей вероятностью просканируют действительно полезные страницы с новым контентом.
  • Потеря веса внешних ссылок, которая несомненно скажется на ухудшении в ранжировании этой страницы, а возможно и всего сайта.
  • Ухудшение пользовательского опыта. Если на каждом углу посетитель сайта наталкивается на 404 страницу с грустной надписью «Not Found» он с большой вероятностью покинет сайт.

Какие причины приводят к 404

Вызывать эту ошибку могут следующие причины:

  • Неправильный URL-адрес. Довольно часто пользователи просто опечатываются.
  • Страница была удалена.
  • URL-адрес страницы был изменен без настройки редиректов. Это привело к тому, что если пытаться перейти по старому адресу (например, по ссылке с другого сайта или закладок) возникнет ошибка 404.

Помочь найти страницы с 404 ошибкой помогут панели для вебмастеров.

Что делать

Сами по себе 404 ошибки являются нормальной практикой, но те ссылки, которые на них ведут — довольно неприятное явление. Постарайтесь как можно быстрее от них избавиться, изменив на корректные либо вовсе удалив. Так вы значительно меньше будете растрачивать краулинговый бюджет поисковых роботов, а чтобы сократить вероятность ухода с сайта живых людей, при попадании на такую страницу, правильно оформляйте страницу 404. Это тема нашей следующей статьи.

Как узнать сколько пользователей зашли на 404 страницу

Наиболее эффективный способ — создать цель в Яндекс.Метрике и отслеживать её.

После создания цели в Метрике установите на 404 страницу следующий код:

<script> window.onl oad = function (){ yaCounterXXXXXXX.reachGoal(‘404’); } </script>

XXXXXXX — номер вашего счетчика.

После этого вы сможете отслеживать трафик на 404 странице. Подобным образом можно сделать и в Google Analytics.

Содержание статьи

  1. Чем вредны страницы 404 для сайта?
  2. Как появляются страницы 404?
  3. Как обнаружить страницы 404?
    1. Поиск ошибок в Google Search Console
    2. Поиск ошибок в Google Analytics
    3. Анализ сайта программой ScreamingFrog
    4. Поиск ошибок с помощью расширения Check My Links
  4. Что делать со страницами 404?
  5. Примеры оригинального оформления страницы с 404 ошибкой
  6. Заключение

Появление страницы 404 означает, что сайт не смог найти запрошенную страницу, поскольку она не существует. Эта ошибка создает много проблем при оптимизации сайта. В этой статье мы хотим рассказать какими способами можно их находить и устранять.

Чем вредны страницы 404 для сайта?

Страницы с кодом ответа сервера 404 есть на любом сайте, чтобы на них попасть нужно ввести в адресную строку браузера несуществующий адрес страницы.

Страница 404 на сайте Webmaestro

Если ошибка 404 возникает из-за удаления страницы или «битой» ссылке на сайте, это плохо сказывается на продвижении.

А все потому, что:

  1. Потерпают поведенческие факторы
    Пользователям не нравятся сайты с неработающими страницами. Они быстро покидают такие сайты и редко возвращаются.
  2. «Сливается» впустую краулинговый бюджет
    Любой сайт имеет ограниченный краулинговый бюджет и поисковые роботы не могут проиндексировать много страниц сразу.  И если при сканировании сайта возникает много 404 страниц – низкая вероятность того, что роботы доберутся до новых или обновленных страниц.
  3. Утрачивается ссылочный вес
    При удалении страницы все ссылки, которые ведут на нее или с нее уходят в никуда.

Ссылки ведущие на страницы 404 носят название «битые» и плохо влияют на раскрутку сайта. Таким образом, при удалении страниц, удаляйте или заменяйте ссылки ведущие на них.

Как появляются страницы 404?

Причин возникновения 404 ошибок несколько:

  1. Неправильное написание УРЛа.
  2. Удаление страницы.
  3. Страница переведена на новый адрес, а редирект не настроен.

В независимости от причины возникновения страниц 404 их обязательно нужно исправлять.

Как обнаружить страницы 404?

Существует много способов проверить сайт на наличие страниц 404, но мы рекомендуем использовать сразу все описанные ниже.

Поиск ошибок в Google Search Console

  1. Зайдите в панель для вебмастеров Google и перейдите на вкладку «Покрытие».
  2. Если кликните по вкладке «Ошибка» – Вам откроется список страниц с ошибкой 404.
    Поиск страниц 404 в GSC

Поиск ошибок в Google Analytics

Узнать сколько пользователей столкнулось с ошибкой на сайте можно в сводке по страницам.

  1. Нажмите на пункт меню Поведение/Контент сайта/Все страницы.
    Поиск страниц 404 в GA
  2. Отсортируйте страницы по названию «Страница не найдена» или «404» в зависимости от того, как она называется на Вашем сайте.
    Ошибка 404 - Страница не найдена
  3. Нажмите «Название страницы» и с помощью кнопки «Еще» воспользуйтесь поиском по запросу «404» (или «Страница не найдена»):
    Поиск по запросу 404
  4. GA отфильтрует все страницы по заданному заголовку и покажет отчет по количеству сеансов, получивших код ответа 404:
    Страница с кодом 404
  5. Нажмите по названию страницы и получите список УРЛов с ошибкой 404, который нужно будет проработать:
    Список адресов страниц 404

Анализ сайта программой ScreamingFrog

  1. Пропишите адрес сайта и нажмите кнопку «Start».
    ScreamingFrog ввод сайта
  2. После завершения процесса сканирования перейдите во вкладку «Response Codes» — там Вы увидите список всех страниц с кодом 404.
    Коды ответов страниц в ScreamingFrog

Поиск ошибок с помощью расширения Check My Links

  1. Установите в Google Chrome специальное расширение Check My Links
  2. Введите в поисковую строку Google адрес сайта с оператором «site:»
    и увидите все проиндексированные страницы Вашего сайта и коды их ответа:
    Расширение Chek My Links

Что делать со страницами 404?

Если Вы обнаружили страницы 404 – нужно немедленно от них избавляться.
Способы устранения ошибок 404:

  1. Замена неработающих ссылок на работающие.
  2. Удаление всех ссылок ведущих на страницы 404.
  3. Удаление страниц 404 из индекса поисковых систем.
    О том, как удалить страницы из индекса Google узнаете в справке. 

Примеры оригинального оформления страницы с 404 ошибкой:

Пример 1 оригинальной страницы 404 

 Пример 2 оригинальной страницы 404

Пример 3 оригинальной страницы 404 

 Пример 4 оригинальной страницы 404

Пример 5 оригинальной страницы 404 

Заключение

От страниц 404 полностью избавится невозможно, ведь их могут допускать и сами посетители сайта. Но нужно сделать все, чтобы уменьшить их негативное влияние. Также важно правильно оформить неработающую страницу:

  1. Написать почему посетитель здесь очутился и что ему дальше делать.
  2. Предложить посетить главную страницу сайта или самые популярные разделы.
  3. Добавить форму поиска по сайту.
  4. Дизайн страницы 404 должен соответствовать оформлению сайта.
  5. Можно оставить контактную информацию.

Проводите регулярный аудит сайта для быстрого обнаружения и устранения 404 страниц! Если нужна помощь – обращайтесь!

12.2К
просмотров

Если у вас крупный сайт с большим количеством страниц, то поисковое продвижение такого проекта зачастую сводится к выявлению и устранению множества технических проблем.

Одной из распространенных ошибок является наличие битых ссылок на страницы с кодом ответа «404 not found». Более того, на страницы с 404 ошибкой могут вести ссылки с других сайтов, при этом их вес будет потерян. В этой статье вы узнаете как вернуть потерянный вес внешней ссылочной массы.

«Я вам точно могу сказать, что на более или менее крупном сайте все время что-то ломается»
— Михаил Сливинский (Wikimart.ru), SEO Conference 2014.

Суть метода

Ссылки с других сайтов не передают вес, если ведут на битые страницы на вашем сайте. Задача состоит в том, чтобы настроить перенаправление (301 редирект) с несуществующих страниц, имеющих входящие ссылки, на другие подходящие страницы на сайте. Таким образом, вес входящих внешних ссылок начнет передаваться сайту.

Этот метод подойдет скорее проектам с возрастом и большим количеством страниц. Алгоритм работы следующий:

1. Поиск и составление списка страниц с 404 ошибкой.
2. Проверка полученных url-адресов на наличие входящих внешних ссылок.
3. Установка 301 редиректа с битых страниц на подходящие рабочие страницы.

На этом этапе нужно выявить на сайте несуществующие страницы, страницы с ошибками и составить как можно более подробный список url-адресов. Для этого есть несколько инструментов, которые далее будут рассмотрены подробно.

Панели Яндекс.Вебмастер и Google Webmaster Tools

Если ваш сайт еще не добавлен в панели для вебмастеров Яндекс и Google, то обязательно добавьте его сейчас. Так вы сможете своевременно выявлять битые ссылки и другие ошибки индексации.

Чтобы получить список страниц с 404 ошибкой в панели Яндекс.Вебмастер, перейдите на http://webmaster.yandex.ru/sites/ в раздел «Индексирование сайта» → «Исключенные страницы».

(кликните на изображение для увеличения)
404 ошибки в панели для вебмастеров Яндекса

Перейдя по ссылке «HTTP-статус: Ресурс не найден (404)» вы получите список найденных страниц с 404 ошибкой. Данный список можно экспортировать в удобном для вас формате.

(кликните на изображение для увеличения)
Экспорт страниц с ошибками из Яндекс Вебмастера

Для получения списка несуществующих страниц из панели Google Webmaster Tools (https://www.google.com/webmasters/tools/) перейдите в по ссылке «Ошибки сканирования».

(кликните на изображение для увеличения)
Ошибки сканирования в панели вебмастеров Google

На странице будет список url-адресов с ошибками. Экспортировать список можно, нажав кнопку «Загрузка» и выбрав удобный формат выгрузки.

(кликните на изображение для увеличения)
Экспорт страниц с ошибками в Google Webmaster Tools

Программы «краулеры»

Тут можно выделить известные программы для поиска битых ссылок и дубликатов:

— Xenu Link Sleuth
— Screaming Frog Seo Spider
— Netpeak Spider

Все они позволяют найти на сайте и выгрузить список страниц с 404 ошибкой. Я для этих целей пользуюсь Screaming Frog Seo Spider, так как у него есть версия под Mac, в отличие от остальных. На примере Screaming Frog список 404 страниц выгружается так:

(кликните на изображение для увеличения)
Поиск битых ссылок в Screaming Frog SEO Spider

Журнал ошибок сервера

Если есть такая возможность, то стоит просмотреть журнал ошибок сервера. Обычно это файл «error_log». В зависимости от используемого ПО на сервере, журнал ошибок может отличаться. Но суть все равно одна — просмотреть журнал ошибок сервера и выгрузить из него список url-адресов с 404 ошибкой.

Полученные списки ссылок нужно объединить в один список и удалить дубликаты. Для этого есть множество способов, но я использую текстовый редактор Sublime Text 2 (на Windows рекомендую Notepad++ с плагином TextFX).

(кликните на изображение для увеличения)
Удаление дубликатов с помощью Sublime Text

Проверка списка битых страниц на наличие входящих ссылок

Для проверки итогового списка url-адресов на наличие входящих ссылок с других сайтов используется сервис Ahrefs.com, а именно раздел «Batch Analysis» – https://ahrefs.com/labs/batch-analysis/.

(кликните на изображение для увеличения)
Массовый анализ ссылок в Ahrefs

К сожалению, у данной функции есть ограничение в 200 url за 1 запрос на платных тарифах и в 2 url за 1 запрос на бесплатном. Поэтому нужно вбить свой список в несколько порций по 200 адресов. После каждой проверки нужно сделать экспорт в файл.

(кликните на изображение для увеличения)
Анализ страниц в Ahrefs

Полученные выгрузки по 200 url нужно объединить в 1 таблицу. Для этого нужно открыть 1 файл и копировать в конец содержимое других файлов. Лишние столбцы можно удалить. Нас интересует только столбец «Total», он означает общее количество внешних ссылок на страницу.

(кликните на изображение для увеличения)
Список URL-адресов из сервиса Ahrefs

Полученный список нужно отсортировать и удалить строки, в которых «Total» равен нулю. В итоге у вас получится список битых страниц, которые имеют входящие ссылки с других сайтов.

Подбор страниц для редиректа

Полученный список нужно снова загрузить в Batch Analysis на Ahrefs, чтобы можно было посмотреть с каких сайтов и с какими анкорами стоят ссылки на каждую страницу нашего списка. Для этого используем иконку рядом с url-адресом.

(кликните на изображение для увеличения)
Детали анализа конкретного адреса

Далее нужно посмотреть с каких страниц и с какими анкорами ссылались внешние сайты. Для удобства создайте таблицу с двумя колонками, в которой будет список битых адресов и список «живых» адресов, на которые будет идти редирект. Если у страницы на вашем сайте просто изменился url, то вписывайте новый url страницы. В иных случаях, подберите самую релевантную на ваш взгляд страницу, основываясь на тексте страницы-донора и анкоре.

(кликните на изображение для увеличения)
Список ссылок для редиректа

Настройка 301 редиректа на новые страницы

В конце осталось добавить в файл «.htaccess» необходимые команды для редиректа. Для перенаправления с одной страницы на другую используется следующая команда:

Redirect 301 /bityj-adres.html http://site.ru/novyi-klassnyi-adres.html

Для каждого адреса итоговой таблицы нужно написать такую команду и добавить в файл «.htaccess». На этом этапе я рекомендую воспользоваться услугами программиста, чтобы все работало правильно.

Никита Саввиных - специалист по продвижению крупных проектов В итоге мы бесплатно получим ссылочный вес, просто за счет того, что не будем его терять.

Автор: Nikita Sawinyh, руководитель SEO студии sawinyh.ru, специалист по продвижению крупных проектов.

Nikita в соцсетях:  Facebook  |  Twitter

Обновлено 19.01.2017

error 404 pages

Всем привет сегодня расскажу, что такое error 404 pages на сайте и как нам сделать, чтобы их было меньше. Рассмотрим, хорошо это или плохо. Как найти у вас на сайте все не существующие страницы error 404 pages. Поверьте моему опыту, если вы за этим не следите, то вы сами, своими руками топите ваш проект, так как интернет и поисковые роботы постоянно изменяются, вводя новые алгоритмы и никогда не знаешь, где и когда может появится в индексе куча мусора, ведущего на ваш сайт.

Что такое error 404 not found

И так сообщение error 404 pages, означает, что при попадании на нужный вам ресурс, страница которую вы искали уже не существует или ее не было. 404 код сообщает браузеру, что не то ты ищешь, нет меня уже. Сделана специально, для донесения браузерам и поисковым ботам, что страницы не существует.

Хорошо или плохо когда выскакивает ошибка 404

Как я и писал выше сама директива в себе ничего плохого не несет, а вот большое их количество в поисковой выдаче очень плохо, так как отсылает пользователя на не существующие ресурсы, тем самым понижая доверие к ресурсу. Еще представим у вас была страница, но вы ее в последствии удалили, а ссылка на нее есть в поисковой выдаче, у этой страницы раньше был некий статический вес, некая такая пискомерка, по которой поисковики смотрят крутость страницы, и если ее нет то и этот вес утекает в никуда и его хорошо бы пока страница полностью не вылетела из индекса, перевести в нужное вам место, для этого придуманы перенаправления или redirect.

Как найти страницы с error 404

Вариантов, на самом деле очень много, приведу самые полезные и бесплатные с моей точки зрения.

Google.com/webmasters

Гугл webmasters, это личный кабинет куда вы добавляете свой сайт. В данном кабинете можно мониторить сайт по различным параметрам, таким как

  • Сколько страниц проиндексировалось
  • Какие проблемы есть с HTML
  • Количество поисковых запросов в месяц
  • Ошибок сканирования

Нам как раз и нужен пункт ошибки сканирования, они нам и покажут все страницы найденные ботами гугла, которые отдают код 404.

Со временем бот может еще находить страницы, так, что периодически поглядывайте туда

Как найти страницы с error 404

Можно посмотреть более детально, что именно не найдено, сверху вы увидите ссылку, если вы ее поправили можно нажать кнопку Отметить как исправленный.

Побеждаем error 404 pages

Webmaster.yandex.ru

У Яндекса так же можно найти не существующие страницы (error 404 pages), так же переходим по адресу указанному в заголовке. Тут нас будет интересовать пункт Исключенные страницы, со статусом Ресурс не найден (404)

Побеждаем error 404 pages-2

Посмотрите их более детально, удобно сделан график показывающий, какая тенденция у вас не существующих страниц, она должна стремиться к нулю.

Побеждаем error 404 pages-3

Утилита XENU

Есть бесплатная утилитка XENU. Скачать XENU можно тут. Смысл ее во в чем, вы указываете какой сайт нужно сканировать

Утилита XENU

Начнется, довольно продолжительное сканирование, все зависит от размера сайта. В итоге вы получите список ссылок. Где вы увидите зеленые и красные, как понятно, все в идеале должно быть зеленым, кроме того, что вы сами заблокировали.

Утилита XENU-2

Для фильтрации, только красных ссылок, откройте View > Show broken links only

Утилита XENU-3

В итоге вы уже получаете список с краснотой, который следует изучить и фиксить, тем самым вы будите делать ваш сайт лучше в глазах поисковых систем.

Утилита XENU-4

Как победить error 404 pages

И так напомню у меня сайт на движке wordpress, а это значит, что эту задачу уже давно решили. Самый правильный вариант это использование файла htaccess, в котором нужно сделать 301 редирект (при 301 редиректе произойдет склейка старого и нового адресов: параметры вроде PageRank и тИЦ), но для новичков это бывает сложновато, это требует знать синтаксис и лезть на ftp сервер хостинга. Нас же спасет простой плагин, не нагружающий сервер, который в два клика победит данную проблему. Плагин Redirection нам поможет. Как устанавливать плагины WordPress я рассказывал вот тут, советую ознакомиться. После установки вы идете в Инструменты > Перенаправления

error 404 not found

Предположим у меня есть вот такая страница выдающая 404 ошибку, копирую ее адрес.

error 404 not found-2

Создаю новое правило, в котором в источнике пишу страницу, которой уже не существует, а в адресе назначения главную страницу сайта, на нее я и буду перенаправлять.

error 404 not found-3

Новое перенаправление добавлено.

error 404 not found-4

Проверяем его, должно все работать. Если все ок не забудьте в гугле пометить, что вы это исправили.

error 404 not found-5

Выводы

  • Старайтесь минимизировать количество не существующих страниц в индексе сайта, делайте 301 редирект
  • Не забывайте отмечать исправлено в кабинете Гугл
  • К сожалению Яндекс не дает такую возможность пометки, но в любом случае исправляйте, что он нашел
  • Закрывайте от индексации в файле robots.txt, все не нужное, нечего ему делать в индексе

Материал сайта pyatilistnik.org

Понравилась статья? Поделить с друзьями:
  • Как найти внутреннюю энергию твердого тела
  • Патент чеки как можно найти
  • Как найти регистрационное удостоверение на аппарат
  • Как найти емкость кабеля
  • Как найти темы на виндовс 7