Купить Корзина
  • Облако и IT-инфраструктура
  • Все решения
  • Сайт под ключ за 7 днейСоберём и запустим сайт для вашего бизнеса
  • Самостоятельный запуск сайтаПредоставим всё необходимое для самостоятельной сборки сайта: домен, конструктор сайтов, SSL
  • Корпоративная почта под ключНастроим почту на домене, перенесем письма со старого ящика. До 1000 адресов, до 10ГБ
  • Защита названия компании или продуктаСоберем портфель доменов, чтобы защитить название вашего бизнеса или продукта
  • Защита сайта и инфраструктураОбеспечим бесперебойную работу сайта, защитим его от DDoS-атак и кражи личных данных клиентов
  • Старт бизнеса в сфере услугПоможем вам запустить свое дело и привлечь первых клиентов
  • Аналитика ниши и товараПоможем найти нишу для торговли на маркетплейсах
  • Выход на маркетплейсыПредоставим обучение, проведем аналитику, найдем поставщиков и разработаем карточку товара
  • Продвижение услуг экспертаДадим инструменты, которые помогут поднять средний чек и привлечь новых клиентов
  • Зарегистрировать новый домен
  • Подбор домена по ключевому слову
  • Регистрация доменов списком
  • Освобождающиеся домены
  • Магазин доменов
  • Доменный брокер
  • Продление домена
  • Перенести домен в Рег.ру
  • Перенос домена между аккаунтами
  • WHOIS - проверить данные домена
  • Посмотреть историю изменений WHOIS
  • Переадресация домена
  • Парковочные страницы
  • Телефон в Москве

    +7 495 580-11-11
  • Бесплатный звонок по России

    8 800 555-34-78
  • Или обратитесь в наши офисы

    Региональные номера
    1. База знаний
    2. Классические VPS
    3. Проблемы с VPS
    4. Как снизить число запросов, ограничив доступ роботам на VPS

    Как снизить число запросов, ограничив доступ роботам на VPS

    Индексация сайта — важный элемент продвижения в поисковых системах. Индексируются сайты с помощью поисковых роботов (ботов), которые обращаются ко всем страницам ресурса и тем самым создают нагрузку на сервер.

    Кроме поисковых роботов существуют спам-боты, которые публикуют спам на сайте или собирают открытые данные (напр. email`ы пользователей) для спам-рассылки. Чем популярнее ваш сайт, тем больше поисковых ботов его посещают.

    Есть несколько способов как снизить нагрузку от поисковых ботов:

    С помощью файла robots.txt

    Файл robots.txt содержит в себе правила для поисковых роботов, с помощью которых можно ограничить количество и промежуток времени между индексациями сайта или вовсе её запретить. Как настроить robots.txt

    С помощью тега robots

    Тег robots управляет индексацией конкретной страницы. Данный тег необходимо добавить в разметку самой страницы с необходимыми параметрами:

    страница индексируется, робот идёт по ссылкам с этой страницы:

    <meta name="robots" content="index, follow"/>

    страница не индексируется, но робот идет дальше по ссылкам.

    <meta name="robots" content="noindex, follow"/>

    страница индексируется, но робот не идёт по ссылкам на другие страницы, т.е. он их не индексирует.

    <meta name="robots" content="index, nofollow"/>

    страница не индексируется, робот по ссылкам не идет. Если поместить такой код на все страницы сайта, он не проиндексируется.

    <meta name="robots" content="noindex, nofollow"/>

    С помощью .htaccess или nginx

    Если ваш сервер работает в связке apache + nginx, рекомендуем использовать блокировку через htaccess. Для сервера, который использует nginx + php-fpm, блокировку необходимо произвести с помощью nginx. Чтобы настроить блокировку с помощью .htaccess или nginx, необходимо выяснить *User-Agent`ов*, которые создают нагрузку на сервер. Преимущества .htaccess и nginx в том, что блокировка происходит на уровне сервера и данное ограничение срабатывает во всех случаях, в отличии от robots.txt, который многие роботы игнорируют.

    Получить список запросов можно с помощью скрипта, который отсортирует их, начиная с самых частых.

    Вывести список User-Agent`ов по названию:

    cat /var/www/httpd-logs/faq-reg.ru.access.log |/usr/bin/awk {'print $12'} | sort -n | uniq -c | sort -rn | head -20

    Вывести список IP-адресов, с которых поступают запросы:

    cat /var/www/httpd-logs/faq-reg.ru.access.log |/usr/bin/awk {'print $1'} | sort -n | uniq -c | sort -rn | head -20

    Вместо faq-reg.ru.access.log укажите вашего файла с логами.

    Внимание

    Расположение логов зависит от настроек вашего сервера. Для пользователей с панелью управления ispmanager файлы располагаются в директории: /var/www/httpd-logs/

    Блокировка через .htaccess

    Для блокировки с помощью .htaccess необходимо добавить правила в файл. В случае отсутствия вы также можете создать его, воспользовавшись инструкцией: У меня нет файла .htaccess, что делать.

    Для каждого бота, который необходимо заблокировать, добавьте в файле .htaccess строки:

    SetEnvIfNoCase User-Agent "^Name_of_bot_1" bad_bot
    
    SetEnvIfNoCase User-Agent "^Name_of_bot_2" bad_bot
    
    <Limit GET POST HEAD> 
    Order Allow,Deny 
    Allow from all
    Deny from env=bad_bot
    Deny from 123.123.123.123
    </Limit>

    где на место Name_of_bot_1 и Name_of_bot_2 подставлены названия User-Agent`ов, а для блокировки по IP-адресу в строке «Deny from 123.123.123.123» указан нужный IP.

    Сохраните изменения.

    Блокировка через nginx

    Для блокировки с помощью nginx необходимо добавить правила в файл конфигурации виртуального хоста faq-reg.ru.conf, где faq-reg.ru — имя вашего домена.

    Внимание

    Расположение файла конфигурации зависит от настройки вашего сервера. Если у вас заказана панель управления ispmanager, конфигурационные файлы находятся в директории: /etc/nginx/vhosts/username/

    Данные правила можно добавить в любую часть конфигурационного файла начиная с http {}. Добавьте в файл конфигурации следующие строки:

    if ($http_user_agent ~* (AhrefsBot|majestic) ) {
    
        return 403;
    }

    Вместо AhrefsBot|majestic укажите названия User-Agent`ов.

    Чтобы заблокировать определенный IP-адрес, необходимо добавить:

    deny 123.123.123.123;

    Вместо 123.123.123.123 укажите IP-адрес блокируемого хоста.

    Для блокировки локальных IP-адресов:

    location / {
      # блокировка одного локального адреса
      deny    192.168.1.1;
      # блокировка всех адресов подсети 192.168.1.0/24
      allow   192.168.1.0/24;
      # блокировка всех IP адресов
      deny    all;
    }

    Помогла ли вам статья?

    Спасибо за оценку. Рады помочь 😊

     👍
    Специальные предложения
    • Гранты для бизнеса до 500к
    • Скидки на cloud GPU до 50%
    • Скидки на bare-metal с А4000 и А5000
    • Кешбэк 100% на kubernetes
    • vk
    • telegram
    • ok
    • vc
    • dzen
    • rbc
    • Продукты
      • Домены
      • Хостинг
      • Почта
      • SSL-сертификаты
      • Конструктор сайтов
      • VPS и VDS серверы
      • Магазин доменов
      • Облако для бизнеса
    • Решения по сфере бизнеса
      • Подойдут всем
      • Маркетплейсы
      • Образование
      • Бьюти
      • Медицина
      • Автосервисы
      • Бытовые услуги
      • Досуг
      • Спорт
      • Все решения
    • Сервисы
      • Whois – проверить данные домена
      • Определить IP адрес
      • Проверить порт на доступность
      • Проверить IP адрес сайта
      • Перевести домен в Punycode
      • Проверить скорость интернета
    • Компания
      • О компании
      • Контакты
      • Офисы
      • Новости
      • Акции и скидки
      • Блог
      • Отзывы клиентов
    • Полезное
      • Стоимость услуг
      • Способы оплаты
      • Бонусная программа
      • Документы
      • База знаний
      • ЭДО
      • Партнерам
    • Другое
      • Сообщить о нарушении
      • РБК: новости России и мира сегодня
      • Новости компаний РФ
      • РБК Инвестиции: курсы валют
      • Спецпроект с Онлайн Патентом

    Облачная платформа Рег.ру включена в реестр российского ПО Запись № 23682 от 29.08.2024

    • mintsifry
    • icann
    • cctld
    © ООО «РЕГ.РУ»
    • Политика конфиденциальности
    • Политика обработки персональных данных
    • Правила применения рекомендательных технологий
    • Правила пользования и другие правила и политики
    • Используем куки, это делает удобнее вашу работу с сайтом