PromoPult Выпуск №36: Настройки веб-сервера  
 
 
Уважаемые читатели!

В Обучающем Центре CyberMarketing открыта регистрация на новые курсы:

«Блоги – маркетинговый инструмент и возможность заработать» (Дмитрий Голополосов);

«Новые возможности PR. Эффективная работа в интернете» (Наталья Спиридонова, Константин Леонович).

Зарабатываем на сайтах. Ваши доходы в цифрах и фактах (Алексей Штарев).

Обратите внимание, что еженедельные семинары по контекстной рекламе и поисковому продвижению продолжаются – это отличный старт для начинающих! Также рекомендуем не пропустить уникальный бесплатный семинар Анара Бабаева «Контекстная реклама для интернет-магазинов», который назначен на 16 марта. Регистрируйтесь!

С уважением, Сергей Баиров, директор по маркетингу Системы PromoPult.

 
 
SEO-технологии

 
 
Настройки веб-сервера

В выпуске №11 мы рассказывали о том, что можно (и нужно) делать c веб-сервером при оптимизации сайта. Но за скобками остался важный вопрос: «Как все это делать?». На семинарах в Обучающем Центре CyberMarketing мы выяснили, что многие знакомы с базовыми принципами продвижения сайта, но когда речь заходит о выполнении конкретных действий (например, «настройте в .htaccess редирект по определенному правилу»), почти все начинают «плавать» – знаний не хватает.

При этом нужно понимать, что создание качественной входящей ссылочной массы (то есть работа с внешними факторами ранжирования поисковых систем) автоматизируется Системой PromoPult, то внутренняя оптимизация – дело вебмастера и владельца сайта. Да, PromoPult выдает рекомендации по доработке ресурса, но при этом выполнить их должен администратор ресурса. К счастью, практически все пользователи Системы понимают необходимость выполнения самой важной рекомендации – оптимизации контента по принципу «оригинальность + достаточный объем + вхождения ключевых словосочетаний». Однако есть не столь явные, заметные и понятные моменты, которые оказывают, тем не менее, очень серьезное влияние на процесс вывода сайта в ТОП. Например, настройки веб-сервера, если рассматривать их с точки зрения оптимизации, определяют наличие или отсутствие дублей в индексах поисковых систем – а это одна из самых важных вещей во всей внутренней оптимизации.

Поскольку самым распространенным веб-сервером для небольших и средних по размеру сайтов является, безусловно, Apache, остановимся на его основных настройках.

Обратите внимание, что веб-серверы все же бывают разные. Прежде, чем пытаться применить код, представленный ниже, убедитесь, что ваш сайт работает на хостинге, где установлен именно Apache.

Обязательно проверьте, какой код в .htaccess добавляет CMS вашего сайта. Не допускайте конфликтующих выражений. В первую очередь попробуйте добиться нужных результатов с помощью настроек CMS.

Веб-сервер – это программа, которая запущена на компьютере (его тоже называют «сервером», не запутайтесь!), установленном в дата-центре хостинг-провайдера. Задача веб-сервера – принимать и обрабатывать HTTP-запросы, а также отправлять запрошенные данные (которые могут формироваться другим программным обеспечением, установленным на сервере – например, системой управления контентом).


Как добраться до файла с настройками Apache


Основа основ – файл .htaccess. Это обыкновенный текстовый файл, который нужно создать в стандартной программе «Блокнот» и разместить в корневом каталоге сайта.

Кстати, «корневой каталог сайта» тоже часто вызывает вопросы у новичков. Отвечаем: сайт лежит на сервере как обычный каталог (папка) с подкаталогами, в которых находятся файлы. Удобнее всего работать с каталогами и файлами сайта с помощью FTP-клиента. Имея логин и пароль (их предоставляет хостер), можно зайти в папку, где лежит ваш сайт – это и есть корневой каталог. Именно в нем нужно размещать файлы robots.txt и .htaccess.


В подавляющем большинстве случаев .htaccess уже будет лежать в корневом каталоге, так что можно просто редактировать его в «Блокноте» или встроенном редакторе FTP-клиента.

Что писать в .htaccess


В этом настроечном файле можно писать как правила работы для ядра Apache, так и для подключаемых модулей, из которых для нас интерес представляет mod_rewrite. (Во времена оны нужно было убедиться, что хостер его установил. Но в 2011-м году крайне сложно найти хостинг-провайдера, не подключающего этот модуль Apache, так что беспокоиться не стоит).

Несмотря на упрощенность (все ненужное простому оптимизатору таинство Apache сконцентрировано в другом файле настроек – httpd.conf), полные перечени функций и базового синтаксиса доступных настроек [http://httpd.apache.org/docs/2.2/howto/htaccess.html] и, в частности, настроек mod_rewrite [http://www.egoroff.spb.ru/portfolio/apache/mod_rewrite.html] – немаленькие документы. Веб-разработчик может получить абсолютно полный контроль над сервером, но, к счастью, поисковая оптимизация этого не требует. Вполне достаточно знать основные команды!

Комментарий в .htaccess предваряется символом # – строку, перед которой стоит решетка, веб-сервер обрабатывать не будет. Комментируйте даже такой небольшой код, как правила для Apache, и вы даже через год или два сможете легко вспомнить, зачем нужна та или иная настройка.

  1. Главная страница без дублей

    Обычно код главной страницы физически расположен в файле /index.html (или index.php – для большинства динамических сайтов), но сайт должен открываться по любому из запросов: yoursite.ru, yoursite.ru/index.html, www.yoursite.ru и www.yoursite.ru/index.html. Но для поисковых систем это четыре разных URL! Если не настроить .htaccess верно, поисковик добавит в свой индекс четыре одинаковых страницы. Это признак некачественного сайта. Избежать этой проблемы можно с помощью такого кода в .htaccess:

    Options +FollowSymLinks
    RewriteEngine on
    RewriteCond %{HTTP_HOST} ^yoursite.ru
    RewriteRule (.*) http://www.yoursite.ru/$1 [R=301,L]
    RewriteCond %{THE_REQUEST} ^[A-Z]{3,9} /index.html HTTP/
    RewriteRule ^index.html$ http://www.yoursite.ru/ [R=301,L]

    Все страницы-дубли будут склеены редиректом с кодом 301 («постоянное перемещение») с главной страницей – http://www.yoursite.ru/. Перед этим, конечно, нужно проверить, как «Яндекс» проиндексировал сайт – с www или без. Желательно также назначить совпадающее основное зеркало в файле robots.txt.


  2. Строгий URL страницы 404

    Чтобы убедиться, что сервер будет выдавать именно ту страницу 404, которую вы подготовили и создали, а не служебную или какую-либо еще, добавьте такую строчку:

    ErrorDocument 404 http://www.yousite.ru/404.php

    Аналогично можно указать страницы и для других ошибок.


  3. Постраничный и групповой редиректы

    Перенаправить с одной страницы на другую можно с помощью директивы Redirect:

    Redirect 301 /old.html http://www.yoursite.com/new.html

    Для группового редиректа нужно использовать RedirectMatch – эта команда маски URL и имен файлов.


  4. Сохранение файлов вместо открытия

    Многие видели, как при попытке скачать архив с расширением .rar браузер открывает его в виде простого текста из мешанины символов. Это значит, что на сервере сайта не настроено принудительное сохранение типов файлов, которые не должны открываться в браузере.

    AddType application/octet-stream .rar .doc .mov .avi .pdf .xls .mp4

    Можно добавить и другие расширения.


  5. Настройка ЧПУ (человекупонятных URL)

    Настоятельно рекомендуем использовать настройки, которые предоставляет ваша CMS. Собственно, непонятные длинные URL возникают только при использовании CMS (на статическом сайте их не бывает). Следовательно, используйте настройки и модули CMS для настройки – во всех современных движках такие возможности есть.

    Для их корректной работы в .htaccess должна быть строчка RewriteEngine On (включение mod_rewrite). Настройка же ЧПУ с помощью «голого» .htaccess – дело достаточно кропотливое. Например, чтобы превратить URL типа www.yoursite.ru/script.php?tv=123 в более понятный www.site.ru/samsung/tv/123/, пишем вот такие строчки (RewriteEngine On нужно писать в том случае, если раньше в .htaccess mod_rewrite еще не был подключен):

    RewriteEngine on
    RewriteRule samsung/(.*)/(.*)/$ /script.php?$1=$2

    Понятно, что для успешной настройки ЧПУ таким способом нужно освоить весь синтаксис .htaccess и немало потрудиться. Гораздо проще, повторимся, пользоваться средствами CMS.


  6. Дубли страниц без слэша в конце URL

    Чтобы предотвратить ситуацию с индексированием страниц www.yoursite.ru/about и www.yoursite.ru/about/ как разных, ставим следущий код:

    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteCond %{REQUEST_URI} !(.*)/$
    RewriteRule ^(.*)$ /$1/ [R=301,L]

    Со страниц без слэша будет установлен редирект на «слэшевые».
Все приведенные выше примеры не стоит бездумно копировать в .htaccess вашего сайта. Разберитесь, есть ли у вашего сайта описанная проблема, можно ли ее решить с помощью приведенного выражения, а потом уже правьте код. Обязательно сохраните копию файла .htaccess до того, как начнете вносить изменения!

Важная рекомендация: поищите в интернете оптимальные настройки .htaccess для вашей системы управления контентом. У всех CMS есть свои особенности – например, это специфические URL’ы страниц-дублей, с которых нужно ставить редирект (и закрывать их от индексации). Для большинства популярных CMS можно найти уже готовые правила для .htaccess.

 
 
Интересное на iTV

 
 
Расширяйте кругозор, улучшайте профессиональные навыки и развлекайтесь с пользой! Представляем самые интересные из новых записей в архиве сайта телеканала об интернете iTV:

Тимофей Горшков из InSales рассказывает о создании интернет-магазинов, реально способных продавать товары;

Денис Кучумов, известный SEO-блоггер, делится секретами заработка на контекстной рекламе;

Татьяна Коканович из Advert.ru рассказывает о том, как поддержать баннерами контекстную и поисковую рекламную кампании.

Следите за обновлениями:
 
 
Новости рынка поискового продвижения

 
 
«Яндекс» выйдет на IPO

По данным Bloomberg, «Яндекс» собирается привлечь средства частных инвесторов с помощью IPO. Инсайдерская информация говорит о достаточно скромном для компании с такой серьезной долей поискового рынка объеме выпуска акций: около одного миллиарда долларов. Судя по всему, акции выйдут на бирже NASDAQ уже этим летом.

Комментарий PromoPult

У этой новости есть три интересных последствия: 1) «Яндекс» получит солидный капитал, который сможет употребить на радикальное усовершенствование технологий поиска; 2) финансовые отчеты станут еще прозрачнее и подробнее; 3) каждый из нас сможет приобрести несколько акций «Яндекса» – возможно, они будут расти в цене так же, как растут акции Apple. :)


Google борется с ГС


24 февраля в блоге Google появилась запись о внедрении усовершенствований в алгоритм поисковика. Никаких радикальных новшеств: усилен негатив к неоригинальному контенту, учтены мнения «добровольных асессоров», установивших в браузере Chrome расширение Personal Blocklist. Нововведение пока действует только в Америке, подтверждая старую аксиому: google.com и google.ru – это «две большие разницы».

Комментарий PromoPult

Делайте хорошие, качественные сайты с оригинальным контентом. Эта рекомендация уже набила оскомину, но если вы хотите серьезно работать в интернете, привлекать клиентов, продавать свои товары и услуги, стоять в ТОП10 основных поисковиков, альтернативы нет.
 
 
 
Ответы на вопросы

 
 
Вопрос: Что такое «контент-ферма»?

Ответ: Модель используется на Западе, типичный представитель – Demand Media. Это сеть информационных сайтов, на которых размещается огромное количество материалов, оптимизированных под конкретные актуальные низкочастотные поисковые запросы. Сбор запросов, распределение техзаданий на тексты по огромной армии низкооплачиваемых авторов и размещение готовых материалов происходят автоматически. По сути, это система сбора трафика с целью продажи рекламы (контекстной и иной).


Вопрос: Что такое «гугл-боулинг»?


Ответ: Поскольку за границей конкуренция в интернете выше, а компании богаче, «пессимизация» сайтов конкурентов достаточно распространенное явление. Google bowling – это SEO-атака, целью которой является наложение фильтра и санкций на конкурирующие сайты. Как бы «от его имени» применяются методики «черного» SEO. В России подобные подвиги неактуальны – гораздо полезнее и эффективнее вложить деньги и ресурсы в развитие собственного сайта.


 
     
 
PromoPult.ru: автоматизированное продвижение сайтов seo@promopult.ru