|| разделы:: | |
|| поиск по сайту:: | |
|| реклама:: | |
|| новости почтой:: | |
Популярные статьи |
|
Hot 5 Stories |
|
|| рекомендуем:: |
|
| |
Раскрутка сайта, поисковики и... mod_rewrite
Угу. Всем привет! Для кого предназначена эта статья - для веб разработчиков, для которых реально, что вся раскрутка сайта, которая ему (сайту) нужна, заключается в достижение высших позиций в наиболее популярных поисковых машинах по интересующим ключевым словам, ну и для остальных работников рекламы в интернете (для общего развития, так сказать :-)
ОК. Сразу к делу - как известно, не все еще люди научились пользоваться правильными поисковыми машинами типа Google или Yandex, многие (видать, по-старинке) продолжают использовать для поиска в Интернете поисковики НЕправильные. В чем различие между правильным и НЕправильным поисковиком? Навскидку, оных различий много, но одно из основных - это то, что НЕправильные поисковые машины НЕ индексируют сайты c динамическим содержимым . Мы здесь не будем показывать пальцем, но таких поисковиков достаточно много (например тот, который на "Ра" начинается и на "мблер" заканчивается).
И вот допустим, что вы решили создать и раскрутить сайт (реклама в интернете - великая вещь ;-) Да вот незадача - вы хотите иметь на оном сайте и гостевую книгу, и каталог товаров, и... И для этого сайт должен быть динамическим. И адреса у вас в оном каталоге будут типа ...?tovar=good&indexed=false - так что вышеупомянутый "мблер" оставит ваш сайт за бортом :-( Конечно, вы можете сказать - "Да мы раскрутим сайт и безо всякого там Рамблера! Да нам на Ра..." - расскажу вам историю двухнедельной давности:
Прихожу я в одну контору (мы вели переговоры отн. создания трех сайтов). Ну сидим мы общаемся. Вопрос заказчика:
- А вы сможете вывести нас в первую десятку сайтов, выдаваемых Рамблером по ключевому слову "......"
- Ну да, конечно, хотя я предпочитаю использовать Гугль, когда ищу по вашей тематике.
- ??? А что такое Гугль???
Вот так-то! А вы говорите Яндекс :)
Можно, конечно (ежели уж совсем серьезно подойти к рекламе в интернете - а как иначе? :) делать отдельный сайт для каждого отдельного поисковика (и в общем-то это правильно), но тогда вам понадобится создать и раскрутить не один, как минимум 3-5 сайтов, что весьма и весьма трудоемко.
В общем, я расскажу вам об основах того, как сделать, чтобы ваш динамический сайт индексировался Рамблером и другими подобными скриптоненавистническими поисковыми системами. Данная технология используется на моем новом сайте (внимание, рекламная пауза ;-) Реклама в интернете создание и раскрутка сайта
Во первых давайте посмотрим вот на что: каким именно образом робот понимает, что ваш сайт имеет динамическую структуру? Правильно - он смотрит параметр 'href' тэга 'A' и если в оном есть знаки ? или & и если робот НЕправильный, то страницу по данному адресу он индексировать не будет. Таким образом, задача заключается в том, чтобы убрать из строки урла вышеупомянутые символы. А как же тогда передавать параметры скрипту? Как...
Далее по пунктам (ежели что непонятно будет пишите лично - разберемся). Все повествование будет вестись на основе реальной разработки, и на выходе мы получим маленький жизнеспособный скрипт, поняв принципы работы которого, вы сможете написать большой и глючный интернет-магазин ;-)
- Давайте сразу четко сформулируем задачу: нам нужно каким-то образом вызвать некий скрипт и передать ему некие параметры, при этом адресная строка должна выглядеть как для нормального, статического сайта. Это просто, если мы передаем скрипту данные из формы - ставим "POST" и все дела. Но мы то с вами должны передать параметры из гиперссылки, то есть через URL, то есть методом GET, то есть в УРЛе будут ? или &, то есть...
ОК. Есть такой файл, называется .htaccess - в нем вы можете задать некотрые директивы, управляющие сервером Apache (сложно писать для "широкой" аудитории - кто-то сейчас читает и думает про себя - чего он тут нам "азбуку жует", а кто-то прочитал предыдущую фразу, и материт меня за "тарабарщину всякую"). Ну и ладно. В общем знать об этом самом .htaccess нужно примерно следующее - разместив оный файл в какой-либо папке на сервере, и написав в нем всякие штуки, мы можем изменить поведение сервера, применительно к данной папке (если, конечно хост провайдер разрешает). Короче:
Помещаем файл с именем .htaccess в корневую папку свего сайта (DocumentRoot) - обычно она называется WWW или www
И пишем в него следующие строки:
RewriteEngine on
RewriteRule ^core.php$ - [L]
RewriteRule .* /core.php
О чем это я? Аааа... ну да - есть такой модуль Apache - mod_rewrite называется. Описание данного модуля, как это обычно говорится, выходит за рамки данной статьи - суть в том, что mod_rewrite делает с путями на сервере, что душе угодно и использует синтаксис регулярных выражений в стиле Perl - интересующиеся могут порыться в интернете в поисках документации к оному. И все же, что мы там понаписали в .htaccess
RewriteEngine on
# Данной директивой .htaccess мы включаем mod_rewrite
RewriteRule ^core.php$ - [L]
# Даем понять серверу, что если запрошен файл с именем core.php (название может быть произвольным) то с оным файлом нужно поступить так, как обычно сервер поступает с предателями... простите с файлами, имеющими расширение .php - передать на обработку дальше (модулю PHP).
RewriteRule .* /core.php
# Внимание! Здесь происходит то, ради чего мы и городим весь огород - теперь, что бы мы не написали в адресной строке - не имеет (пока не имеет) ни какого значения - в любом случае будет вызван скрипт с именем core.php Но! Но в адресной строке набранный адрес остается прежним, то есть переменная окружения REQUEST_URI если набрано, например www.somehost.org/123 будет равна именно этому самому 123 и...
- И мы можем запросто разобрать эту строку в core.php, таким образом, мы передаем данные прямо в имени файла!!!
Пишем тестовый скрипт и сохраняем как core.php :
function parse($uri){
if($uri){
// вырезаем цифровые значения из строковой переменной $uri в массив $uri_number
eregi("[[:digit:]]+",$uri,$uri_number);
//выводим первый элемент массива в браузер
echo $uri_number[0];
}
}
// вызываем функцию с глобальной переменной $REQUEST_URI в качестве параметра
parse($REQUEST_URI);
- Теперь набираем в строке браузера что-нибудь типа //имя_вашего_хоста/vasia12345.html Уррра!!! Получилось! (у меня все работает по крайней мере :-) Заметьте, что мы вызвали несуществующий файл vasia12345.html - сервер вернул нам OK (т.е. файл найден) - и вывел в браузер цифры 12345. Оные же цифры и буквы (для тех кто в танке ;-) можно передавать в качестве параметров в функции, внутри скрипта и пр.
Рамблер доволен, мы довольны, все довольны! :-))
В заключение, хочу отметить, что описанный метод, далеко не единственный - я знаю по меньшей мере еще три способа избавиться от прелестей метода GET. Но данный путь, на мой взгляд самый гибкий и удобный.
Всего! Духанин Роман (aka RWinner)
Реклама в интернете создание и раскрутка сайта статьи аналитика
|
::::: D-Free пишет 05.04.2003 @ 06:29 | |
Ремблер прекрасно индексит +?+ Как, впрочем, и другие поисковики. Пару лет назад это было актуально, сейчас нет.
|
::::: NAS пишет 06.04.2003 @ 23:12 | |
D-Free а точно индексит ? Примерсик можно. Да и апорт тоже не индексирует такие страницы.
|
::::: gLip пишет 07.04.2003 @ 13:13 | |
по поводу индексации страниц , где есть передача параметров... только яндекс более - менее справляется с этим... гугл тоже, но страниц он меньше пориндексировал... а про рамблер я и не говорю, для того, чтобы он нормальные (правда нормальные phtml) страницы пориндексировал полгода должно пройти.. а уж с "?" и с "&" вообще говорить не приходится....
|
Официально при регистрации в Рамблере - они заявляют, что амперсанды и пр. не индексируют, неофициально индексируют, но не всё. В любом случае изначально Инет планировался как HTML - эти атавизмы есть и сегодня и не только в поисковиках. Например "качалки сайтов" тоже не все берут динамические сайты.
Короче по-любому иметь формат УРЛов без "?" и "&" - это однозначный рулез. Другое дело, что это требует некоторого напряга, а это уж каждый сам оценивает - надо это или не надо.
Всего!
|
::::: bird пишет 24.04.2003 @ 12:34 | |
////////////////////////////////////////////////
/// RewriteRule .* /core.php
////////////////////////////////////////////////
Ага ...
И все картинки на на рассматриваемом сайте моментом отрубятся, потому как любой URL проходит через core.php
|
::::: RnBvi пишет 24.04.2003 @ 16:57 | |
/***************************
И все картинки на на рассматриваемом сайте моментом отрубятся, потому как любой URL проходит через core.php
***************************/
А пути прописать относительно php-файла не судьба что-ли? Или абсолютные...
Чава
|
::::: bird пишет 25.04.2003 @ 13:51 | |
а какая ему разница (mod_rewrite) относительные это пути или абсолютные?
:-)
|
<blockquote>>Официально при регистрации в Рамблере - они заявляют, что амперсанды и пр. не индексируют, неофициально индексируют, но не всё.</blockquote>
---
наоборот. официально Рамблер заявил почти пол-года назад, что начал регистрировать динамику, хотя некоторые вещи не индексирует.
|
::::: balin пишет 12.05.2003 @ 13:28 | |
1. более простое решение и бытрее работает:
RewriteEngine on
RewriteRule \.html$ /index.php?$1 [NE]
2. по поводу посиковиков, дествительно проблема отпала, а проблема удобста пользователя остайтеся... куда приятней видеть
/about/index.html, вместо index.php?page=about&sub_page=index
|
::::: Likemam пишет 11.06.2003 @ 05:20 | |
Могу сказать, чо рамблер не индексирует страницы типа *.php?var=значение бесполезно ! Также как и Апорт. Но по статистике приход на сайт для примера :
Yandex - 270
Rambler-12
Aport-7
Так что ! Стоит сделать вывод и не городить чепуху. А для того, чтобы оказатся на верхушке рейтингоа, достаточно правильно сформировать index.php, причем если она деже формируется динамически, индексируется как надо.
|
Было интересно прочитать про другие способы изменения URI
|
::::: SID пишет 14.06.2003 @ 20:07 | |
Я могу вас уверить на 100%, что Rambler индексирует страницы типа http://sid.com.ru/?FILE=design2&nav=1 . Пример тому, мой сайт, у меня сделана хорошая система статистики..... короче поверьте мне наслово!
А вот Апорт не индексирует, это точно...
// For Likemam
Лично у меня приход на сайт(примернл):
Yandex - 46%
Rambler-54%
Aport-0%
Так что не обобщай...
|
::::: balin пишет 15.06.2003 @ 14:25 | |
Если сайт частично динамичный, очень здорово использовать такой вариант:
RewriteEngine on
#проверка существоания файла:
RewriteCond %{REQUEST_FILENAME} !-f
#проверка существования директории
RewriteCond %{REQUEST_FILENAME} !-d
#если не то не другое не сработало, передается к скрипту
RewriteRule ^(.*)$ index.php?$1 [QSA,L]
|
::::: webpr пишет 15.07.2003 @ 13:27 | |
а можно итак стили и картинки вклюсть
RewriteEngine on
RewriteCond %{REQUEST_URI} !(css|js|jpg|jpeg|gif|swf)$
RewriteRule ^/(.*) /index.php?mod=$1
|
::::: ROMAR пишет 20.07.2003 @ 17:35 | |
А если сайт полностью на флэше???? Как ты его проиндексируешь???? Именно российские поисковики-заметьте-ВСЕ!!!!!!!!!!!!!!-ни один не индексируют флэш-эти пауки не могут...жалко
|
ИМХО:
1. Делать две версии сайта - один флэшовый, другой простой (так обычно и делают).
2. Смешать флэш и хтмл - как правило в использовании флэшовых текстовых полей смысла мало.
3. Сам придумал года полтора назад, решая подобную проблему - жаба-скриптом делаешь два слоя - на переднем плане флэша, на заднем текст в хтмл для индексирования. Хотя это конечно изврат. Второй способ самый лучший. См. http://www.goldkey.ru/ - пример кастрированного XOOPS + Flash (флэша правда не слишком навороченная - ну на сколько заплатили - на столько и сделал ;)
З.Ы. к mod_rewrite это не имеет никакого отношения - офф-топик голимый :)
RWinner
|
::::: Zemnon пишет 25.07.2003 @ 13:57 | |
Всем привет.
У меня такая проблема:
Сделал всё, как было написано выше и модуль mod_rewrite у меня включен, но когда создал .htaccess то ничего не меняется, оно дальше отображает при обращении к http://localhost/index.html:
"Not Found
The requested URL /index.html was not found on this server."
В чём может быть загвоздка. Помогите плз.
|
::::: RWinner пишет 25.07.2003 @ 14:15 | |
::::: hav пишет 20.11.2003 @ 18:46 | |
А у меня почему-то не работает так как описано выше. Перекидывает на страницу 404
|
::::: hav пишет 20.11.2003 @ 18:53 | |
А.. нет. заработало. Спасиба!
|
::::: Костя пишет 31.01.2004 @ 16:12 | |
Поломал я свой сайт, постирал всякие ?= но теперь нет контента и все циклится. Я использую parser, поэтому Ваш пример на php мне не подходит. А вообще пойдите на мой сайт, там кроме доменного имени вообще ничего не отображается. Фрейм-технология, блин. -)
|
::::: HoRRoR пишет 13.03.2004 @ 11:41 | |
Хм. а у меня дома не работает, может мне чего в php.ini поменять надо, или же скачать какой-нить модуль, помогите.
|
::::: Ivan пишет 30.03.2004 @ 18:52 | |
Да ребята и мне помогите плиз
на хостинге все работает а дома нет
был не подключен модуль mod_rewrite
затем я его подключил
Сервак начинает ругаться типа опции FollowSymLink и RewriteEngine on не совместимы между собой
в чем дело?
|
To Костя
Чё-то слишком тяжелый сайт у тебя. Нельзя такие сайты делать.
А у меня дома всё заработло. Значит сервак всё-таки ставить научился.
|
::::: banditx пишет 15.05.2004 @ 17:54 | |
Добрый день, если он конечно добрый!
уже неделю мучуюсь и все испробывал, но не получается хоть убейте!
Помогите или скажите как четко все надо сделать!
Есть сайт www.versal.ru у него страницы создаются на основе шаблонов.
Так вот хочется чтобы все эти значки ?, & , = в URL страницах исчезли и ответ сервера на URL был как обычная .html или .php страница.
Сейчас все страницы там генерятся типа www.versal.ru/index.php?an=models, так вот хочется, чтобы после /index.php не было всего этого бреда, а была человеческая ссылка.
Помогите все красиво сделать, очень хочется!Спасибо.
|
::::: Aleksey пишет 27.08.2004 @ 20:57 | |
Подскажите пожалуйста ф-ю на Перле аналог header("Location:reg.php,id=42");
Чтобы вызванная страница не появлялась в строке адреса, а являлась как бы той страницей, которая вызвала эту ф-ю
|
Господа http://ifun.ru - порой до 40% дневного трафика идёт с рамблера, как вы наверное поняли сайт целиком и полностью динамический.
|
::::: Сергей пишет 08.01.2005 @ 21:35 | |
http://www.vistlan.ru - не индексирует динамические ссылки Апорт, а так сделать у меня тоже не получилось :(.
|
::::: Eugene пишет 09.01.2005 @ 16:09 | |
Aleksey, в перле нет спец функции для отправки заголовков.
print "Content-type: text/html\n";
print "Location: ......etc....\n\n";
\n\n - отделяет заголовок от содержания. См. RFC.
|
::::: Nexus пишет 02.08.2006 @ 14:05 | |
Вообще именно для удобства пользователей часто бывает нужно хранить параметры в урле. Пример - id товара или новости, если нужно сохранить себе линк именно на этот товар, а в урле нет параметров это как-то проблематично будет сделать ;)
|
::::: RWinner пишет 03.08.2006 @ 18:51 | |
Nexus, тебе ничто не мешает парсить УРЛ как тебе угодно и в обе стороны - это даже нивапрос - просто применяешь регулярные выражения и фсьо.
http://www.2winners.com/
|
::::: D пишет 02.11.2006 @ 12:43 | |
помогите плиз
в .htaccess пишу
RewriteEngine On
Options +FollowSymlinks
RewriteCond %{ENV:REDIRECT_MYFLAG} ^$
RewriteCond %{HTTP_HOST} ^\.site\.ru$
RewriteRule ^\.site\.ru(.*) /a%{REQUEST_URI}[L]
мне сказали что этот пример перенаправит все мои домены 3 уровня в папку А
мало того, что это не работает, так ещё мне надо другое - мне надо в корне в файл index.php
принимать значения этих самых доменов 3 уровня
т.е.
d.site.ru должен переводиться в site.ru/index.php?id=d
d1.site.ru должен переводиться в site.ru/index.php?id=d1
e.site.ru должен переводиться в site.ru/index.php?id=e
и т.д. юзеров очень много
плиззз
|
| |