24.6.07

Автоматическое удаление непроиндексированных Яндексом страниц из Сапе

http://homelessminsk.blogspot.com

Привет! Уже ни для кого не секрет, что продавая ссылки с внутренних страниц своих сайтов через Сапе можно неплохо заработать. Некоторые товарищи на форуме пишут, что уже покупают себе квартиры. Я же пока получаю $8,05 в день, но этот доход ежедневно растет.

Итак, теперь о моем способе удаления непроиндексированных страниц. Дело в том, что в Сапе принимают только проиндексированные Яндексом страницы, в отличие от того же Ксапа. Причем сайт может быть хорошо проиндексирован Яндексом, но робот Сапе все равно индексирует его по своему. Например, 1200 страниц одного из моих сайтов проиндексировано Яндексом. Но при добавлении сайта в Сапе их робот “насчитал” только 650 страниц. Модератор сайт отклонил, т.к. не все страницы, проиндексированные роботом Сапе, есть в индексе Яндекса. нам нужно эти страницы удалить. Описанная ниже технология сэкономила 4-5 часов моего времени, которые я бы потратил на ручное удаление непроиндексированных ссылок. Итак, что мы делаем:

1. Качаем эту программку для проверки индексации сайтов и страниц в Яндексе
2. Экспортируем из Сапе (ссылочка внизу странички) все страницы сайта, найденные саповским роботом в txt.
3. Копируем ссылки в программку и нажимаем кнопку “Проверить”. (Только не переусердствуйте! Создатели тулзы честно предупреждают, что ее использование нарушает лицензию Яндекса, который разрешает автоматизированные запросы такого рода только через XML и ваш айпишник теоретически могут забанить. Хотя я проверил 2500 страничек за час и все было ок. Все же советую установить в программе задержку между запросами, благо она позволяет это сделать)
4. Копируем полученный результат назад в Excel и сортируем данные по второму столбику.
5. Загружаем Internet Explorer (в Firefox не работает, в Опере не проверял). Копируем те ссылки возле которых стоит 0 или вообще ничего не стоит из Excel в Сапе. Копируем в поле, над которым написано “Введите УРЛы страниц (с новой строки, с http://):” и нажимаем ОК. При этом, все ссылочки, которых нет в индексе Яндекса оказываются отмеченными.
6. Выбираем “Удалить страницы до переиндексации” и ждем принятия сайта модератором!

No comments: