ITСooky

IT-рецепты съедобные и не очень!

Очищаем от грязи сайт vesti.ru!

дата 14.04.2012

Российским чиновникам катастрофический не хватает денег и совести. И если совести они категорически не хотят искать, то способов найти денег у них всегда много. Чем можно объяснить появление чернушной рекламы на сайте гос. канала вестиру! «Звездные засветы», «Волочкова опять разделась. На этот раз в кустах», «Чулпан Хаматова без макияжа шокирует», ну или про Пугачеву она то умирает, то рожает у них, всё это сопровождается соответствующими фотками. Это позорище терпеть невозможно, нет можно конечно никогда не заходить на сайт вестиру, но можно решить эту проблему раз и на всех сайтах.

Для этого потребуется:
1. Сервер приготовленный по рецепту Считаем трафик и ограничиваем доступ в Интернет средствами Ipfw, Netams, Squid, Sams!
2. Браузер FireFox

Разделим все загрязнения на три типа

Рекламные вставки

— непосредственно банеры и вызывающие их URL.

Тизеры

— это сайты как бы новостей, как правило новости типа «Голая Пугачева», надо открыть 3-5 сайтов,чтобы в самом конце найти новость типо «Володя Пупкин в паинте нарисовал голую Пугачеву», даже без фото — полное разочарование.

Магазины

— реклама товаров, тупо.

SAMS нам позволят блокировать следующими способами:

Перенаправленные

— показывать по запросу данных с определённых урлов пустую картинку(или какую укажите в настрйоках)

Запрет доступа по URL

— показывается страница отбойник, будет заметна на открываем сайте

Регулярные выражения

— тоже что и запрет по URL но будут блокироваться ссылки с определёнными словами. В этом разделе надо очень осторожно писать слова, потому что на разных сайтах им придается разное значение но сразу можно прописать:

banner
googleads

Как работать с SAMS описано в рецепте Считаем трафик и ограничиваем доступ в Интернет средствами Ipfw, Netams, Squid, Sams!, сейчас же мы займёмся вылавливанием грязи. Открываем сайт вестиру в FireFox. В меню выбираем Инструменты > Информация о странице > Мультимедия здесь можно посмотреть всё что открыто с какого URL вызвалось.

В Перенаправленные определяем:
тизеры

directadvert.ru
smi.ru
dt00.net
marketgid.com

рекламные вставки

reklama.mb.vesti.ru
adriver.ru

Что-то видно в явном виде что-то разделяется на два URL один для картинок другой для ссылок как dt00.net и marketgid.com. Поэтому на сайте посмотрим ссылки рекламных материалов визуально (так мы находим marketgid.com). Еще есть ссылка зашифрованная base64 алгоритмом, обычно так вирусы прячут ссылки на свой источник, чтобы они небыли видны в явном виде. Пожалуй надо слово base64 заблокировать для домена вестиру в Регулярных выражениях, но нет гарантии, что кто-то его не использует с добрыми намерениями.

(vesti.ru).*(base64)

Регулярные выражения можно проверять на сайте www.regexe.com

Будьте внимательны когда блокируете короткие названия сайтов, они могут повлиять на доступ к невинным сайтам. Например если вы заблокируете имя ero.ru у вас также не будет открыватся сайт transaero.ru — чтобы этого не происходило надо в SAMS писать это URL в таком виде:

[\/|\.]ero.ru

Или вот еще пример такой досадной возможности: mosvodokanal.ru ну понятен принцип!

Кстати: В Libreoffice при помощи регулярных выражений можно в начале каждой строки при помощи Найти Заменить подставить всё что нужно.
itcooky_sams_003

Очищение от грязи процесс непрерывный, реклама меняет URL-ы, вебмастеры тоже, так же у каждого свое представление о морали, что блокировать, а что нет — но в результате удовольствие от этого процесса огромное. Разве может админ сделать что-то большее для дома и семьи (в айтишном плане) как вот разом не очистить все домашние пыка (да и гостевые тоже) от этой грязи.

Мой список блокировок тут внизу!