Форумы Форум www.proxomitron.ru
Все о программе Proxomitron
Главная  • FAQ для форума  •  Поиск  •  Пользователи  •  Группы   •  Регистрация  •  Профиль  •  Личные сообщения  •  Вход
 Маленькие фильтры
 Сайт -> Форумы » Фильтры
Следующая тема
Предыдущая тема

Новая тема  Ответить
Автор Сообщение
Lamer
Advanced Member
Advanced Member


Зарегистрирован: 21.07.2006
Сообщения: 85

СообщениеДобавлено: Вт, Ноя 25 2008 18:01 Цитировать |  |  | 

Тут скорее всего уже было, поиск выдал в результаты эту тему, но найти не могу. Вобщем хотелось бы обрубить концы сбору статистики в гугл ... То есть вот это с некоторых сайтов прицепом идёт ... Как избавится Question

http://www.google-analytics.com/xxxxxxxxx

_________________
Ламер со стажем
К началу Профиль Сообщение
chAlx
Moderator
Moderator


Зарегистрирован: 30.06.2004
Сообщения: 2621
Откуда: SPb

СообщениеДобавлено: Ср, Ноя 26 2008 14:11 Цитировать |  |  | 

Lamer:

Вот тема про Гугол (можно сразу в самый конец крутить).
К началу Профиль Сообщение
Alex Qwerty
Gold Member
Gold Member


Зарегистрирован: 20.07.2007
Сообщения: 204

СообщениеДобавлено: Пт, Дек 19 2008 08:40 Цитировать |  |  | 

Удаляет/замещает div'ы
Код:
[Patterns]
Name = "Bad div killer 2008-12-16"
Active = TRUE
URL = "(^$LST(noBadTags))"
Bounds = "$NEST(<div,</div>)"
Limit = 10240
Match = "($LST(BadDivs))*"
Replace = "\1<!-- Bad div killed (\2)-->"


Пример блоклиста:

Код:

<DIV id="mouselayer" style="z-index:
<div[^>]++"bnr(top|)"
<div[^>]++ban+er&(^<div class="blog-w-right-<ins by="Kill ad JavaScripts2 (banner)"></ins>"|<div id="entry-<ins by="Kill ad JavaScripts2 (banner)"></ins>">|<div class="kontent _reach<ins by="Kill ad JavaScripts2 (banner)"></ins>_">)$URL(^http://(www.|)(linkbucks.com/|([^/]++.|)hotlinkimage.com)*)
<div[^>]++="ad(-(all_bottom|index_left|right)|_block|_body_foot|_down|_head|_hb|_left|_right|bar*|batch|block|brite([0-9]+_hidden|)|rotator*|s(-[a-z0-9\-]+|)|sense*|single|space[a-z\-]+|spot|v(_*|)|ver|vert(isement|)|vh|vtemp|)[0-9x\-_]+"$URL(^http://(www.|)(jamendo.com/|ifolderlinks.ru/|stealth.to/)*)
<div[^>]++(еклама)
<div[^>]++informer
<div[^>]++= ("|)bnr


Последний раз редактировалось: Alex Qwerty (Вс, Дек 28 2008 14:56), всего редактировалось 1 раз
К началу Профиль Сообщение
Nan0miT
Platinum Member
Platinum Member


Зарегистрирован: 11.10.2006
Сообщения: 315

СообщениеДобавлено: Пт, Дек 26 2008 03:14 Цитировать |  |  | 

Фильтр для логирования ссылок
(основан на URL-Filter: Host substitute (out) [ALX])

Добавляем в default.cfg в секцию [Blocklists] строки:
Код:

List.LinksGrabber = "..\Lists\LinksGrabber.txt"
List.LinksList = "..\LinksList.txt"


Создаем в папке с проксом, в корне пустой файл LinksList.txt
Создаем в папке Lists файл LinksGrabber.txt

Содержимое файла LinksGrabber.txt (пока только наброски)
Код:
#
# Proxomitron URL substitute blockfile "LinksGrabber" 
# Used by filter "URL-Filter: Links Grabber (out) [Nano, ALX]"
#
# Format:  original.url $SET(1=new.url)
# Use \9 as new URL tail (will be added to \1)
#

(*.(flv|wmv|wma|mp3|mp4|mpg|mpeg|mov|qt))\0
(playlist.yahoo.com/makeplaylist.dll?sid=[0-9]+)\0 $SET(1=&sdm=web&pt=rd)
(youtube.com/get_video?video_id=[^\&]+)\0*(\&t=[^\&]+)\9 $SET(1=&fmt=18)


Делаем Reload (перезагрузку конфига).

Добавляем в Headers заголовочный фильтр
Код:
[HTTP headers]
In = FALSE
Out = TRUE
Key = "URL-Filter: Links Grabber 261208 (out) [Nano, ALX]"
Match = "$URL( (ftp|http(s|)://(www.|))\8 $LST(LinksGrabber) )"
Replace = "$ADDLST(LinksList, $UESC(\8\0\1\9))"



Ссылки, которые попадают под правила, будут записываться в файл LinksList.txt. Можно сделать для него ярлык на рабочем столе.
К началу Профиль Сообщение
Nan0miT
Platinum Member
Platinum Member


Зарегистрирован: 11.10.2006
Сообщения: 315

СообщениеДобавлено: Вс, Дек 28 2008 14:32 Цитировать |  |  | 

Обновил немного LinksGrabber.txt для URL-Filter: Links Grabber 261208 (out) [Nano, ALX]

Код:

(*.(flv|wmv|wma|mp3|mp4|mpg|mpeg|mov|qt))\0
(*.(zip|rar|7z|arj|gz))\0
(playlist.yahoo.com/makeplaylist.dll?sid=[0-9]+)\0 $SET(1=&sdm=web&pt=rd)
(youtube.com/get_video?video_id=[^\&]+)\0*(\&t=[^\&]+)\9 $SET(1=&fmt=18)
(bl.rutube.ru/*.iflv)\0


(добавлено логирование некоторых ссылок на архивы и видео)
К началу Профиль Сообщение
Nan0miT
Platinum Member
Platinum Member


Зарегистрирован: 11.10.2006
Сообщения: 315

СообщениеДобавлено: Вс, Дек 28 2008 14:38 Цитировать |  |  | 

Иногда, открывая некоторые сайты, показывается алерт с какой-нибудь ошибкой, типа "This page requires AC_RunActiveContent.js.".
Фильтр убивает их.

Код:
[Patterns]
Name = "Alert Killer 281208 [Nano]"
Active = TRUE
Bounds = "$NEST(alert\(,\)(;|))"
Limit = 128
Match = "*AC_RunActiveContent.js*"



Как встречу еще какие сообщения типа этого, обновлю.
К началу Профиль Сообщение
!k
Гость





СообщениеДобавлено: Вс, Янв 04 2009 21:19 Цитировать |  |  | 

Kill AD Links (List) 060308 [Nano] к закомментированной рекламе типа
Код:
<!--<a href=http://masterforex-v.org target="_blank"><img src=http://masterforex-v.org/im/masterforex-v.org_1_468x60.gif border=0 alt="Masterforex-V"></a>-->

приделывает артефакт "-->"
К началу
1ik
Junior Member
Junior Member


Зарегистрирован: 05.01.2009
Сообщения: 25

СообщениеДобавлено: Пт, Янв 16 2009 01:09 Цитировать |  |  | 

Изменил вывод фильтра для устранения "-->" от закомментированной рекламы
Код:
Name = "Kill AD Links (List) 190308 [Nano] modif !k"
Active = TRUE
Bounds = "$NEST(<a,</a>)"
Limit = 4096
Match = "(^*(profile|topic|forum|user|album|download|post.php))(*($LST(KillAdList))\1*)\0"
Replace = "<code filter='Kill AD Links: \1' style='display:none'>\0</code>"
К началу Профиль Сообщение
Nan0miT
Platinum Member
Platinum Member


Зарегистрирован: 11.10.2006
Сообщения: 315

СообщениеДобавлено: Сб, Янв 17 2009 05:33 Цитировать |  |  | 

1ik писал(а):
Изменил вывод фильтра для устранения "-->" от закомментированной рекламы
Код:
Name = "Kill AD Links (List) 190308 [Nano] modif !k"
...


Я давно уже не пользуюсь этим фильтром, было достаточно много неправильных срабатываний, возможно из-за моего блок листа.

Вместо него использую kill offsite resources (black&white) 260708 [Nano]. Пока думаю над его улучшением и блок-листами для него.
К началу Профиль Сообщение
1ik
Junior Member
Junior Member


Зарегистрирован: 05.01.2009
Сообщения: 25

СообщениеДобавлено: Вс, Янв 18 2009 07:47 Цитировать |  |  | 

Nan0miT писал(а):
было достаточно много неправильных срабатываний, возможно из-за моего блок листа

У меня пока претензия только к "php\?id=[#100:9999999999]" — оно мне вырезало какой-то форум
К началу Профиль Сообщение
Nan0miT
Platinum Member
Platinum Member


Зарегистрирован: 11.10.2006
Сообщения: 315

СообщениеДобавлено: Вт, Янв 20 2009 22:46 Цитировать |  |  | 

Небольшое обновление фильтра (описание на предыдущей странице).

Теперь автоматически не обрабатываются ссылки на картинки, типа:
<a href="http://unno.ru/media/chrome/1.png"><img src="http://unno.ru/media/chrome/thumbs/1.png"/></a>
(пока 3 типа рисунков)

Код:
[Patterns]
Name = "kill offsite resources (black&white) 200109 [Nano]"
Active = TRUE
URL = "(^*$LST(KORBypassList))"
Limit = 1024
Match = "$NEST(<a,*href=$AV((http://([0-9a-zA-Z_\-.@\:]+)\2*)\1)*<img*,</a>)($TST(\2=$LST(KORBlackList))$SET(9=display: none;))|"
        "$NEST(<a,*href=$AV((http://([0-9a-zA-Z_\-.@\:]+)\2*)\1)*<img*,</a>)((^$TST(\2=(\h|$LST(KORWhiteList))))&&(^$TST(\1=*.(jpg|gif|png))))|"
        "$NEST(<script,*$AV((http://([0-9a-zA-Z_\-.@\:]+)\2/*)\1)*,</script>)($TST(\2=$LST(KORBlackList))$SET(9=display: none;))|"
        "$NEST(<script,*$AV((http://([0-9a-zA-Z_\-.@\:]+)\2/*)\1)*,</script>)(^$TST(\2=(\h|$LST(KORWhiteList))))|"
        "$NEST(<iframe,*src=$AV((http://([0-9a-zA-Z_\-.@\:]+)\2/*)\1)*,</iframe>)($TST(\2=$LST(KORBlackList))$SET(9=display: none;))|"
        "$NEST(<iframe,*(cgi-bin*\&rnd)\1*,</iframe>)$SET(9=display: none;)|"
        "$NEST(<iframe,*src=$AV((http://([0-9a-zA-Z_\-.@\:]+)\2/*)\1)*,</iframe>)(^$TST(\2=(\h|$LST(KORWhiteList))))|"
        "$NEST(<object,*src=$AV((http://([0-9a-zA-Z_\-.@\:]+)\2/*)\1)*,</object>)(^$TST(\2=(\h|$LST(KORWhiteList))))"
Replace = "<ins filter="kill offsite resources" style="margin: 0; padding: 0; text-decoration: none; \9">"
          "<a href="\1" target="_blank" style="margin: 0; padding: 0; text-decoration: none;">"
          "<span style="color: red; font-size: 40px; margin: 0; padding: 0; text-decoration: none;">.</span></a></ins>"

К началу Профиль Сообщение
Nan0miT
Platinum Member
Platinum Member


Зарегистрирован: 11.10.2006
Сообщения: 315

СообщениеДобавлено: Пн, Фев 09 2009 19:14 Цитировать |  |  | 

В этой версии просто добавил title, показывает при наведении название фильтра, чтобы было понятно, что это за красная точка со ссылкой.

Код:
[Patterns]
Name = "kill offsite resources (black&white) 090209 [Nano]"
Active = TRUE
URL = "(^*$LST(KORBypassList))"
Limit = 1024
Match = "$NEST(<a,*href=$AV((http://([0-9a-zA-Z_\-.@\:]+)\2*)\1)*<img*,</a>)($TST(\2=$LST(KORBlackList))$SET(9=display: none;))|"
        "$NEST(<a,*href=$AV((http://([0-9a-zA-Z_\-.@\:]+)\2*)\1)*<img*,</a>)((^$TST(\2=(\h|$LST(KORWhiteList))))&&(^$TST(\1=*.(jpg|gif|png))))|"
        "$NEST(<script,*$AV((http://([0-9a-zA-Z_\-.@\:]+)\2/*)\1)*,</script>)($TST(\2=$LST(KORBlackList))$SET(9=display: none;))|"
        "$NEST(<script,*$AV((http://([0-9a-zA-Z_\-.@\:]+)\2/*)\1)*,</script>)(^$TST(\2=(\h|$LST(KORWhiteList))))|"
        "$NEST(<iframe,*src=$AV((http://([0-9a-zA-Z_\-.@\:]+)\2/*)\1)*,</iframe>)($TST(\2=$LST(KORBlackList))$SET(9=display: none;))|"
        "$NEST(<iframe,*(cgi-bin*\&rnd)\1*,</iframe>)$SET(9=display: none;)|"
        "$NEST(<iframe,*src=$AV((http://([0-9a-zA-Z_\-.@\:]+)\2/*)\1)*,</iframe>)(^$TST(\2=(\h|$LST(KORWhiteList))))|"
        "$NEST(<object,*src=$AV((http://([0-9a-zA-Z_\-.@\:]+)\2/*)\1)*,</object>)(^$TST(\2=(\h|$LST(KORWhiteList))))"
Replace = "<ins filter="kill offsite resources" style="margin: 0; padding: 0; text-decoration: none; \9">"
          "<a href="\1" target="_blank" style="margin: 0; padding: 0; text-decoration: none;" title="Proxomitron: kill offsite resources">"
          "<span style="color: red; font-size: 40px; margin: 0; padding: 0; text-decoration: none;">.</span></a></ins>"

К началу Профиль Сообщение
Nan0miT
Platinum Member
Platinum Member


Зарегистрирован: 11.10.2006
Сообщения: 315

СообщениеДобавлено: Пн, Фев 09 2009 19:17 Цитировать |  |  | 

Где-то потерялся фильтр с блокировкой рекламы по размеру, начал делать новый.
Заготовка выглядит так (пока только заменяет правильно оформленную флешку желтой точкой):

Код:
[Patterns]
Name = "kill object by size 090209 [Nano]"
Active = TRUE
Limit = 1024
Match = "$NEST(<object,(*(width|height)(=|:)("|'|)(468|60)("|'|)*(weight|height)(=|:)("|'|)(468|60)("|'|)*)\1,</object>)"
Replace = "<ins filter="kill object by size" style="margin: 0; padding: 0; text-decoration: none; ">"
          "<a href="#" target="_blank" style="margin: 0; padding: 0; text-decoration: none;" title="Proxomitron: kill object by size">"
          "<span style="color: #FFBD00; font-size: 40px; margin: 0; padding: 0; text-decoration: none;">.</span></a></ins>"

К началу Профиль Сообщение
Nan0miT
Platinum Member
Platinum Member


Зарегистрирован: 11.10.2006
Сообщения: 315

СообщениеДобавлено: Пн, Фев 09 2009 19:26 Цитировать |  |  | 

Еще одна мысль по блокировке рекламы с яваскриптами и иннерХТМЛ. Данный фильтр просто удаляет из <div> текст id или class если встречается слово banner.

Код:
[Patterns]
Name = "kill script by tag 090209 [Nano]"
Active = TRUE
Limit = 1024
Match = "$NEST(<div,*ban(n|)er*,>)"
Replace = "<div><ins filter="kill script by tag" style="margin: 0; padding: 0; text-decoration: none; "></ins>"



Т.е. какой бы умный не был яваскрипт, очень часто встречал что он вставляется в дивы с названиями id типа top_banner и т.п.

Опять же, пока думаю, полезно это или нет.
К началу Профиль Сообщение
chAlx
Moderator
Moderator


Зарегистрирован: 30.06.2004
Сообщения: 2621
Откуда: SPb

СообщениеДобавлено: Пн, Фев 09 2009 21:09 Цитировать |  |  | 

Nan0miT писал(а):
Где-то потерялся фильтр с блокировкой рекламы по размеру

Потому что надо было отдельную тему сделать, как у каждого приличного фильтра. ;)
К началу Профиль Сообщение
Nan0miT
Platinum Member
Platinum Member


Зарегистрирован: 11.10.2006
Сообщения: 315

СообщениеДобавлено: Пн, Фев 09 2009 22:40 Цитировать |  |  | 

chAlx писал(а):
Nan0miT писал(а):
Где-то потерялся фильтр с блокировкой рекламы по размеру

Потому что надо было отдельную тему сделать, как у каждого приличного фильтра. ;)

Да, может так и сделаю, позже.


А пока еще один маленький апдейт.
Код:
[Patterns]
Name = "kill object by size 090209 (u1) [Nano]"
Active = TRUE
Limit = 1024
Match = "$NEST(<(object|a)\0,*(width|height)(=|:)("|'|)(468|60)("|'|)*(weight|height)(=|:)("|'|)(468|60)("|'|)*,</\0>)|"
        "$NEST(<img,*(width|height)(=|:)("|'|)(468|60)("|'|)*(weight|height)(=|:)("|'|)(468|60)("|'|)*,>)"
Replace = "<ins filter="kill object by size" style="margin: 0; padding: 0; text-decoration: none; ">"
          "<a href="/" target="_self" style="margin: 0; padding: 0; text-decoration: none;" title="Proxomitron: kill object by size">"
          "<span style="color: #FFBD00; font-size: 40px; margin: 0; padding: 0; text-decoration: none;">.</span></a></ins>"

К началу Профиль Сообщение
Wii
Гость





СообщениеДобавлено: Вт, Фев 10 2009 02:52 Цитировать |  |  | 

Не работал флеш-видеоплеер на ag.ru, путём тестирования при различном наборе используемых фильтров выяснил, что видео не работает при следующих активных фильтрах, т.е., когда хотя бы один из них включен, видео не транслируется:
PageEraser 1/2 [LXX] v4.0
Host 2 Title (+URL) 110508 [Nano]


Список используемых фильтров:
http://pic.ipicture.ru/uploads/090210/gyVV2IXXbr.jpg

порядок применения фильтров зависит от порядка следования фильтров в файле конфигурации?

Ссылку поправил.
/chAlx
К началу
Wii
Гость





СообщениеДобавлено: Вт, Фев 10 2009 02:55 Цитировать |  |  | 

извиняюсь, ссылка на картинку:
[url]ipicture.ru/Gallery/Viewfull/13083647.html
К началу
Alex Qwerty
Gold Member
Gold Member


Зарегистрирован: 20.07.2007
Сообщения: 204

СообщениеДобавлено: Вт, Фев 10 2009 06:12 Цитировать |  |  | 

Пропиши им в поле URL что-нить типа "^ag.ru/".
Да, зависит от порядка.
Когда вставляешь урл, не забывай писать протокол ("http://") - тогда будут нормальные ссылки и картинки.
К началу Профиль Сообщение
chAlx
Moderator
Moderator


Зарегистрирован: 30.06.2004
Сообщения: 2621
Откуда: SPb

СообщениеДобавлено: Вт, Фев 10 2009 10:52 Цитировать |  |  | 

Alex Qwerty писал(а):
Когда вставляешь урл, не забывай писать протокол ("http://")


Когда постим на форум, не забываем про контекст :)
Это при вставке в топик нужно http://, в фильтрах не всё так однозначно.

ПС: Кстати, у гостей вообще ссылки не постятся -- защита-с.. ;) Так что картинку подправлю.
К началу Профиль Сообщение
Показать сообщения:      
 
Новая тема  Ответить

 Перейти:   




Следующая тема
Предыдущая тема
Вы можете начинать темы
Вы можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


P o w e r e d b y p h p B B © p h p B B G r o u p :: T h e m e b a s e d o n FI T h e m e :: Часовой пояс: GMT + 3