Форумы Форум www.proxomitron.ru
Все о программе Proxomitron
Главная  • FAQ для форума  •  Поиск  •  Пользователи  •  Группы   •  Регистрация  •  Профиль  •  Личные сообщения  •  Вход
 Privoxy, TOR и Co
 Сайт -> Форумы » Другие программы
Следующая тема
Предыдущая тема

Новая тема  Ответить
Автор Сообщение
Bloxer
Гость





СообщениеДобавлено: Пт, Дек 03 2004 14:10 Цитировать |  |  | 

А кто что скажет за privoxy (http://www.privoxy.org/)?
Кто нибудь юзал?
К началу
Гость






СообщениеДобавлено: Чт, Июн 09 2005 08:07 Цитировать |  |  | 

Цитата:
хГБХМЪЧЯЭ, С ЛЕМЪ РСР БНГМХЙКХ МЕНФХДЮММШЕ ОПНАКЕЛШ Я ЙНДХПНБЙНИ ЯННАЫЕМХЪ, НРОПЮБКЕММНЦН ХГ АПЮСГЕПЮ нОЕПЮ. оНОПНАСЧ РЕОЕПЭ ЯДЕКЮРЭ РН ФЕ ХГ-ОНД Mozill'Ш...
[..]

Похоже, у кого-то неожиданные проблемы с кодировкой Привокси ;)
/chAlx
Перевожу:


Извиняюсь, у меня тут возникли неожиданные проблемы с кодировкой сообщения, отправленного из браузера Опера. Попробую теперь сделать то же из-под Mozill'ы...

Отличный прокси-сервер с расширенными возможностями фильтрования веб-контента, защиты приватности и активной обороны от использования нарочито агрессивных технологий построения неуправляемых веб-страниц (например, открывающихся к новых окнах браузера, не имеющих линейки меню, строки статуса, адресной строки и т.д.). Также в дистрибутив (комплект файлов в архиве) Privoxy включены фильтры, позволяющие исправлять типичные ошибки некоторых верстальщиков веб-страниц, как то: фреймы с фиксированными линейными размерами (в пикселях) Privoxy превращает в масштабируемые, мерцающий текст заменяет обычным, увеличивает размеры слишком маленьких полей ввода и добавляет к ним скроллинг. и т.д. и т.п. ( об этом можно долго рассказывать :-) )
"Для получения более подробных сведений" приглашаю посетить страницу проекта локализации Privoxy, координатором которого я пока ещё являюсь: http://privoxy.asplinux.net . Заодно и на форум загляните (пока что это часть форума на ASPLinux.net, так что придётся предварительно зарегистрироваться там)
А также хотелось бы обратить Ваше внимание на 2 довольно обстоятельные статьи о Privoxy:
http://www.nospam.net.ru/manual_privoxy.php
http://www.knoppix.ru/adv150604.shtml
И ещё в нагрузку (там правда пока нет практически ничего. Будет время, добавлю чуток дополнительных сведений) :
http://en.wikipedia.org/wiki/Privoxy
Небезынтересными для Вас могут оказаться файлы, выложенные здесь разработчиками Privoxy:
http://cvs.sourceforge.net/viewcvs.py/ijbswa/contrib/
К началу
Гость






СообщениеДобавлено: Чт, Июн 09 2005 08:08 Цитировать |  |  | 

Hey, moderators, whats happen with encoding?!!
К началу
chAlx
Moderator
Moderator


Зарегистрирован: 30.06.2004
Сообщения: 2621
Откуда: SPb

СообщениеДобавлено: Чт, Июн 09 2005 09:46 Цитировать |  |  | 

Маска:
Спасибо, интересно. Кратенькие вопросы навскидку:

  • Оно через полноценный PCRE настраивается, или свой язык?
  • Сжатые страницы по-прежнему не обрабатываются?
  • Через SSL работает нормально?
  • Обработка размеров картинок производится по контенту файла изображения, или по атрибутам тегов?
  • Обрабатываются любые HTTP-заголовки, или только куки?

Если интересно и не лень, хорошо бы ещё узнать, чего оно у меет в отличие от Proxomitron. Часть того, чего в Проксе нет, перечислена здесь.

ПС: Надо приличный ник придумывать, чтобы не стыдно подписаться было :)
К началу Профиль Сообщение
DRVTiny
Newbee
Newbee


Зарегистрирован: 09.06.2005
Сообщения: 2
Откуда: Москва

СообщениеДобавлено: Чт, Июн 09 2005 21:42 Цитировать |  |  | 

Цитата:
Оно через полноценный PCRE настраивается, или свой язык?

Все фильтры Privoxy составлены из полноценных Perl Compatible Regular Expressions. Собственно, эти же выражения используются в архи-популярном у ваятелей shell-скриптов под Unix-like ОСи потоковом редакторе sed Паттерны URL-адресов тоже включают в себя большую часть шаблонных подстановочных элементов ("джокеров") из Perl. К примеру, я совсем недавно с помощью вполне отвечающего моим эстетическим запросам, а главное - эргономичным веб-редактором файлов действий (часть Панели управления Privoxy) добавил в секцию block файла user.action URL-маску (URL-паттерн, URL-шаблон, если хотите. От этой терминологии у самого голова кругом идTт...) вида .*/.*bann?er*. , которая соответствует любому URL, содержащему в путевой части слово banner или "недослово" baner (это в основном для безграмотных, "молодых да ранних" веб-дизайнеров и для особо хитрых, которые догадаются исказить слово за счTт всего лишь одной "лишней" буквы ) соотв
Цитата:
Сжатые страницы по-прежнему не обрабатываются?

Ну вообще функциональность Privoxy одной лишь фильтрацией не ограниичвается, хотя действительно для того, чтобы использовать "действия" (actions) из группы filter, приходится запрещать удалTнным серверам отсылать контент в сжатом виде, разрещать действие prevent-compression. Кстати, действие kill-popups тоже нельзя использовать без отключения компрессии.
Как Вы понимаете, это и есть единственная, но довольно сильно досждающая пользователям ахиллесова пята Privoxy.
Найди бы програмистов соотв. профиля, и мы могли бы обойти это ограничение в русской версии Privoxy. Вообще со сжатием веб-контента лучше всего справляется альтернативный Privoxy (в мире Unix) прокси MiddleMan

Цитата:
Через SSL работает нормально?

Да нет с этим проблем и не было их! А что, кто-то жаловался на то, что Privoxy не работает с SSL? Где, когда и при каких обстоятельствах сие надругательство над здравым смыслом имело место? Мы сейчас на этого человека заведTм дело по 58-й статье и за антисоветскую агитацию живенько на строительство амуро-иртышского канала отправим :-)

Цитата:
Обработка размеров картинок производится по контенту файла изображения, или по атрибутам тегов?

Откровенно говоря, я никогда в это не вникал, но скорее всего размеры определяются всT-таки по тегам, а не по контенту файлов. Но вообще фильтрование картинок по размерам в любом случае не эффективно, учитывая то, что форматов баннеров сейчас развелось неимоверное количество, а вероятность того, что вместо баннера будет отсечена какя-нибудь немаловажная информативная составляющая веб-контента соответственно повысилась. Фильтрация баннеров по URL на поверку оказывается намного более эффективной.
Цитата:
Обрабатываются любые HTTP-заголовки, или только куки?

У меня сложилось впечатление, что разработчики Privoxy как раз возможности, которые предоставляет изменение/подмена заголовков HTTP изучили досконально, так что вариантов подделки информации отправляемой/получаемой в заголовках довольно много, и уж конечно они не ограничиваются только работой с куки (которые Privoxy и на уровне контента умеет отлавливать - см. http://privoxy.asplinux.net/user-manual/actions-file.html#FILTER )
Цитата:
Надо приличный ник придумывать, чтобы не стыдно подписаться было Smile

Так я же здесь зарегистрирован под ником DRVTiny... Сейчас внTс домен .proxomitron.ru/ в "белый список" тех сайтов, на которых куки не надо фильтровать - уж и не знаю, поможет ли это?
Цитата:
хорошо бы ещT узнать, чего оно у меет в отличие от Proxomitron

Так вроде бы Proxomitron ни в одной из альтернативных ОС не работает (и даже якобы кроссплатформенный proximodo упорно не желает собираться из исходников даже после правки его Makefile'а), так что мне лично сравнивать очень и очень трудно, поскольку установить Proxomitron и опробовать его в деле я не могу.
На первый взгляд мне не понравился примитивный и явно избыточный формат файлов фильтров, используемый Proxomitron'ом.

Кодировочку пофиксил..
//rokir

_________________
Мыслите Масштабно!
Think Better, Think Linux!
К началу Профиль Сообщение Отправить e-mail WWW
DRVTiny
Newbee
Newbee


Зарегистрирован: 09.06.2005
Сообщения: 2
Откуда: Москва

СообщениеДобавлено: Чт, Июн 09 2005 21:44 Цитировать |  |  | 

interesno, chto moia podpis normalno otobrajaetsia...

_________________
Мыслите Масштабно!
Think Better, Think Linux!
К началу Профиль Сообщение Отправить e-mail WWW
chAlx
Moderator
Moderator


Зарегистрирован: 30.06.2004
Сообщения: 2621
Откуда: SPb

СообщениеДобавлено: Чт, Июн 09 2005 22:46 Цитировать |  |  | 

DRVTiny
Не знаю, как ты это отправляешь.. Я запрашиваю форум с Accept-Language: ru,en-us;q=0.7,en;q=0.3 и Accept-Charset: windows-1251,utf-8;q=0.7,*;q=0.7, а получаю страницы с тегом <meta>, устанавливающим win1251 и без кодировок в заголовке. Так что скорее всего где-то ты что-то портишь, а браузер это не может понять и использует дефолтную кодировку. Потренируйся пока, я потом (в пятницу) подотру этот оффтоп. Можно ещё попробовать в <form> подставить кодировку (есть там пара параметров).

_________________
Как правильно задавать вопросы
К началу Профиль Сообщение
_DRVTiny_
Гость





СообщениеДобавлено: Пт, Июн 10 2005 07:13 Цитировать |  |  | 

No vy moio prev. msg smogli prochitat or no? Esli xoite, poprobuiu translitom povtorit
К началу
chAlx
Moderator
Moderator


Зарегистрирован: 30.06.2004
Сообщения: 2621
Откуда: SPb

СообщениеДобавлено: Пт, Июн 10 2005 19:16 Цитировать |  |  | 

DRVTiny
Цитата:
Все фильтры Privoxy составлены из полноценных Perl Compatible Regular Expressions

То-то и смущает.. Например, в выражении edit.*.yahoo.com точки явно используются не для обозначения любого байта, и звезда не на предыдущий символ влияет, а сама по себе. Может, это какие-то другие Регэкспы?

Цитата:
Как Вы понимаете, это и есть единственная, но довольно сильно досждающая пользователям ахиллесова пята Privoxy.
Найди бы програмистов соотв. профиля, и мы могли бы обойти это ограничение в русской версии Privoxy.

Я -- не понимаю; я только бегло оглядел его. Потому и спрашивал.

Странно, что распаковать контент это такая проблема. Можно ведь для этого подцепить любой подходящий прокси, чтобы только и делел, что страницы разжимал. А с него уже забирать куда угодно.

Цитата:
А что, кто-то жаловался на то, что Privoxy не работает с SSL?

Я просто спросил, чтобы представление получить.

Цитата:
мне лично сравнивать очень и очень трудно, поскольку установить Proxomitron и опробовать его в деле я не могу.

А ты по ссылке смотрел список фич? Вот их в Проксе нету. И кроссплатформенности тоже (хотя некоторые умудряются через эмулятор прикручивать).

Цитата:
На первый взгляд мне не понравился примитивный и явно избыточный формат файлов фильтров

?? В каком смысле избыточный -- лишнего много? Приимтивный -- это его наитвное свойство; он для того и сочинялся, чтобы быть простым и понятным. Он не настолько мощный, как регэкспы, но для фильтрации веб-контента куда удобнее.

Вот, для примера, пара простых фильтров. Первый заменяет на сайтах из списка все картинки на пустые, кроме загружаемых с того же сайта, что и страница. Второй "отключает" мета-тег кодировки, если она была указана в http-заголовке, если использовалась не UTF-8:

Код:
Name = "Kill off-site resources {sites} [ALX]"
Active = TRUE
URL = "$LST(OffsiteList)"
Bounds = "<(img|image|input|iframe|script)\s*>"
Limit = 512
Match = "(<(img|image|input|iframe|script)\s)\1\2"
        "src=$AVQ("
        "(\"|\'|)\4"
        "http(s|)://(^\h)[^'"]+"
        "(\'|\"|)\5"
        ")"
        "\3>"
Replace = "<match/>\1\2 src=\4http://local.ptron/killed.gif\5\3>"

Name = "Content-type filter [ALX]"
Active = TRUE
Bounds = "<meta\s*>"
Limit = 256
Match = "<meta\s\1>&("
        " *\shttp-equiv=$AV(content-type)&"
        " *\s content=$AV(*&(^*=utf*))"
        ")"
        "&$IHDR(Content-Type: text/* charset=?)"
Replace = "<moota \1>"


Как это можно сделать регэкспами? Не в плане соревнования, просто для сравнения..


Транслитом точно не надо писать: перевести нельзя, а так читать никто не будет.

_________________
Как правильно задавать вопросы
К началу Профиль Сообщение
Гость DRVTiny
Гость





СообщениеДобавлено: Сб, Июн 11 2005 07:51 Цитировать |  |  | 

Цитата:

То-то и смущает.. Например, в выражении edit.*.yahoo.com точки явно используются не для обозначения любого байта, и звезда не на предыдущий символ влияет, а сама по себе. Может, это какие-то другие Регэкспы?

Точки применяются как разделители частей доменного имеии, например, www.yahoo.com состоит из 3-х частей: "www", "yahoo" и "com" соотв.-но Уже в путевой части URL можно использовать нормальные регэкспы, хотя вообще разработчики Privoxy и не собирались поддерживать полный синтаксис PCRE для URL-паттернов, поскольку в этом просто смысла никакого нет. А вот фильтры Privoxy из полноценных PCRE компонуются.
Цитата:

Странно, что распаковать контент это такая проблема. Можно ведь для этого подцепить любой подходящий прокси, чтобы только и делел, что страницы разжимал. А с него уже забирать куда угодно.

Много чего иожно. Но тот же MiddleMan поддерживат не только декомпрессию на лету, но ещё и кэширование (вообще более "продвинутого" фильтрующего прокси по-моему просто не существует в природе), так что обеспечение фильтрации без резкого снижения производительности и проп. способности соединения на уровне исходного кода, а не с помощью внешних программ для Privoxy developer'ов должно было бы стать делом чести. Но, видимо, чего-то этим developer'ам всё же не хватает... желания, наверное.
Цитата:

Я просто спросил, чтобы представление получить.

Ну вот, опять мой литературный дар пытаются недооценивать. Это же был мой шедевр литабстракционизма, а Вы всё на свой счёт приняли... Давайте я Вам подалю "Приключения солдата Чонкина", чтобы у Вас чувство (чёрного) юмора наконец проснулось.
Цитата:

А ты по ссылке смотрел список фич? Вот их в Проксе нету. И кроссплатформенности тоже (хотя некоторые умудряются через эмулятор прикручивать).

Торжественно клянусь, что после того, как допишу это сообщ. и отправлю, тут же пройду по указанной ссылке. OK? (Посмотрел уже - там явно у товарищей требования завышенные. Зачем им всё это неимоверное количество наворотов, даже представить себе не могу...)
Насчёт эмулятора - это сильно (через wine что ли? так он и не эмулятор вовсе, а free реализация Windows internals - на wine, кстати, ReactOS построена). Но вообще пользователи *nix-ОС чаще всего пользуются либо SQUID'ом (всё равно, что из пушки по воробьям стрелять), либо плагинами для браузеров (откровенно мелкотравчатый подход, полумера).
Цитата:

В каком смысле избыточный -- лишнего много?

Ну да, всяких там зарезервированных слов - параметров явно можно было бы и поменьше придумывать
Всё-таки вот такой фильтр (взято из default.filter - сам я пока ещё не занимался написанием фильтров, так что повторить Вашу, ALX, абракадабру, на регэкспах, у меня явно не получится (я вообще с трудом понимаю смысл (т.е кое-что всё-таки с трудом, но понять могу) педложенного мне на рассмотрение кода)), выглядит куда как элегантнее:
Код:

FILTER: content-cookies Kill cookies that come in the HTML or JS content

# JS cookies, except those used by antiadbuster.com to detect us:
#
s|(\w+\.)+cookie(?=[ \t\r\n]*=)(?!='aab)|ZappedCookie|ig

# HTML cookies:
#
s|<meta\s+http-equiv=['"]?set-cookie.*>|<!-- ZappedCookie -->|igU


или вот ещё пример со вставками кода на JavaScript (?)

Код:

# The status bar is for displaying link targets, not pointless blahblah
#
s/(\W\s*)((this|window)\.(default)?status)\s*=\s*((['"]).*?\6)/$1if(typeof(this.href) != 'undefined') $2 = $5 + ' URL: ' + this.href;else return false/ig

# Kill OnUnload popups. Yummy.
# Test: http://www.zdnet.com/zdsubs/yahoo/tree/yfs.html
#
s/(<body\s+[^>]*)onunload/$1never/siU
s|(<script.*)window\.onunload(?=.*</script>)|$1never|sigU
К началу
Гость DRVTiny
Гость





СообщениеДобавлено: Сб, Июн 11 2005 07:54 Цитировать |  |  | 

Может, лучше будем общаться на моём форуме (ссылка есть на privoxy.asplinux.net )
Заодно, может, сподвигну на участие в дискуссии товарища 9A4172 - он у нас искусством фильтрописания владеет в совершенстве.
К началу
Гость






СообщениеДобавлено: Сб, Июн 11 2005 17:12 Цитировать |  |  | 

Вот Вам, извольте любить и жаловать:
Код:

$replace_img="/img/fuck_images.jpg"
s/<([Ii][Mm][Gg]s+)(.*(?=[Ss][Rr][Cc]))([Ss][Rr][Cc]=['"])([Hh][Tt][Tt][Pp]|[Ff][Tt][Pp]):\/\/[^'"]*(.*)$/$1 $2 $3$replace_img$5 /sigU

Благодарность можно и нужно выразить некоему slavaz с форума на asplinux.net
К началу
chAlx
Moderator
Moderator


Зарегистрирован: 30.06.2004
Сообщения: 2621
Откуда: SPb

СообщениеДобавлено: Вс, Июн 12 2005 17:42 Цитировать |  |  | 

Цитата:
разработчики Privoxy и не собирались поддерживать полный синтаксис PCRE для URL-паттернов, поскольку в этом просто смысла никакого нет. А вот фильтры Privoxy из полноценных PCRE компонуются.

То-то и оно, что для html-кода регекспы тоже в 99% случаев не нужны..
Цитата:
Но тот же MiddleMan поддерживат не только декомпрессию на лету, но ещё и кэширование (вообще более "продвинутого" фильтрующего прокси по-моему просто не существует в природе)

А почему тогда Privoxy?
Цитата:
Ну да, всяких там зарезервированных слов - параметров явно можно было бы и поменьше придумывать

Есть такой язык программирования BrainFuck, куда более мощный, чем регекспы (полный по Тьюринку, как пАскаль или там Си). Весь синтаксис -- восемь односимвольных операторов. Вот в нём точно ничего лишнего нет. А все остальные языки (кроме, пожалуй, Перла) придуманы для упрощения програмирования тех задач, для которых язык предназначен. Поэтому в них вводятся дополнительные конструкции, без которых можно обойтись, но которые позволяют быстро, удобно и качественно решать задачи.

Короче, как человек, который уже написал несколько фильтров, скажу: в языке Прокса очень немного конструкций, отсутствие которых никак не сказалось бы на работе с ним. Наоборот, почти все они очень полезны и уместны.

Кстати, если главное, что тебя удивило -- использование полей Match/Replace/Bounds/.. в конфиге, то имей ввиду, что их содержимое заполняется с помощью интерфейса программы, в котором этих параметров с лишними кавычками нет.
Цитата:
Посмотрел уже - там явно у товарищей требования завышенные.

Да, они такие..
Но не в этом дело; список я привёл, чтобы тебе было, из чего выбирать. Т.е. чтобы ты прочитал его и сказал: вот это и это есть в Привокси, а это только в МидлМэне. Весь этот топик, по-большому счёту, нужен для того, чтобы сравнить Proxomitron и Privoxy. Как ещё это сделать, если никто не знает всех фич и того, и другого?
Цитата:
Всё-таки вот такой фильтр (..) выглядит куда как элегантнее

Чем что? Вот я приведу для примера наброски фильтров, соответствующих этим:
Код:
s|(\w+\.)+cookie(?=[ \t\r\n]*=)(?!='aab)|ZappedCookie|ig

s|<meta\s+http-equiv=['"]?set-cookie.*>|<!-- ZappedCookie -->|igU


Код:
Match =  "\w.cookie=$AVQ(\1&(^'aab*))"
Replace = "ZappedCookie=\1"

Match=  "<meta http-equiv=$AV(set-cookie*)*>"
Replace="<!-- ZappedCookie -->"


По-моему, основная разница в том, что усложнение фильтров на PCRE обусловлено синтаксическими особенностями, а на языке Прокса -- существенной частью. Т.е. в Проксе чем сложнее (логически) структура искомого выражения, тем труднее его описать. А на регэкспах чем больше, тем труднее, а сложность почти не влияет, т.к. сам язык мощнее и многое умеет.

Например, в приведённых примерах фильтров для Прокса надо иметь ввиду, что пробел означает (в терминах регэкспов) "\s*", знак "равно" означает "\s*=\s*", двойная кавычка означает "["']" и т.п. Т.е. всё предназначенно для фильтрации HTML-кода, поэтому почти всё делается проще, чем на регэкспах.

Цитата:
Вот Вам, извольте любить и жаловать

Во-первых, это издевательство над человеческими разумом. Хотя при наличии /i все эти ужасные [Ss] можно исключить, но необходимость подсчёта скобочек и эскейпирования слешей останется. Читабильность, соответственно, падает.

Я вот только что, когда ссылку на BrainFuck искал, нашёл такое его описание: "Это язык типа 'однажды-написал-никогда-не-прочитал', как Перл. Потому что в тысячу раз быстрее написать код заново, чем понять данную программу."

Возвращаясь к моему примеру надо иметь ввиду, что скромная конструкция (^\h) означает, что найдутся/заменятся только картинки, загружаемые не с родного сайта, даже если используется полный путь. Так что одной проверки http:// недостаточно.

Цитата:
Может, лучше будем общаться на моём форуме

Это в честь того, что ты не можешь кодировку настроить? :)
Будут конкретные вопросы по програме -- залезу туда. А пока что есть задача сравнить функциональность и удобство обоих фильтров. Здесь вот один добрый человек ;) создал тему про это в специальной ветке форума; хоть какая-то связь. Но всё равно не видно никого, кто имел бы опыт работы с обеими програмами. Поэтому всё это пустая болтовня, переносить которую в другое место смысла нет: будут знатоки по другой программе, но не будет по этой.
К началу Профиль Сообщение
_DRVTiny_
Гость





СообщениеДобавлено: Пн, Июн 13 2005 13:10 Цитировать |  |  | 

Цитата:

А почему тогда Privoxy?

MiddleMan, по-видимому, рассчитан на применение "продвинутыми" системными администраторами, а не пользователями десктопов: у MM слишком много возможнотей (в особенности связанных с кешированием запросов к DNS), настроить которые через довольно запутанный и полный специфической лексики, не пересекающейся со словарным запасом даже среднестатически-продвинутого пользователя, сложный для понимания web-интерфейс, практически очень турдно, а во многих случаях вообще едва ли возможно просто в силу того, что ни один здравомыслящий человек не будет тратить уйму своего драгоценного времени на подстройку пусть и супер-навороченной, но всё-таки баннерорезки. Но вообще рекомендую Вам попробовать установить ЭТО у себя (конечно, если у Вас где-нибудь поблизости установлена одна из Uniх-based систем) - может, этот прокси как раз соответствует Вашим представлениям об идеальном инструменте такого рода.

Privoxy же просто и логично устроен, его интерфейс отличается эргономичностью и высокой эстетичностью (мне по крайней мере его стиль очень нравится), сочетающейся с быстрым удобным доступом ко всем базовым иерархически соподчинённым функциям, что в какой-то степени нивелирует недостатки, связанные с принципиальными ограничениями Privoxy.
Скажем так, у Privoxy человечности больше (кстати, у них и документация написана доступным языком, да к тому же ещё и с "местными включениями" остроумного юмора)
Цитата:

Возвращаясь к моему примеру надо иметь ввиду, что скромная конструкция (^\h) означает, что найдутся/заменятся только картинки, загружаемые не с родного сайта, даже если используется полный путь. Так что одной проверки http:// недостаточно.

И всё-таки загляните на http://asplinux.net/modules/newbb_plus/viewtopic.php?topic_id=298&forum=39 , там у нас как раз всё застопорилось на вопросе о том, как в регэскп предать URL текущей страницы
Цитата:

Это в честь того, что ты не можешь кодировку настроить? Smile

Так ведь проблемы с кодировкой у меня только на Вашем форуме, и получается, что это уж скорее не мне надо браузер подстраивать на передачу в koi8-r, чтобы потом на стороне proxomitron.ru принудительное преобразование koi8-r->cp1251 вместо cp1251->cp1251 по правилам перекодировки из koi в cp, как это имеет место сейчас, происходило, а Вам искать очевидный (в прямом смысле) баг в настройках сервера. Тем паче, что я уже пробовал из-под 3-х различных браузеров на совершенно разных движках (Mozilla/FireFox - Gecko, Opera - не-знаю-как-этот-проприетарный-движок-называется ) сообщ. посылать, а результат был одинаково неутешительным в обоих случаях.
Цитата:

По-моему, основная разница в том, что усложнение фильтров на PCRE обусловлено синтаксическими особенностями, а на языке Прокса -- существенной частью. Т.е. в Проксе чем сложнее (логически) структура искомого выражения, тем труднее его описать. А на регэкспах чем больше, тем труднее, а сложность почти не влияет, т.к. сам язык мощнее и многое умеет.

Ну кто же спорит, только дело-то всё в том, что PCRE-это стандарт, который постоянно пользуются многие, а встроенный язык Proxomitron - это продукт творческой деятельности его разработчика, с которым даже профессиональным программистам на Perl ещё разбираться надо будет, при чём знания эти им больше нигде не пригодятся.
К началу
chAlx
Moderator
Moderator


Зарегистрирован: 30.06.2004
Сообщения: 2621
Откуда: SPb

СообщениеДобавлено: Пн, Июн 13 2005 15:56 Цитировать |  |  | 

DRVTiny:
Цитата:
там у нас как раз всё застопорилось на вопросе о том, как в регэскп предать URL текущей страницы

Вот именно, застопорилось. Потому что никто не разбирается в обсуждаемом предмете. :( Так мы вряд ли что-то сравним..
Цитата:
это уж скорее не мне надо браузер подстраивать на передачу в koi8-r, чтобы потом на стороне proxomitron.ru принудительное преобразование koi8-r->cp1251 вместо cp1251->cp1251 по правилам перекодировки из koi в cp, как это имеет место сейчас, происходило, а Вам искать очевидный (в прямом смысле) баг в настройках сервера.

Но ни у кого больше этого не происходит, нормально в виндовой кодировке работает.. Больше похоже на то, что ты все свои браузеры защитил одной программкой от использования агрессивной и неуправляемой технологии выставления кодировки страниц.
Цитата:
PCRE-это стандарт, который постоянно пользуются многие, а встроенный язык Proxomitron - это продукт творческой деятельности его разработчика, с которым даже профессиональным программистам на Perl ещё разбираться надо будет

Так и есть. И в этом основная разница: Прокс рассчитан не на профессионально больных Перлом, а на нормальных юзеров, которые хотят удобно и эффективно получать результат. В данном случае язык регулярных выражений -- это такой недружественный к юзеру, но неизбежный шаг, направленный на радикальное повышение функциональности по-сравнению с различными интерфейсными (GUI) решениями для аналогичных задач. Но использовать для этого намного более сложный язык, будь он трижды стандарт, смысла нет. А то придём к тому, что надо интерпретатор Си использовать: на нём-то точно ВСЁ можно сделать.

Есть ещё один аспект, который в большей степени представляет моё частное мнение, чем предыдущие, более-менее аргументированные высказывания. Я считаю, что Scott R. Lemmon (автор Proxomitron) был не просто талантливым программистом, он был-таки гением. Именно поэтому у него хватило смелости отойти от канонов и создать нечто лучшее, чем любимый миллионами язык PCRE. И многого из его решений мне, как программисту, не хватает в стандартных регэкспах. А то, что технология стала индустриальным стандартом, никогда не говорило о том, что это лучшая технология.
К началу Профиль Сообщение
Гость






СообщениеДобавлено: Пн, Июн 13 2005 17:50 Цитировать |  |  | 

Цитата:

Потому что никто не разбирается в обсуждаемом предмете.

Нет, ну почему же, разобрались вроде бы, решили, что Privoxy только статические замены вида s/// умеет производить (он эти выражения просто библиотеке PCRELib передаёт)
На самом деле для решения задач, подобных той, которую ты предложил, разработчики Privoxy пишут CGI-скрипты (те действия, которые не filter-* и которых, позволю обратить Ваше внимание, даже чисто количественно больше, чем фильтров). В принципе, пользователь тоже может сподобиться изобразить "something like": скрипты CGI на самом деле попроще регэскпов Perl будут...
Цитата:

Больше похоже на то, что ты все свои браузеры защитил одной программкой от использования агрессивной и неуправляемой технологии выставления кодировки страниц.

Ну-ну, не надо копировать мои речевые шаблоны, а то я самым бескомпромиссным образом начну ссылаться на закон о защите интеллектуальной собственности. Smile
На самом деле я отправлял свои послания на совершенно невероятное количество форумов самой разной направленности (я ещё на железячных форумах бываю и на кодерских (посвящённых сис. программированию)) - и всё там всегда было нормально, а здесь, как я понимаю, я - первый человек, который сообщения посылает не из-под Windows+IE, а из-под Linux+Opera (мне вообще-то совсем не нравится медленная и неповоротливая Огненная Лиса. К тому же в Linux печать из-под Oper'ы выглядит лучше, чем из Mozill'ы). На самом деле подобная проблема уже была и на knoppix.ru, и на linux.by, но там наоборот были проблемы у пользователей Windows. В общем, найду топик (либо на linux.by, либо на knoppix.ru), и Вы убедитесь в том, что я и настройки моего браузера совершенно не при чём (во всём виновата гремучая смесь Apache и phpBB).
Цитата:

Есть ещё один аспект, который в большей степени представляет моё частное мнение, чем предыдущие, более-менее аргументированные высказывания. Я считаю, что Scott R. Lemmon (автор Proxomitron) был не просто талантливым программистом, он был-таки гением. Именно поэтому у него хватило смелости отойти от канонов и создать нечто лучшее, чем любимый миллионами язык PCRE. И многого из его решений мне, как программисту, не хватает в стандартных регэкспах. А то, что технология стала индустриальным стандартом, никогда не говорило о том, что это лучшая технология.

Да я же не говорю о том, что лучше, а что хуже. Дело-то в том, что любой пользователь запросто напишет простенький фильтр и на PCRE (почитайте http://privoxy.asplinux.net/user-manual/filter-file.html#AEN3212 или http://privoxy.asplinux.net/user-manual/appendix.html#REGEX и убедитесь в том, что там речь идёт о совершенно элементарных вещах, о таких приёмах работы с регэскпами, которые и домохозяйка, и последний "чайник" освоят без труда), и на встроенном языке Прокса. Сложные же вещи пишут уже разработчики, а не пользователи (а Вы, chAlx, именно разработчик и есть) - здесь надо чётко понимать разницу между пользователем, который пишет 5-строчный скрипт на BASH или *.BAT-файл для DOS и разработчиком - например, Клаусом Кноппером, который моделирует универсальную загрузку с Live-CD для всех конфигураций компьютеров в rs.sysinit (тоже на языке Shell для оболочки BASH) для дистрибутива Knoppix. На самом деле человек, который может написать на языке Прокса фильтр, решающий не самую простую общую задачу, наподобие того, что представили Вы, при желании без проблем разберётся и с регэкспами, но если знание PCRE ему поможет ещё в тысяче различных областей, то виртуозное владение Проксом вряд ли пригодится где-то за пределами узкого круга задач, решаемых этой чудо-программой (на самом деле, судя по всему, это действительно замечательный фильтрующий прокси-серевр, жаль вот только, что не кроссплатформенный).
К началу
Гость






СообщениеДобавлено: Пн, Июн 13 2005 17:57 Цитировать |  |  | 

Ой, извиняюсь, это у меня рука дрогнула, одно лишнее сообщение определённо нужно стереть...
iconv -f cp1251 -t koi8-r forever!
К началу
chAlx
Moderator
Moderator


Зарегистрирован: 30.06.2004
Сообщения: 2621
Откуда: SPb

СообщениеДобавлено: Вт, Июн 14 2005 09:33 Цитировать |  |  | 

Обобщу.
Цитата:

разобрались вроде бы, решили, что Privoxy только статические замены вида s/// умеет производить (он эти выражения просто библиотеке PCRELib передаёт)

Может, я что-то пропустил, но вижу этот тезис впервые. Будем знать.

Цитата:
разработчики Privoxy пишут CGI-скрипты

Т.е. не пользователи пишут, а разработчики самой программы? И что это -- полноценные CGI-модули, откомпилированный специально для данной платформы, или всё же скрипты?
Цитата:
любой пользователь запросто напишет простенький фильтр и на PCRE

Это потому, что ваши "любые пользватели" уже ставили *nix, компилили исходники из дистрибутивов, правили текстовые конфиги.. В общем, это не настоящие "любые пользватели" ;) А домохозяевам не так-то просто адаптировать кусок html-кода до такого состояния, чтобы получился регэксп: надо эскейпить все "спецсимволы", заменить переводы строк, вставить всё это между каких-то значков (слешей), а в начало и конец запихать таинственные буквы.

Цитата:
iconv -f cp1251 -t koi8-r forever!

ОК, давай мы исправим форум под тебя. Для этого надо от тебя узнать следующее:

  • Параметры исходящего http-заголовка: Accept-Language, Accept-Encoding, Accept-Charset.
  • Параметры входящего http-заголовка: Content-Encoding, Vary, Transfer-Encoding, Content-Type. Нужен вариант "на входе в комп", до преобразования всякими фильтрами.
  • Что думает браузер о том, в какой кодировке отображена страница.
  • Содержимое тега <meta http-equiv="Content-Type"> на странице.

Для тренировок можно использовать раздел форума "Флейм".

_________________
Как правильно задавать вопросы
К началу Профиль Сообщение
_DRVTiny_
Гость





СообщениеДобавлено: Вт, Июл 05 2005 07:04 Цитировать |  |  | 

с ФХФ Л ЬЛЪБНЕОБН ХУЙМЕООП ЗПФПЧЙМУС, ФБЛ ЮФП РТЙЫМПУШ УМЕЗЛБ РПДЪБДЕТЦБФШУС У ПФЧЕФПН... Sorry :-)
1) оЕ УПЮФЙФЕ НЕОС ЪБ НБТБЪНБФЙЛБ, ОП С ЧППВЭЕ ОЕ УЕФЕЧЩНЙ ФЕИОПМПЗЙСНЙ ЙОФЕТЕУХАУШ, Б УЛПТЕЕ ТБВПФПК УП УФТПЛПЧЩНЙ ДБООЩНЙ Ч МАВПН ЧЙДЕ (ОЕЛПФПТЩН ПВТБЪПН РП УФПРБН рТБФФБ ЙДХ Smile ), ФБЛ ЮФП НПЕК ОБУФПМШОПК ЛОЙЗПК СЧМСЕФУС ПФОАДШ "Linux ДМС Internet Й Intranet" (ФПЮОП ОБЪЧБОЙЕ ОЕ РПНОА, ОП ЮФП-ФП Ч ЬФПН ТПДЕ), Б "уФТПЛЙ, ДЕТЕЧШС, РПУМЕДПЧБФЕМШОПУФЙ Ч БМЗПТЙФНБИ" дЬОБ зБУЖЙМДБ, ФБЛ ЮФП С РТПУФП ОЕ ЪОБА, ЛБЛ ЬФЙ HTTP-ЪБЗПМПЧЛЙ РЕТЕИЧБФЩЧБФШ, РПУЛПМШЛХ ОЙЛПЗДБ ТБОШЫЕ РПДПВОЩНЙ ЧПРТПУБНЙ ОЕ ЙОФЕТЕУПЧБМУС (Б Privoxy ХЧМЈЛУС ЙУЛМАЮЙФЕМШОП РПФПНХ, ЮФП РТПОЙЛУС ЗМХВПЛПК УЙНРБФЙЕК Л ЬФПК "ДТХЦЕМАВОПК" РТПЗТБННЕ).
pls, ОБХЮЙФЕ НЕОС УЙЕК РТЕНХДТПУФЙ (ЛБЛ ЪБЗПМПЧЛЙ РЕТЕИЧБФЩЧБФШ), ЕУМЙ чБУ ОЕ ЪБФТХДОЙФ (ОХ ЙМЙ УУЩМЛХ ОБ appropriat'ОЩЕ НБФЕТЙБМЩ ДБКФЕ)...
2) б чЩ Proxomitron У ЛБЛЙН-ОЙВХДШ БОПОЙНОЩН РТПЛУЙ ЛПНВЙОЙТПЧБФШ ОЕ РТПВПЧБМЙ? с РПРЩФБМУС "УЛТЕУФЙФШ" Privoxy Й TOR - РПЮЕНХ-ФП РПЛБ ОЙЮЕЗП РХФОПЗП ЙЪ ЬФПЗП ОЕ ЧЩИПДЙФ: УН. ФПРЙЛ лБЛ ЪБУФБЧЙФШ TOR УЛТЩЧБФШ IP РТПЧБКДЕТБ?
К началу
_DRVTiny_
Гость





СообщениеДобавлено: Вт, Июл 05 2005 07:06 Цитировать |  |  | 

Оказывается, уже всё исправлено... Сюрприз, однако, сюрприз...
К началу
Показать сообщения:      
 
Новая тема  Ответить

 Перейти:   




Следующая тема
Предыдущая тема
Вы можете начинать темы
Вы можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


P o w e r e d b y p h p B B © p h p B B G r o u p :: T h e m e b a s e d o n FI T h e m e :: Часовой пояс: GMT + 3