Форумы Форум www.proxomitron.ru
Все о программе Proxomitron
Главная  • FAQ для форума  •  Поиск  •  Пользователи  •  Группы   •  Регистрация  •  Профиль  •  Личные сообщения  •  Вход
 Просмотр PDF
 Сайт -> Форумы » Фильтры
Следующая тема
Предыдущая тема

Новая тема  Ответить
Автор Сообщение
chAlx
Moderator
Moderator


Зарегистрирован: 30.06.2004
Сообщения: 2626
Откуда: SPb

СообщениеДобавлено: Пн, Дек 15 2008 18:22 Цитировать |  |  | 

Долго мучал меня уродский формат PDF на вебе, в котором многие считают возможным распространять документацию, не задумываясь о том, как её потом будут читать. А теперь вдруг осенило послать в Гугол незамысловатый запрос: "PDF viewer online". Вот результаты, подходящие для фильтра:

Так что выбирайте ;) Соответствующие записи для фильтра URL-Filter: URL substitute (out) [ALX] лучше постить в его родной теме.
К началу Профиль Сообщение
chAlx
Moderator
Moderator


Зарегистрирован: 30.06.2004
Сообщения: 2626
Откуда: SPb

СообщениеДобавлено: Ср, Дек 17 2008 11:40 Цитировать |  |  | 

Zoho рулит: у них есть API для использования без явной загрузки на сервер, сразу по УРЛу. И форматов много нужных:
Microsoft Office, OpenOffice, OpenDocument, PDF, RTF.. Главное достоинство: конвертит документы во вменяемый текст с форматированием, который можно и читать нормально, и искать по нему, и копировать.

Тонкость только в том, что надо в GET-запросе помимо адреса документа передавать ключ. Но он выдаётся бесплатно (можно даже без емейла) и нужен "только для мониторинга использования сервиса".
2a7914186ee4537d635017c74ae4f6cc
Кто первый сделает фильтр? ;) Или для существующего параметр (только надо про удобство не забывать: иногда требуется не просматривать документ, а сохранить себе, так что тупой редирект может выйти боком).
К началу Профиль Сообщение
PF4Public
Junior Member
Junior Member


Зарегистрирован: 01.05.2008
Сообщения: 26

СообщениеДобавлено: Вт, Янв 13 2009 11:02 Цитировать |  |  | 

Не претендую на самое изящное решение, но оно работает (правда, только с полными урлами):
Код:

Name = "pdf preview [ProfessorF]"
Active = TRUE
Bounds = "<a *</a>"
Limit = 1000
Match = "<a\0*href="\1.pdf"*>\0</a>"
Replace = "<a href=http://local.ptron/pdf_pg.html?pdf=\1.pdf >\0</a>"

Если есть желание, можно дополнить поддерживаемыми файлами:
http://zohoviewer.wiki.zoho.com/Supported-Files.html

упомянутый pdf_pg.html
Код:
<html>
<head>
<title>pdf_bridge</title>
<script language="JavaScript">
var regex = new RegExp( "=([^&#]*)" );
var results = regex.exec( window.location.href );   
document.write("<frameset rows=40px,*><frame src=pdf_top.html?pdf=" + results[1] + ">");
document.write("<frame src=http://bypass..viewer.zoho.com/api/view.do?url=" + results[1] + "&apikey=****APIKEY****&embed=true></frameset>");
</script>
</head>
</html>


и упомянутый pdf_top.html
Код:
<html>
<head>
<title>pdf_bridge</title>
<script language="JavaScript">
var regex = new RegExp( "=([^&#]*)" );
var results = regex.exec( window.location.href );
document.write("<a href=\""+results[1]+"\">"+results[1]+"</a>");
</script>
</head>
<body>
</body>
</html>



Проверяться здесь:
http://www.google.com/search?hl=ru&client=opera&rls=ru&hs=X8d&q=pdf&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA&lr=
соотв, в выдаче будут пдфы Smile
в частности: http://download.yandex.ru/company/blogosphere2007apr.pdf
К началу Профиль Сообщение
chAlx
Moderator
Moderator


Зарегистрирован: 30.06.2004
Сообщения: 2626
Откуда: SPb

СообщениеДобавлено: Чт, Май 14 2009 12:15 Цитировать |  |  | 

Для фильтра URL-Filter: URL substitute (out) [ALX] сделал редирект PDF на сервис Zoho (фильтр пришлось слегка доработать):

Код:
(^$KEYCHK(^A))(*.pdf(^?))\5   $SET(0=http://viewer.zoho.com/api/view.do?url=$ESC(\8\5)&cache=false&apikey=proxo


Вариант сыроват (скорее всего нужно будет делать более тонкую проверку УРЛа), но в простых случаях работает: при нажатом Alt открывает ссылку с PDF обычным образом, без него редиректит на онлайн-вьювер.

API Key для ссылки рекомендуется получить персональный (бесплатно), но пока работает и с левыми.

Из-за особенности кеширования браузеров однажды открытый "напрямую" файл нельзя повторно открыть через такой редирект, т.к. браузер не посылает запрос, а берёт данные из кеша. Тут поможет только очистка кеша от этого файла, ну или другой способ редиректа (например, врезаться html-фильтром в href).
К началу Профиль Сообщение
Partyzan
Platinum Member
Platinum Member


Зарегистрирован: 15.02.2005
Сообщения: 319

СообщениеДобавлено: Пн, Май 18 2009 23:56 Цитировать |  |  | 

Интересно, я всегда считал PDF образцом кроссплатформенности и переносимости. Ну места побольше занимает, конечно, но уродским я бы его никогда не назвал. chAlx, чего ты на него так обозлился?
К началу Профиль Сообщение
chAlx
Moderator
Moderator


Зарегистрирован: 30.06.2004
Сообщения: 2626
Откуда: SPb

СообщениеДобавлено: Вт, Май 19 2009 18:32 Цитировать |  |  | 

Partyzan:

Цитата:
я всегда считал PDF образцом кроссплатформенности и переносимости


Это было, было.. С тех пор появилась куча других форматов, HTML и CSS стали более-менее одинаково отображаться в разных условиях (ну, уже можно этого добиться), формат DOC от Офиса-97 стали много где понимать и он не менялся (хоть и не ахти какой переносимый, но текст с картинками почитать можно), а размер RTF перестал пугать пользователей, пересевших на толстые каналы.

Тем временем для просмотра PDF стал требоваться большущий (для такой задачи) пакет программ (Ридер же не только сам ставится), которые устанавливаются и прописываются в кучу мест, долго запускаются, долго работают, жрут много памяти, прописываются в автозапуск, лезут в инет.. А теперь в них ещё и уязвимости постоянно находят.

При этом пакет надо устанавливать от админа, чтобы оно могло найти и загадить побольше мест. До недавнего времени (в новых FF и Seamonkey есть менеджер плагинов -- там их можно отключать) в браузере по ссылке автоматом открывался этот монстр, который после даже закрытия висел в памяти. Это что, нормально для вьювера? Альтернативные программы часть проблем решали, но добавляли своих, особенно со стабильностью и корректностью отображения.

При этом при просмотре PDF не работают самые простые и привычные вещи: Ctrl-F, навигация текстовым курсором, переформатирование текста под ширину окна.. Даже текст скопировать зачастую проблема (в общем случае без Файнридера нерешаемая). Кроме того, картинки в нём обычно сжаты с потерями, а текст бывает в виде векторной графики. Зато есть принудительное разбиение на страницы, из-за чего во многих документах вместо нормального оглавления тупо перечень страниц.

Также надо учитывать, что этот бесплатный вьювер не даст внести изменения -- пойди и купи полную версию, либо набей документ заново в своём редакторе и экспортируй в PDF. Т.е. это формат на один раз: вывел, напечатал и стёр; дальнейшая работа невозможна (даже полный Acrobat не очень-то много позволяет делать).

Нет, PDF -- это зло, и чем больше расширяется фирма Adobe, тем ближе это зло к абсолютному. У них вообще приличного софта не выходит: сплошные монстры с кучей багов, глюков и ограничивающих пользователя фич (за его деньги, обычно немалые). Даже Микрософт на фоне Адоба приличнее смотрится!

Так что пусть PDF остаётся там, откуда он попёр: в полиграфии. Там чёткость в передаче размеров и цветов играет роль, а неудобства просмотра отходят на второй план: всё равно без распечатки цвет не оценить. А порочную практику выкладывать в нём инструкции надо прекращать: понятно, что всем проще сделать один файл для печати и для скачивания, но надо же и о пользователях думать!

Тем более в нынешний век повсеместного быстрого инета незачем заставлять людей ставить кривые поделки -- браузера (который есть у всех, даже в телефонах) должно быть достаточно для получения информации из WWW.
К началу Профиль Сообщение
Показать сообщения:      
 
Новая тема  Ответить

 Перейти:   




Следующая тема
Предыдущая тема
Вы можете начинать темы
Вы можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


P o w e r e d b y p h p B B © p h p B B G r o u p :: T h e m e b a s e d o n FI T h e m e :: Часовой пояс: GMT + 3