PDF – один из самых распространенных
универсальных форматов для представления различных документов. Он
отличается тем, что может интегрировать любую разновидность медиа,
включая даже видео и звук. Наиболее часто он употребляется для
представления иллюстрированного текста. PDF служит в Интернете аналогом
печатных информационных брошюр – часто на диске к какому-либо устройству
можно найти описание в формате PDF, с которого напечатано лежащее тут
же рядом бумажное руководство.
PDF – не самый компактный формат, но он
имеет способность точно воспроизводить однажды заданный внешний вид
документа на любом устройстве: от экрана до типографской машины. В этом
он подобен просто изображениям, но в отличие от них, картинки и текст в
PDF содержатся раздельно, и текст может быть скопирован, автоматически
проиндексирован в составе баз данных и даже поддается мелкому
редактированию. Но, в отличие от документов в большинстве других
форматов, документ PDF представляет собой конечный продукт и по большому
счету редактированию уже не подлежит. PDF также часто рассматривается
как один из форматов электронных книг, и его умеют воспроизводить
практически все электронные ридеры. Но в этом отношении он неудобен –
как раз из-за своего свойства сохранять заданное форматирование, которое
не меняется при переходе от одного размера экрана к другому, документ
PDF нужно под каждый размер экрана создавать отдельно.
Поэтому не ищите полноценных
программ-редакторов, «умеющих» редактировать PDF-документы. В некоторых
элементарных функциях (вроде копирования в буфер обмена текстовых
фрагментов и отдельно картинок, а также целых фрагментов документа в
виде изображения) помогает и стандартная программа для просмотра этого
формата Adobe Reader. Размещать ее на диске к этой книге я не стал – она
встречается в Интернете на каждом углу, но официально распространяется
лишь через ссылки на сайт самой компании Adobe (что в данном случае
абсолютно правильно – слишком много охотников подсунуть вирус под видом
столь популярной и всем необходимой программы). Если у вас Adobe Reader
еще отсутствует, а вы встретили в Интернете некий источник PDF-файлов,
то предложение скачать его просмотрщик, скорее всего, будет им
сопутствовать. В последних версиях Adobe Reader осталась столь же
монструозной по объему, как вообще все программы фирмы Adobe, но
работать стала быстрее и не в свои дела лезть не пытается (например, она
перестала пытаться автоматически встроиться в браузер). Различия между
последними версиями Adobe Reader заключаются в основном в поддержке
всяких нововведений в формате PDF, большого значения на практике не
имеющих.
Для простого просмотра PDF программы Adobe
Reader более чем достаточно, и она удобнее большинства альтернативных
программ для этой цели. Единственное, с чем вы можете столкнуться, – со
все нарастающей модой среди выпускающих документацию в этом формате
устанавливать защиту от копирования текста. Наверное, они полагают, что
так удерживают пользователей от нарушений закона. Однако в подавляющем
большинстве случаев копирование требуется совсем не для того, чтобы
тайно распространять чужие материалы, – очень часто нужно просто точно и
без ошибок воспроизвести иностранное название или термин, образец
текста на каком-то языке программирования или расшифровку какого-нибудь
сокращения. Как быть в таких случаях – обращаться к хакерам?
Способы преобразования и редактирования PDF
Есть несколько способов преодолеть
это препятствие. Для начала сам Adobe Reader может сохранять документ в
текстовом формате, а именно текст обычно и требуется. Но без сучка и
задоринки это проходит, к сожалению, лишь с англоязычными текстами.
Многие тексты в формате PDF, включающие кириллицу, хорошо если просто не
распознают кодировку Unicode (как с этим справляться, рассказывалось
ранее – см. разд. 12.3 «Русификация и кодировки»), но могут превратиться
в набор сплошных пробелов и знаков вопроса. Встречаются и куда более
заковыристые случаи – однажды мне пришлось в ответ на просьбу одной
читательницы писать целую программу по расшифровке кириллического
PDF-файла, каким-то образом сделанного в совершенно невероятной
кодировке, явно придуманной на один раз, – больше таких текстов
встретить так и не удалось.
Если нужно просто снять защиту от
копирования, то не ищите локальную программу, – проще всего обратиться к
онлайновым сервисам. Мне известно три таких сервиса: pdfunlock.com,
freemypdf.com и pdfpirate.org, вероятно, есть еще и другие.
На крайний случайКстати,
для всех подобных целей, включая даже снятие пароля с закрытого для
просмотра файла, причем далеко не только PDF-формата, есть совершенно
официальные программы фирмы «Элкомсофт» (elcomsoft.ru). Я не советую
заниматься в таких случаях поисками на «варезных» сайтах, в том числе и
программ самой «Элкомсофт», – чаще всего то, что там предлагается, либо
просто не работает, либо вдобавок сильно осложнит вам жизнь.
Разработчики программ в «Элкомсофт» сами являются крупнейшими
специалистами в области криптографии – не секрет, что основатели
компании когда-то закончили Высшую школу КГБ по этой специальности.
Потому даже и не надейтесь найти «разлоченную» программу от
«Элкомсофта». Кроме всего прочего, «Элкомсофт» является членом
Российской криптологической ассоциации и имеет статус сертифицированного
партнера Microsoft и Intel, что много говорит о ее статусе в мире.
Программы ее, впрочем, весьма дороги, но это полностью оправдывается их
назначением: во-первых, задача действительно сложная, во-вторых,
настоящая нужда в таких средствах возникает только в совсем уж крайнем
случае.
Есть и другой, вполне
легальный способ, который гарантирует результат во всех случаях, – любой
PDF, который можно отобразить на экране, легко преобразовать в
текстовую форму, даже не теряя картинок, с помощью известной программы
Fine Reader, имеющейся у любого обладателя сканера. Прилагающаяся к
сканеру усеченная бесплатная версия может и не работать с PDF, но это
делает любая более «продвинутая», которая стоит недорого и оправдает
себя наверняка. С помощью Fine Reader можно преобразовать PDF «обратно» в
привычный формат DOC, RTF или HTML (оригинальное форматирование при
этом, естественно, не сохраняется).
Правка PDF требуется крайне редко, но если
вам такое все-таки понадобилось, то на этот предмет есть масса
бесплатных и платных программ разной степени совершенства, свою задачу
худо-бедно выполняющих. Другое дело, что за всю компьютерную жизнь мне,
всю дорогу только и занимающемуся переборкой текстовых документов, эти
средства ни разу и не пригодились. Необходимость редактирования PDF в
большинстве случаев означает, что вам просто надо создать документ в
таком формате. А это чаще всего делается не с помощью специального
редактора, а через операцию печати на виртуальном PDF-принтере.
Создание документов в формате PDF
Проще всего для создания
PDF-документа воспользоваться бесплатным конвертером, который
выпускается самой Microsoft в виде надстройки для Word, начиная с версии
2007. Файл носит имя SaveAsPDFandXPS.exe и по этому названию легко
находится прямо на сайте Microsoft. Альтернативный путь –
воспользоваться сторонней программой-конвертером, которые иногда тоже
выпускаются в виде дополнения к Microsoft Word, иногда – в виде
отдельной программы. Их существует по-истине огромное количество,
платных и бесплатных, и я не буду вас дезориентировать, предлагая что-то
конкретное – все зависит от задачи. Некоторые такие инструменты
предлагают лишь чистое сохранение уже готового и отформатированного
документа, некоторые позволяют в него вмешаться и отредактировать или
добавить какой-то функциональности – установить ту самую защиту от
копирования или пароль на открытие, сформировать оглавление и ссылки,
дополнить элементами оформления, оптимизировать объем и качество
иллюстраций и пр. Есть и официальная (платная) программа для этой цели –
Adobe Acrobat.
Иногда в связи с PDF возникают
специфические задачи – например, в нем может сохраняться один только
слой изображений, т. е. документ тогда представляет собой фактически
постраничный набор картинок, объединенных в общий файл. Это не очень
удобное представление (в первую очередь из-за большого объема файла и
невозможности хоть как-то его переформатировать), но при необходимости
сохранения внешнего вида оригинального документа нередко просто нет
другого выхода. Такое виртуозно «умеет» проворачивать все тот же Fine
Reader – вы просто сканируете оригинал постранично, не распознавая сего,
а потом сохраняете результат в PDF.
Интересно, что с помощью Fine Reader
вместе со старым Word 2003 и более «древними» версиями можно выполнить
без специальных программ и задачу создания чисто текстового
PDF-документа, сохраняющего форматирование оригинального DOC-файла. Для
этого надо распечатать документ с помощью Word 2003 на виртуальном
принтере Microsoft (он образуется в системе самостоятельно после
установки Office и может носить любимые в Microsoft длинные и ничего не
говорящие названия вроде Microsoft Office Document Image Writer). Перед
печатью следует через свойства этого принтера установить формат печати
TIFF. Будет создан огромный TIF-файл (не пугайтесь, если он после
создания автоматически откроется в графической программе), который затем
вы загрузите в Fine Reader и сохраните в формате PDF. Результат будет
черно-белый, картинки воспроизведутся безобразно, но текстовые
PDF-документы таким способом получаются вполне прилично. В новых версиях
Office принтер Microsoft уже формат TIFF не поддерживает, но там есть,
как мы говорили, и более совершенные средства. |