?

Log in

No account? Create an account

Previous Entry Share Flag Next Entry
Загадки старых PDF-ов
Некрупный орёл
callmycow
Не старых, но книги внутри старые. Летом наскачивал "Морских сборников", сканированых гуглом в Нью-Йорке. И вот открываю один - конкретно, 1876, No 7 - а там текст в кадр не помещается. Справа толстенный обрез книги, любуйся сколько хочешь, а текст можешь дофантазировать. Но! Букс-гугл каким-то образом прочел невидимую часть текста. Хотя прочел с ошибками, поскольку старую русскую орфографию не понимает.
Дай, думаю, хотя бы вырежу из толстого PDF-а нужную мне статью. Недостающее в букс-гугле буду выискивать. Для вырезывания воспользовался foxit.pdf.editor. И что оказалось! Там все буквы есть! Они просто смещены и не помещаются в страницу! Как в той давней рекламе про широкоэкранные телевизоры "Изображение гораздо больше".
С данной статьей - я в том же редакторе передвинул картинку так, чтобы она читалась. Но если надо просмотреть наскоро всю подшивку, это ж умучаешься.
Никто не знает, как визуализировать закадровую часть текста? И вообще - что за фигня, что она есть?


  • 1
У меня стоит ABBYY PDF Transformer

Он из pdf ворд делает, или делает буквы распознаваемыми.

Можно поставить триал и попробовать. Должен взять весь текст, независимо от расположения.

А, спасибо, возьму на заметку.

Сложно назначить лечение, не осмотрев больного:) Курс лечения составляется после более глубокого изучения симптомов и выявления причин болезни. Так ведь? А причин может быть несколько (как минимум).
Я думаю, что такие файлы, да ещё в большом количестве, стряпаются автоматически. Берётся усреднённый размер страницы и в него центруются сканы. И никто потом не проверяет, что там влезло, а что нет.
В случае, когда изображение выходит за пределы документа, и само при этом не находится в контейнере, может помочь один из самых простых способов:
Выберите инструмент-стрелочку из меню Tools -> Advanced Editing -> Hide TouchUp и сдвиньте картинку куда захочется.
Ведь не все же страницы кривые? Или все? Тогда нужно будет раздвигать сам документ и... ну... в общем попробуйте сначала способ первый.
Кстати, можно вырезАть фрагменты изображения и делать из них джипеги не выходя из Акробата.

И вот ещё: некоторые страницы текста бывают собраны из нескольких изображений состыкованных друг с другом, тогда нужно будет выделить их все, а потом уже сдвигать.

Да, да доктор, так оно и есть. Часть текста - чёренькие буквы, они возникают на экране сразу, а другая часть - серенькая фотография текста, она появляется, слегка повыпендривавшись, секундой позже. И двигаются они, эти части, раздельно. Ну, собственно, это и позволяет делать (двигать)мой pdf.editor., и это показалось мне хлопотным. Хотя ведь такие картинки не сплошь и рядом. А вообще, я толком не знаю, что такое PDF, поэтому меня очень удивил сам факт существования этого "зазеркалья". И поставил в неловкость: ведь, не в силах прочесть текст, я попросил человека в СПб прислать мне ксерокс. Ксероксы пришли, но конверт в пути порвался, и несколько страниц пропали. И тут оказывается, что все это у меня есть, что я зря беспокоил человека, только нужно было иметь разум заглянуть в "зазеркалье". В общем, век живи. Спасибо!

  • 1