Из PDF в текст
- Duke_Nukem
- Сообщения: 335
- Зарегистрирован: 07 окт 2011, 19:28
- Откуда: Дубна
- Контактная информация:
Из PDF в текст
Имеется отсканированная книга в формате PDF (хорошее качество, буквы видно четко). Есть ли какая-нибудь софтина чтоб перевести это в текстовый формат?
- Duke_Nukem
- Сообщения: 335
- Зарегистрирован: 07 окт 2011, 19:28
- Откуда: Дубна
- Контактная информация:
Re: Из PDF в текст
Спасибо, работаетalsolnze писал(а):ABBYY FineReader 9.0

Re: Из PDF в текст
могу ошибаться, но вроде бы в пробной версии нельзя перевести сразу все страницы, а только по одной... Т.е. распознать можно все, а вот передать все страницы в единый документ не получится...Duke_Nukem писал(а):Спасибо, работаетalsolnze писал(а):ABBYY FineReader 9.0Только я пробник скачал 11.0
Трезвость - русская традиция!
- Duke_Nukem
- Сообщения: 335
- Зарегистрирован: 07 окт 2011, 19:28
- Откуда: Дубна
- Контактная информация:
Re: Из PDF в текст
Да, и еще нельзя заменять ошибки. Буду искать полнуюalsolnze писал(а):могу ошибаться, но вроде бы в пробной версии нельзя перевести сразу все страницы, а только по одной... Т.е. распознать можно все, а вот передать все страницы в единый документ не получится...Duke_Nukem писал(а):Спасибо, работаетalsolnze писал(а):ABBYY FineReader 9.0Только я пробник скачал 11.0
Re: Из PDF в текст
В на трекере нету разве?
Portable:
CЕ Litе portable;
FinеRеadеr CE 11.0.102.583 portable
Интерфейс русский, языки распознавания - русский, английский, греческий, цифры. Другие языки/интерфейсы/хелпы и пр. подключаются плагинами AppLinks. Версия ThinApp 4.7.
Соединение со сканером работать, скорее всего, не будет. Остальное проверяйте самостоятельно.
=====
FinеRеadеr 11.0.102.583 CЕ FULL Rеpack
Особенности
Платформа: x86/x64
Язык: Русский, Английский, Украинский
Присутствуют все языки распознавания
Лекарство вшито (от Pafnutiy761)
Сервис лицензирования удален
==
все ссылки отправлены в ЛС
Portable:
CЕ Litе portable;
FinеRеadеr CE 11.0.102.583 portable
Интерфейс русский, языки распознавания - русский, английский, греческий, цифры. Другие языки/интерфейсы/хелпы и пр. подключаются плагинами AppLinks. Версия ThinApp 4.7.
Соединение со сканером работать, скорее всего, не будет. Остальное проверяйте самостоятельно.
=====
FinеRеadеr 11.0.102.583 CЕ FULL Rеpack
Особенности
Платформа: x86/x64
Язык: Русский, Английский, Украинский
Присутствуют все языки распознавания
Лекарство вшито (от Pafnutiy761)
Сервис лицензирования удален
==
все ссылки отправлены в ЛС
- Duke_Nukem
- Сообщения: 335
- Зарегистрирован: 07 окт 2011, 19:28
- Откуда: Дубна
- Контактная информация:
Re: Из PDF в текст
GSX писал(а):В на трекере нету разве?
Portable:
CЕ Litе portable;
FinеRеadеr CE 11.0.102.583 portable
Интерфейс русский, языки распознавания - русский, английский, греческий, цифры. Другие языки/интерфейсы/хелпы и пр. подключаются плагинами AppLinks. Версия ThinApp 4.7.
Соединение со сканером работать, скорее всего, не будет. Остальное проверяйте самостоятельно.
=====
FinеRеadеr 11.0.102.583 CЕ FULL Rеpack
Особенности
Платформа: x86/x64
Язык: Русский, Английский, Украинский
Присутствуют все языки распознавания
Лекарство вшито (от Pafnutiy761)
Сервис лицензирования удален
==
все ссылки отправлены в ЛС

Re: Из PDF в текст
ABBYY PDF Transformer офигительно все конвертит в эксел ворд и т.д.
- Filimon Кykyev
- Сообщения: 15458
- Зарегистрирован: 18 апр 2008, 22:15
- Откуда: БВ-ЛБ
- Контактная информация:
Re: Из PDF в текст
Если пдф был из текста создан.serbio писал(а):ABBYY PDF Transformer офигительно все конвертит в эксел ворд и т.д.
А если, как картинка или скан не пройдет.
Там по памяти могут ограничения быть, книга больше ресурса сожрет.alsolnze писал(а):могу ошибаться, но вроде бы в пробной версии нельзя перевести сразу все страницы, а только по одной... Т.е. распознать можно все, а вот передать все страницы в единый документ не получится...
ABBYY FineReader - самое то. Только (могу ошибиться) в pdf-файле может быть защита от распознавания.
У меня была ситуевина, пришлось распечатать, отсканировать, править в фоторедакторе (свет-контраст) и потом уже распознавать

Re: Из PDF в текст
Filimon Кykyev, а ломануть ни как? :
Wondershare PDF Password Remover
PDF Password Remover
SysTools PDF Unlocker
ABBYY PDF Transformer 3 http://nnm-club.ru/forum/viewtopic.php?t=353174
PDF to Word Online - http://www.pdfonline.com/pdf-to-word-converter/ (не пробовал)
Wondershare PDF Password Remover
PDF Password Remover
SysTools PDF Unlocker
ABBYY PDF Transformer 3 http://nnm-club.ru/forum/viewtopic.php?t=353174
PDF to Word Online - http://www.pdfonline.com/pdf-to-word-converter/ (не пробовал)
Последний раз редактировалось GSX 20 мар 2012, 17:23, всего редактировалось 1 раз.
Re: Из PDF в текст
В дубненском ОБЭПе работают очень добрые, хорошие и вежливые люди, которые запросто "рубят показатели" на таких неграмотных школьниках, как Вы.GSX писал(а):а ломануть ни?как?
Приходите к Филимону в гости, ломаните прогу, светаните личико в Веб-камеру.
Всего-то до двух лет лишения свободы.


Re: Из PDF в текст
del
Последний раз редактировалось GSX 10 апр 2012, 14:23, всего редактировалось 2 раза.
Re: Из PDF в текст
Был бы человек хороший, а статья всегда найдётся и каталажек на всех хватит.GSX писал(а):- не из Дубны я.

Явку с повинной - всегда примем.
http://www.gutallin.ru/news.html

- Filimon Кykyev
- Сообщения: 15458
- Зарегистрирован: 18 апр 2008, 22:15
- Откуда: БВ-ЛБ
- Контактная информация:
Re: Из PDF в текст
Иногда прошел ломки занимает больше времени, чем более простой путьGSX писал(а):Filimon Кykyev, а ломануть ни как?

Re: Из PDF в текст
Конечно есть! И совершенно бесплатно. Инструкция в два шага:Duke_Nukem писал(а):Имеется отсканированная книга в формате PDF (хорошее качество, буквы видно четко). Есть ли какая-нибудь софтина чтоб перевести это в текстовый формат?
1. ставим Линукс.
2. открываем консоль, и набираем там две простых команды подряд:
$> convert -density 200 my_file.pdf my_file.png
$> gocr -i my_file-*.png > my_file.txt
Всё, в файле my_file.txt содержится прекрасно распознанный текст. Если GOCR по какой-то непонятной причине не нравится, то есть гуглевский Tesseract, тоже бесплатный.
Re: Из PDF в текст
Што бы Линукс поставить нужно жесткий правильно на разделы разбить. С LiveCD можно все сделать, без установки системы, как вариант 

- Filimon Кykyev
- Сообщения: 15458
- Зарегистрирован: 18 апр 2008, 22:15
- Откуда: БВ-ЛБ
- Контактная информация:
Re: Из PDF в текст
В 7-х окнах, есть штатная виртуальная машина, запускай и ставь какую хочешь систему, хоть андроид. Поработал, потом снес, всего делов-тоGSX писал(а):Што бы Линукс поставить нужно жесткий правильно на разделы разбить.
