Из PDF в текст

Электронно-Вычислительные Машины и все, что с ними связано
Ответить
Сообщение
Автор
Аватара пользователя
Duke_Nukem
Сообщения: 335
Зарегистрирован: 07 окт 2011, 19:28
Откуда: Дубна
Контактная информация:

Из PDF в текст

#1 Сообщение Duke_Nukem » 19 мар 2012, 22:38

Имеется отсканированная книга в формате PDF (хорошее качество, буквы видно четко). Есть ли какая-нибудь софтина чтоб перевести это в текстовый формат?

alsolnze
Сообщения: 2516
Зарегистрирован: 16 дек 2010, 23:21

Re: Из PDF в текст

#2 Сообщение alsolnze » 19 мар 2012, 23:34

ABBYY FineReader 9.0
Трезвость - русская традиция!

Аватара пользователя
Duke_Nukem
Сообщения: 335
Зарегистрирован: 07 окт 2011, 19:28
Откуда: Дубна
Контактная информация:

Re: Из PDF в текст

#3 Сообщение Duke_Nukem » 19 мар 2012, 23:39

alsolnze писал(а):ABBYY FineReader 9.0
Спасибо, работает :Yahoo!: Только я пробник скачал 11.0

alsolnze
Сообщения: 2516
Зарегистрирован: 16 дек 2010, 23:21

Re: Из PDF в текст

#4 Сообщение alsolnze » 20 мар 2012, 00:25

Duke_Nukem писал(а):
alsolnze писал(а):ABBYY FineReader 9.0
Спасибо, работает :Yahoo!: Только я пробник скачал 11.0
могу ошибаться, но вроде бы в пробной версии нельзя перевести сразу все страницы, а только по одной... Т.е. распознать можно все, а вот передать все страницы в единый документ не получится...
Трезвость - русская традиция!

Аватара пользователя
Duke_Nukem
Сообщения: 335
Зарегистрирован: 07 окт 2011, 19:28
Откуда: Дубна
Контактная информация:

Re: Из PDF в текст

#5 Сообщение Duke_Nukem » 20 мар 2012, 00:34

alsolnze писал(а):
Duke_Nukem писал(а):
alsolnze писал(а):ABBYY FineReader 9.0
Спасибо, работает :Yahoo!: Только я пробник скачал 11.0
могу ошибаться, но вроде бы в пробной версии нельзя перевести сразу все страницы, а только по одной... Т.е. распознать можно все, а вот передать все страницы в единый документ не получится...
Да, и еще нельзя заменять ошибки. Буду искать полную

GSX
Сообщения: 739
Зарегистрирован: 02 мар 2010, 20:28
Откуда: РФ

Re: Из PDF в текст

#6 Сообщение GSX » 20 мар 2012, 01:27

В на трекере нету разве?
Portable:
CЕ Litе portable;

FinеRеadеr CE 11.0.102.583 portable
Интерфейс русский, языки распознавания - русский, английский, греческий, цифры. Другие языки/интерфейсы/хелпы и пр. подключаются плагинами AppLinks. Версия ThinApp 4.7.
Соединение со сканером работать, скорее всего, не будет. Остальное проверяйте самостоятельно.
=====
FinеRеadеr 11.0.102.583 CЕ FULL Rеpack

Особенности
Платформа: x86/x64
Язык: Русский, Английский, Украинский
Присутствуют все языки распознавания
Лекарство вшито (от Pafnutiy761)
Сервис лицензирования удален
==
все ссылки отправлены в ЛС

Аватара пользователя
Duke_Nukem
Сообщения: 335
Зарегистрирован: 07 окт 2011, 19:28
Откуда: Дубна
Контактная информация:

Re: Из PDF в текст

#7 Сообщение Duke_Nukem » 20 мар 2012, 01:33

GSX писал(а):В на трекере нету разве?
Portable:
CЕ Litе portable;

FinеRеadеr CE 11.0.102.583 portable
Интерфейс русский, языки распознавания - русский, английский, греческий, цифры. Другие языки/интерфейсы/хелпы и пр. подключаются плагинами AppLinks. Версия ThinApp 4.7.
Соединение со сканером работать, скорее всего, не будет. Остальное проверяйте самостоятельно.
=====
FinеRеadеr 11.0.102.583 CЕ FULL Rеpack

Особенности
Платформа: x86/x64
Язык: Русский, Английский, Украинский
Присутствуют все языки распознавания
Лекарство вшито (от Pafnutiy761)
Сервис лицензирования удален
==
все ссылки отправлены в ЛС
:beer:

serbio
Сообщения: 2
Зарегистрирован: 22 окт 2011, 13:39
Откуда: Dubna

Re: Из PDF в текст

#8 Сообщение serbio » 20 мар 2012, 10:56

ABBYY PDF Transformer офигительно все конвертит в эксел ворд и т.д.

Аватара пользователя
Filimon Кykyev
Сообщения: 15458
Зарегистрирован: 18 апр 2008, 22:15
Откуда: БВ-ЛБ
Контактная информация:

Re: Из PDF в текст

#9 Сообщение Filimon Кykyev » 20 мар 2012, 14:25

serbio писал(а):ABBYY PDF Transformer офигительно все конвертит в эксел ворд и т.д.
Если пдф был из текста создан.
А если, как картинка или скан не пройдет.
alsolnze писал(а):могу ошибаться, но вроде бы в пробной версии нельзя перевести сразу все страницы, а только по одной... Т.е. распознать можно все, а вот передать все страницы в единый документ не получится...
Там по памяти могут ограничения быть, книга больше ресурса сожрет.

ABBYY FineReader - самое то. Только (могу ошибиться) в pdf-файле может быть защита от распознавания.
У меня была ситуевина, пришлось распечатать, отсканировать, править в фоторедакторе (свет-контраст) и потом уже распознавать :crazy:

GSX
Сообщения: 739
Зарегистрирован: 02 мар 2010, 20:28
Откуда: РФ

Re: Из PDF в текст

#10 Сообщение GSX » 20 мар 2012, 17:13

Filimon Кykyev, а ломануть ни как? :
Wondershare PDF Password Remover
PDF Password Remover
SysTools PDF Unlocker

ABBYY PDF Transformer 3 http://nnm-club.ru/forum/viewtopic.php?t=353174

PDF to Word Online - http://www.pdfonline.com/pdf-to-word-converter/ (не пробовал)
Последний раз редактировалось GSX 20 мар 2012, 17:23, всего редактировалось 1 раз.

Швейк

Re: Из PDF в текст

#11 Сообщение Швейк » 20 мар 2012, 17:18

GSX писал(а):а ломануть ни?как?
В дубненском ОБЭПе работают очень добрые, хорошие и вежливые люди, которые запросто "рубят показатели" на таких неграмотных школьниках, как Вы.
Приходите к Филимону в гости, ломаните прогу, светаните личико в Веб-камеру.
Всего-то до двух лет лишения свободы. :smile:

Изображение

flint
Сообщения: 1866
Зарегистрирован: 25 июн 2008, 10:41
Откуда: из-за стола...

Re: Из PDF в текст

#12 Сообщение flint » 20 мар 2012, 17:29

Швейк писал(а): В дубненском ОБЭПе...
уэбипк
НетАбстинентномуСиндрому

GSX
Сообщения: 739
Зарегистрирован: 02 мар 2010, 20:28
Откуда: РФ

Re: Из PDF в текст

#13 Сообщение GSX » 20 мар 2012, 17:32

del
Последний раз редактировалось GSX 10 апр 2012, 14:23, всего редактировалось 2 раза.

Швейк

Re: Из PDF в текст

#14 Сообщение Швейк » 20 мар 2012, 17:43

GSX писал(а):- не из Дубны я.
Был бы человек хороший, а статья всегда найдётся и каталажек на всех хватит. :smile:
Явку с повинной - всегда примем.
http://www.gutallin.ru/news.html

Изображение

Аватара пользователя
Filimon Кykyev
Сообщения: 15458
Зарегистрирован: 18 апр 2008, 22:15
Откуда: БВ-ЛБ
Контактная информация:

Re: Из PDF в текст

#15 Сообщение Filimon Кykyev » 20 мар 2012, 18:44

GSX писал(а):Filimon Кykyev, а ломануть ни как?
Иногда прошел ломки занимает больше времени, чем более простой путь :smile:

Аватара пользователя
LuckyOne
Сообщения: 1655
Зарегистрирован: 21 май 2008, 13:25

Re: Из PDF в текст

#16 Сообщение LuckyOne » 21 мар 2012, 03:39

Duke_Nukem писал(а):Имеется отсканированная книга в формате PDF (хорошее качество, буквы видно четко). Есть ли какая-нибудь софтина чтоб перевести это в текстовый формат?
Конечно есть! И совершенно бесплатно. Инструкция в два шага:

1. ставим Линукс.
2. открываем консоль, и набираем там две простых команды подряд:
$> convert -density 200 my_file.pdf my_file.png
$> gocr -i my_file-*.png > my_file.txt

Всё, в файле my_file.txt содержится прекрасно распознанный текст. Если GOCR по какой-то непонятной причине не нравится, то есть гуглевский Tesseract, тоже бесплатный.

GSX
Сообщения: 739
Зарегистрирован: 02 мар 2010, 20:28
Откуда: РФ

Re: Из PDF в текст

#17 Сообщение GSX » 21 мар 2012, 12:53

Што бы Линукс поставить нужно жесткий правильно на разделы разбить. С LiveCD можно все сделать, без установки системы, как вариант :smile:

Аватара пользователя
Filimon Кykyev
Сообщения: 15458
Зарегистрирован: 18 апр 2008, 22:15
Откуда: БВ-ЛБ
Контактная информация:

Re: Из PDF в текст

#18 Сообщение Filimon Кykyev » 21 мар 2012, 13:54

GSX писал(а):Што бы Линукс поставить нужно жесткий правильно на разделы разбить.
В 7-х окнах, есть штатная виртуальная машина, запускай и ставь какую хочешь систему, хоть андроид. Поработал, потом снес, всего делов-то :smile:

Ответить

Вернуться в «ЭВМ»