Сохранен 6
https://2ch.hk/r/res/163980.html
24 декабря Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!

Сап, аноны. Ищу прогу, которая считывает текст

 Аноним 22/03/19 Птн 13:08:42 #1 №163980 
15528151474070.mp4
Сап, аноны. Ищу прогу, которая считывает текст нарисованный на картинке и переводит его в обычный текст (txt doc и тп). Мне просто нужно переписать огромный кусок текста с фотографии, блядь, но мне лень. Поэтому реквестирую такую хню.
Аноним 22/03/19 Птн 17:35:16 #2 №163993 
В гугл документах можно загрузить фотку и все переведет в док, как сможет, как-то так делал полгода назад
Аноним 22/03/19 Птн 17:44:45 #3 №163995 
>>163980 (OP)
Лол, мне как раз друг-погромист на днях пояснял за распознавание текста, приведу его мессагу:
>не знаю, как там с уже готовой автоматизацией, но сейчас понадобилось распознать 70+ страниц текста в виде картинок внутри пдфки - одной строкой нарезал страницы на png-шки утилитой ImageMagick, потом поставил tesseract-ocr (гугловая утилита для распознавания - пришлось поискать виндовый билд, причём с первого раза поставилась чуть более старая версия, которая не поддерживала нейронки, а без них распознавала очень коряво) и коротким скриптом пустил распознаваться все png-шки поочереди с указанием использования русского языка, а потом тем же скриптом склеиваться в одну общую пдфину, в которой уже можно использовать поиск

в общем, если понадобится:
https://imagemagick.org/script/download.php#windows бинари имаджмаджика

пример использования:
convert -density 300 input.pdf[0-30] output-%d.png
получаем первые 30 страниц в виде png-шек (может сожрать много гигов памяти, тогда стоит поменьше страниц за раз конвертить или снижать денсити)

https://github.com/UB-Mannheim/tesseract/wiki
виндовый инсталлер тессеракта

пример использования:
tesseract 1.png output -l rus pdf
распознаёт в 1.png всё русское и выплёвывает в виде pdf-файла с одной страницей
Аноним 22/03/19 Птн 17:58:16 #4 №163996 
ABBYY FineReader
Аноним 22/03/19 Птн 17:59:32 #5 №163998 
https://translate.yandex.ru/ocr
но бывает криво
Аноним 23/03/19 Суб 20:32:18 #6 №164046 
comments powered by Disqus

Отзывы и предложения