24 декабря Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!
Линукс софта тред Постим какие программы анон юзает на линуксе, советуем. Я начну: DE/WM - KDE Plas
>>277524226 (OP) а самому ocr запилить слабо? ну чётам сложного. считаешь 2д фурье спектр, пики аппроксимируешь прямой -> это направление текста. самый жирный пик -> частота строк. по линиям перпендикулярно направлению текста ищешь минимумы сумм значений -> пустоты между строками -> бьёшь на строки. идёшь по строкам. из межстрочного расстояния прикидываешь размер символа. в этих пределах ищешь ограниченные области с резкими краями. сортируешь по размеру. считаешь свёртку близких по габаритам фрагментов и составляешь словарь символов текста. идёшь по словарю и ищешь корреляцию символов словаря с символами шрифтов. составляешь предварительный текст. проверяешь полученные слова орфографическим словарём на отклонения. ищешь наиболее похожие совпадения, а отклонения перепроверяешь расширив список для сравнения.
>>277524226 (OP) раньше жадно ставил всё что мог, пытался опробовать всё до чего дотянусь, последнее время стал стараться пользоваться тем что уже есть с минимальными изменениями. некоторые проги ставлю по привычке и чтобы сделать более менее одинаковое по функиональности пространство как на винде так и в лине. DE - вообще по барабану, vlc - смотреть видеофайлы ffmpeg - по-быстрому что-нибудь сконвертировать, отрезать, извлечь/удалить/добавить дорожку. yutube-dl - скачать субтитры/метаданные видео с ютуба, само видео стало очень медленно качаться, видимо ютуб ограничивает. wget - скачать что-то по ссылке, чтоб не париться с браузером vim - смотреть/редактировать не только текст. bash/zsh - куда без шелла exiftool - поворачивать жипеги/видео без пережатия, удалять мусорные метадонные python - калькулятор :) git - гитить tcc - забавы ради, миниатюрный компилятор си, можно запускать простенькие сишные исходники как скрипты с компиляцией на лету. но вполне настоящий.
DE/WM - bspwm Ядро - archl Дисплейный протокол - X Диспетчер файлов - ranger Браузер - firefox Фоторедактор и рисовалка - krita PDF просмотр - zathura Для текста - nvim Плеер - mpv Терминал - urxvt (жрет мало оперативы)
btop++ - System Monitor fzf - быстрый поиск файлов
>>277524226 (OP) i3 gaps zen ядро Иксы Ranger Vivaldi qbittorrent Почтовик не юзаю Libreoffice Читалка для pdf zathura Видеоредактор shotcut Рисовалка krita Синхронизацию не юзаю Эмуляцию тоже Виртуалки qemu/kvm + libvirtd Терминал kitty Текстовый редактор vim с плагинами и vscode Zsh shell Vpn раньше юзал proton со скачанными конфигами openvpn, сейчас уже не работает. Да и не нужно
>>277524226 (OP) i3 x11 ranger librewolf transmission Офисами не пользуюсь poppler Не редактирую фото Андроидом не пользуюсь и не эмулирую urxvt zsh vpn не пользуюсь
>>277541305 Никогда не пользовался total commander/norton commander или фаром. Логика твоя хромает.
> пит буль Орфография тоже. > Союз причем имеет присоединительное значение (Эксперимент был проведен удачно, причем впервые). Сочетание при чем употребляется в вопросительных предложениях: При чем тут он со своими претензиями?
нюанусы есть, конечно. много их - текст по колонкам или с художественным оформлением, картинки-графики, дефекты сканирования, шум, кляксы, искажения, неконтрастный фон или с изображением, смешение языков, непропечатанные литеры.
эта задача не имеет чёткой границы окончательного и правильного решения, ты исходишь из доступных ресурсов и делаешь максимум возможного с негарантированным результатом.
>>277537052 ты сначала группируешь символы какие есть, то есть складываешь по стопочкам максимально похожие друг на друга. а потом каждый отдельно сравниваешь со всем набором глифов из всех шрифтов, которые хочешь искать. можно натаскать на это дело нейросетку, щас это модно, но суть та же - сравнение с шаблоном, просто нейросетка хранит данные о всём изученном в обобщённом виде и сравнивает всё сразу.
ocr как правило используется для загрузки печатных книг и документов с небольшим разнообразием шрифтов и размеров на странице. с художественными обложками, плакатами и авторскими шрифтами придётся работать отдельно.
посоветуйте нормальный простой просмоторщик картинок и гифок (feh сразу мимо, он вроде гифки не умеет), я пользуюсь imv, он вроде норм но большие картинки (хз >10к пикселей в высоту например) не открывает
>>277524226 (OP) Вот когда будет аналог автокада - тогда и приходи. > Либрекад, говнокад, парашакад и хуйнякад Спасибо. И бесплатно не надо. > реее вайн Хуяйн. Ты пробовал его на вайн ставить? Нет. Ну, попробуй, придешь потом - расскажешь. Ебли натурально на день из-за недостатка библиотек
Постим какие программы анон юзает на линуксе, советуем.
Я начну:
DE/WM - KDE Plasma
Ядро - zen kernel
Дисплейный протокол - wayland
Диспетчер файлов - Dolphin
Браузер - chromium
Торрент - qbittorrent
Почтовик - Evolution, он поддерживает office 365 exchange
Офис - WPS Office / Libreoffice
PDF редактор - pdfx/masterpdf
Видеоредакторы - Kdenlive, handbrake
Фоторедакторы - RawTherapee, Krita
Синхронизация с андроидом - KDE connect
Эмуляция андроида и приложений - waydroid
Виртуализация - VirtualBox
Запуск win32 софта - portproton
Терминал - yakuake, konsole
Shell - fish
VPN - юзаю скрипт nm-vpngate, скачивающий openvpn профили с vpngate и импортирующий их в сетевой менеджер
Посоветуйте решение для OCR оцифровки отсканированого текста под линукс, ничего годного не могу найти.