Оцифровка книг, опыт работы под линуксом
В этой заметке я постарался собрать и обощить свой опыт сканирования и оцифровки книг под линуксом.
В этой заметке я постарался собрать и обощить свой опыт сканирования и оцифровки книг под линуксом.
Как многие знают, сестра у меня учится на восточке, и поддержка ввода иероглифов для неё - необходимая вещь. Мне это не особо нужно, хватает гугло-транслейта. Поэтому, чтобы не забыть, как настраивать - пишу этот пост.
Сразу оговорюсь, что это - своеобразная шпаргалка по настройке и на полноценное исследование не претендует.
Ещё одна памятка по udpxy, как лечить такую вот ошибку:
Relaying traffic from socket[5] to socket[8], buffer size=[2048], Rmsgs=[1], pauses=[0]
read_buf: read: Resource temporarily unavailable
read_data - EOF
Exited relay loop: received=[-1], sent=[0], quit=[0]
multicast-group [DROP]
Mcast listener socket=[5] closed
Child process=[16797] exits with rc=[0]
Методом научного тыка, было установлено, что дело в непрописанном маршруте на сеть, с которой идёт вещание (10.0.0.0/8).
Совершенно случайно удалось записать лог ядра при отказе системнного диска. Решил сделать этакое наглядное пособие.
Вообще, сначала грешил на особенности kvm'а на amd (вторая строчка в логе), но поймал отвал диска. Как выяснилось впоследствии - у него глючный контроллер, небольшая нагрузка - и система встаёт колом, без каких бы то ни было сообщений. SysRQ помогал не всегда.
Проблема файлов в "национальной кодировке" внутри zip-архивов достаточно старая, лет 5 ей есть точно. Вменяемого патча нет до сих пор.
Временным решением может быть следующие команды. Распаковываем как обычно, лучше в пустой директории.
ls -1 * | iconv -f cp1252 -t cp850 | iconv -f cp866 -t utf8
Это чтобы посмотреть, правильно ли перекодируются имена. Если на выходе что-то вменяемое, запускаем переименование:
ls -1 * | while read F
do
N=$(echo "$F" | iconv -f cp1252 -t cp850 | iconv -f cp866 -t utf8)
mv "$F" "$N"
done
Обрабатываются все файлы в текущем каталоге. Если есть файлы с нормальными именами - исправьте в начале «*» на соответствующий шаблон.