понедельник, 19 декабря 2011 г.

Конверторы html в fb2

Столкнулся с тем, что book reader ко всем своим прочим достоинствам криво показывает html Самиздата - сплошным текстом, игнорируя разбивку на абзацы, в связи с чем озаботился поиском конвертора из html в fb2. Тренировался на вот этих текстах - http://zhurnal.lib.ru/d/denisow/strategiadoc.shtml и http://samlib.ru/p/popowa_nadezhda_aleksandrowna/2.shtml.

Результат:
  • http://ebook.online-convert.com/convert-to-fb2 - удобно, что на вход можно подать непосредственно ссылку, без предварительной закачки текста себе. Разметку абзацев, которые были выделены честными <p> показывает, а вот экзотические <dd> игнорирует.
  • http://fb2.ljface.ru/ - тоже online конвертор, тоже принимает ссылки. Но здесь наоборот, абзацы выделенные <dd> на месте, а все что размечено честными <p> слиплось в кучу. Ну и с bold-ом странным образом умничает - может превратить в заголовки, а может в эпиграфы, а то вообще превратит в заголовок последнее предложение перед фразой, выделенной bold-ом, возможно это артефакты от попытки обработать разбивку на <dd>.
  • http://htmldocs2fb2.narod.ru/ v1.0.29 beta - offline программка, bold показывает правильно, абзацы размеченные <p> показывает, <dd> игнорирует. *.shtml файлы не видит, надо переименовывать в html.
  • http://convertonlinefree.com/DocumentToFB2RU.aspx - Online конвертор, но ссылки не принимает, только файлы (причем *.shtml файлы не принимаются, видимо автор тоже не в курсе, что это тоже самое что htm и html). Абзацы и <p> и <dd> понимает, но игнорирует выделение текста bold-ом.
  • Any To Fb2 - offline программка (вернее vbs скрипт), но принимает и ссылки на html странички. Bold показан правильно, абзацы понимает всякие, но местами откуда-то лезет курсив, которого в оригинале нет. Ну и интерфейс на основе альтернативной логики.
  • FictionBook Tools v2.0 - для конвертации использует Any To Fb2.
  • http://www.web2fb2.net/ - Online конвертор, принимает ссылки. Bold показывает правильно, с абзацами, выделенными <p> всё нормально, разбивки на абзацы, выделенные тегами <dd> нет.
  • ooofbtools - плагин для OpenOffceOrg Writer. В текущей версии 1.25 почему-то меню конвертора при открытии html документов исчезает. Приходится скачивать html, открывать и экспортировать его в odt, потом открывать odt и конвертировать в fb2. Зато есть и абзацы (и <p> и <dd>) и правильное отображение bold-а.

Резюм - нету в жизни щастя сконвертировать html можно, но удовольствия мало.

UPD: OOoFBTools исправили.

UPD: Новые версии OOoFBTools лежат здесь, обсуждение - в группе ru-fbtools

1 комментарий:

  1. shtml не совсем тоже самое что и html, так как htm, html отдаются сервером без обработки, а shtml может включать директивы для выполнения сервером

    ОтветитьУдалить