Конвертация ворд (док) в тхт или в html
Недавно столкнулся с этим вопросом. Нужно конвертировать несколько сотен файлов. Стандартный TotalDocConverter тупит. А у меня до того еще и комп старенький и слабенький.
Вопрос решил с помощью Doc2Txt
Для конвертации doc в html воспользовался программой DocToHtml.
Прога отличная, есть множество настроек. Но условно-бесплатная. Стоит всего нескоьлко долларов. Но окупает себя с лихвой. Настроил так что выдавала готовые хтмл странички. Для тех кто наполняет сайты самое то.
Что можно отметить среди настроек и особенностей:
- вытягивает картинки, может налету их конвертировать, изменять размер.
- можно настраивать мета-теги будущего документа
- можно настраивать как будут подключены стили
- какие эллементы шрифта конвертировать а какие нет
- какие отступы, интервалы, параграфы делать, какие заголовки ставить
- конвертирует таблицы
- можно предварительно сделать хтмл шаблон в который будет вставляться результат конвертации
- можно задать параметры поиска/замены, которые прога будет осуществлять по ходу конвертации
- ну и также возможна пакетная конвертация файлов.
- ну и можно также разбивать сам файл на отдельные страницы
Таким образом мне удалось сконвертировать и получить несколько тысяч страниц. А с помощью еще некоторого кода на php в итоге получить почти 100 тыс страниц. Не все правда были проиндексированы — в яндекс попало всего 23 тыс, зато в гугл около 98 тыс.
Ну а тем кто беременный и кто хочет узнать вес на 18 неделе беременности стоит обратится в женскую консультацию Вашей районной поликлиники к акушер-гинекологу.
Похожие записи по теме: