Главная > Автоматизация > Конвертация ворд (док) в тхт или в html

Конвертация ворд (док) в тхт или в html

Недавно столкнулся с этим вопросом. Нужно конвертировать несколько сотен файлов. Стандартный TotalDocConverter тупит. А у меня до того еще и комп старенький и слабенький.

Вопрос решил с помощью Doc2Txt

Для конвертации  doc в html воспользовался программой DocToHtml.

Прога отличная, есть множество настроек. Но условно-бесплатная. Стоит всего нескоьлко долларов. Но окупает себя с лихвой. Настроил так что выдавала готовые хтмл странички. Для тех кто наполняет сайты самое то.

Что можно отметить среди настроек и особенностей:

  • вытягивает картинки, может налету их конвертировать, изменять размер.
  • можно настраивать мета-теги будущего документа
  • можно настраивать как будут подключены стили
  • какие эллементы шрифта конвертировать а какие нет
  • какие отступы, интервалы, параграфы делать, какие заголовки ставить
  • конвертирует таблицы
  • можно предварительно сделать хтмл шаблон в который будет вставляться результат конвертации
  • можно задать параметры поиска/замены, которые прога будет осуществлять по ходу конвертации
  • ну и также возможна пакетная конвертация файлов.
  • ну и можно также разбивать сам файл на отдельные страницы

Таким образом мне удалось сконвертировать и получить несколько тысяч страниц. А с помощью еще некоторого кода на php в итоге получить почти 100 тыс страниц. Не все правда были проиндексированы — в яндекс попало всего 23 тыс, зато в гугл около 98 тыс.

Ну а тем кто беременный и кто хочет узнать вес на 18 неделе беременности стоит обратится в женскую консультацию Вашей районной поликлиники к акушер-гинекологу.


Похожие записи по теме:
Понравился пост? Подпишись на обновления блога: RSS wordpress insideRSStwitter wordpress insideTwitter!
 
Категории: Автоматизация  Просмотров: 320

Уважаемый комментатор, я очень благодарен за оставленные тобой комментарии! Мне очень приятно их читать. Но порой встречаются люди, которые просто в наглую пытаются продвинуть свой ресурс, размещая ссылку в комментариях только для того, что бы увеличить ТИЦ. Меня порой просто удивляют такие люди... С недавних пор я стал сносить ссылки, которые идут на откровенный бред, никак не похожий на мой блог. Все остальные нормальные блоги будут опубликованы! Если Вы спамер, проходите мимо! Не тратьте время зря! Я ведь всё равно проверяю каждый сайт на соответствие с требованиями. :)