Как сконвертировать pdf в html?


#1

Добрый вечер. Помогите разобраться с вопросом каким способом лучше всего из pdd сделать html, с минимумом отличий?


#2

Файлов много? Разово или динамически по запросу?


#3

На данный момент учебника всего 3. Но планируется, что администратор, условно говоря мин образования, сможет из кабинета их добавлять и удалять. В общей сумме их 450шт будет, тоесть получается 450 html файлов(но это мечты успешного запуска проекта после стажировки))
Мне для презентации в субботу нажо показать в юзер стори, что админ захотел жобавить учебник, в панели добавил его и он отобразился в списке. Дальше уже ученик может с ним работать. И казадось бы, вставить в редактор html верстку и сохранить в каком нибудь longtext в бд, а там выводить не сложно. Но стиди и картинки это проблема(


#4

Для тестов использовал pdf-ку размером в 12мб.

Из коммандлайновых утилит нашел такую: https://github.com/coolwanglu/pdf2htmlEX/wiki/Building. Дала единую html-ку размером 30мб.

Есть еще сайт https://pdf.io/pdf2html/, тоже работает. HTML-ка получилась тоже одна но в 2 раза больше чем от коммандлайновой утилиты: 75мб.

UPD ссылка на скачивание утилиты https://github.com/coolwanglu/pdf2htmlEX/wiki/Download


#5

Командлайновую утилиту не понял как запустить, сделал через конвертер. Действительно очень хорошо получается, теперь придумать осталось загрузку файла и подключение его в нужном месте :)

Огрооомное спасибо :)


#6

https://github.com/coolwanglu/pdf2htmlEX/wiki/Download тут есть загрузки. Если ты из-под виндоус, то попробуй скачать и запускать надо через cmd. Умеешь пользоваться cmd?


#7

Да, не все знаю, но немного умею)


#8

В конечном итоге я бы использовать коммандлайновую утилиту. Она дает файлы в 2 раза меньше чем сайт. Да и сайт не понятно сколько будет работать, а утилиту скачал и имеешь.