pit сказал(а) 30 Сен 2015 - 10:22:
3 дня пыхтения и вот что я могу сказать по сохранению книг..... Устанавливаем расширение fireshot для Хрома и качаем в PDF формате. Иеще если сохраняешь по 1 странице, то после 10 странице начинается КАПЧА на скачивание
С количеством сохраняемых страниц всё намного хуже - разрешено сохранить постранично лишь 10% одной книги. Все сохранённые страницы попадают на личную "Книжную полку". Удалить их оттуда и сохранить следующие 10% невозможно - стоит системный запрет.
Сохранить можно в банальный MHT-файл (вебархив), но только после пролистывания в браузере ВСЕХ страниц книги, т. к. страницы представлены PNG-изображениями, порезанными на куски высотой прим. по 300 пикселей, и подгружаемыми по мере просмотра книги. При этом браузер начинает жрать память и возможны сбои. Сохранённые файлы тоже получаются крайне "тяжёлые", открываются долго и в разных браузерах отображаются по-разному. Как вариант возможно сохранение в несколько MHT-файлов, например по 50-100 страниц. Также при пролистывании страниц книги нередко бывают сбои при подгрузке изображений и они отображаются серыми прямоугольниками. Обновить только эту страницу книги для повторной подгрузки картинок нет возможности - требуется обновление всей страницы браузера. При этом придётся пролистывать все страницы по-новой.
Извлечь книгу в виде упомянутых картинок (кстати, довольно хорошего качества) хоть и муторно, но в принципе не сложно. Другой вопрос - сборка кусков в полноценные страницы. Получается крайне затратно по времени - дешевле книгу купить в цифре ил бумажном варианте.
Сохранение в стандартный html с папкой для медиа и служебных файлов доступа к картинкам не даст, т. к. они включены в закодированном в base64 виде в общий php-файл.
Печать в PDF с использованием PDF-драйверов печати не "катит" - страницы книги сохраняются пустыми.
По FireShot ничего сказать не могу - не пробовал. Судя по названию, это плагин захвата страниц в виде изображений с сохранением в PDF. Если так, то вступает в силу описанное выше правило пролистывания и после захвата на выходе получим файл с одной бесконечной страницей. Впрочем, это лишь мои предположения. Как на практике - нужно проверить.