Делаем электронные книгиАвтор: KM <km@mypsion.ru>
Не секрет, что очень многие пользователи выбирали Psion как идеальный инструмент не только для работы, но и для чтения электронных книг. И действительно, он неплохо с этим справляется: по сравнению с Palm у Psion гораздо больший объем памяти для их хранения и экран с большой разрешающей способностью: таким образом, шрифт выглядит более приятно для глаз, да и не приходится постоянно листать страницу за страницей, так как один экран вмещает относительно много текста. Нельзя не упомянуть и то, что экранные шрифты легко масштабируются - а это значит, что даже с не очень хорошим зрением (либо же не в самых лучших условиях освещения) вы всегда можете выбрать подходящий размер шрифта для удобного чтения. Четкий черно-белый экран является огромным преимуществом перед цветными экранами машинок Pocket PC и WinCE: вы можете читать при любых условиях освещения, в то время как Pocket PC становится бесполезной днем, на солнечном свету. Правда, нельзя умолчать о том, что экраны Series 5/5mx не столь четкие, как экран Revo - поэтому читать с них долго утомительно. Идеальным экраном для чтения при нормальных условиях освещения является экран Revo. Однако в темноте сказывается отсутствие подсветки и тут вперед вырываются уже цветные экраны машинок Pocket PC (а также Psion netBook и Series 7) и черно-белые экраны Psion 5. Ну, и ко всему прочему, Psion потребляет крайне мало энергии батарей, а это значит, что вы можете читать очень и очень долго, прежде чем потребуется сменить батарейки или перезарядить аккумуляторы.
Где взять книги для чтения на КПК? Разумеется, самой популярной и самой объемной библиотекой электронных книг является Библиотека Мошкова. Поэтому именно там мы и будем брать книги для чтения.
Эти книги хранятся на сервере и доступны для скачивания в виде обычного текстового формата TXT. Несмотря на то, что такой формат обладает преимуществами, состоящими в том, что его можно прочесть в абсолютно любом редакторе (Word, EPOC Text Editor, RMR Text и многие, многие другие), есть и большой недостаток: книги в текстовом формате занимают много места. И это приобретает особое значение, когда речь идет об ограниченном объеме дисковой памяти карманного компьютера. К примеру, у Revo память ограничена 8 Мб, куда уже входят другие программы! Поэтому если вы хотите хранить на своей машинке книги без особого ущерба для памяти, придется подумать о других форматах.
И они есть. Для Psion существуют две основных программы чтения электронных книг: это EBook и VReader5. Обе программы поддерживают, помимо текстового, еще и два стандартных формата, использующих сжатие данных: PRC (в этом формате хранятся документы Palm) и TCR (формат с наибольшей степенью компрессии). Именно в этих форматах и предпочтительно хранить электронные книги для чтения.
Мы будем делать все крайне аккуратно. То есть так, что сделанная книга будет, во-первых, занимать минимальный объем, а, во-вторых, такой работой будет не стыдно похвастаться перед другими.
Вернемся к книгам из Библиотеки Мошкова. К примеру, мы скачали какой-то файл - давайте теперь посмотрим, что у него внутри и что там лишнее.
Во-первых, в начале и самом конце файла стоят специальные HTML-тэги. Они требуются для того, чтобы показывался заголовок книги при чтении ее с помощью веб-браузера. А также для того, чтобы книгу можно было оценить, выставив ей оценку. Понятно, что в нашей ситуации никакие тэги не нужны - нам нужен только чистый текст.
Во-вторых, если мы посмотрим на сам текст, то увидим, что выглядит он следующим образом:
Здесь в глаза бросаются следующие вещи, от которых надо бы избавиться:
1) абзацы выравнены по обеим границам за счет лишних пробелов между словами (количество лишних символов колеблется);
2) в начале каждого абзаца стоит пять пробелов (пять символов!);
3) каждый абзац состоит из нескольких строк, разорванных между собой переносом строки (это еще два лишних символа: "перевод строки" и "возврат каретки" - к тому же, неправильное форматирование абзаца при чтении на Psion).
Со всеми этими проблемами легко справляется программа "Элбикон" (ЭЛектронно-БИблиотечный КОНвертор), которую написал наш дружеский посетитель Колбасный :).
Она работает в системе Windows и вырезает тэги, убирает лишние пробелы, несколько строк абзаца превращает в одну, а также заменяет 5 пробелов в начале абзаца на один символ табуляции. Использование программы очень простое - после запуска вы нажимаете кнопку на ее панели и открываете нужный файл. Затем выбираете имя, под которым сохранить полученный результат, а всю работу программа выполнит сама. За счет только убирания лишних симоволов экономия объема уже становится порядка 10 процентов! Правда, придется еще руками в любом редакторе стереть оставшийся от тэгов мусор (он был между тэгами и поэтому программа не убрала его сама - ведь это мог бы быть и нужный текст) - но можно этого и не делать, если вам лень :).
Теперь файл полностью подготовлен для того, чтобы перевести его в формат со сжатием данных. Как уже говорилось ранее, на выбор у нас имеются два формата: PRC и TCR. Программы для перевода текстов в эти форматы можно (и нужно) взять на страничке утилит. Утилита MakeDoc предназначена для создания PRC, а утилита TCR - соответственно для другого формата. Вы заметите, что имеются версии этих программ как для системы EPOC, так и для Windows. Я бы не рекомендовал пользоваться Psion-овскими вариантами, потому что это неудобно, а также работает очень медленно. Поэтому возьмем версии для Windows и не будем знать хлопот: все действия будут производиться на мощном настольном компьютере. Обе утилиты работают только с помощью командной строки, но это не проблема.
Вернемся к нашим форматам. TCR обеспечивает наилучший результат при сжатии данных, поэтому займемся изготовлением книги именно в формате TCR. Недостаток его в том, что этот формат поддерживается только на платформе Psion и вы не сможете поделиться книгой в формате TCR с владельцем, к примеру, Palm'а. Если это вас не останавливает, то - к делу!
Запустив tcr.exe в первый раз, мы увидим краткую справку по его параметрам:
Программа умеет как сжимать, так и декомпрессировать сжатый файл (параметр -d). Нам нужно сжатие, поэтому просто запускаем эту утилиту с указанием имени файла (rob.txt), который мы хотим сжать:
В итоге у нас получается файл rob.tcr размером 50 кб (против 84 кб файла rob.txt!). А если еще вспомнить то, что скачанный из библиотеки файл (который мы еще никак не обрабатывали) "весил" 93 кб, то результат наших трудов просто налицо! Мы его уменьшили почти в два раза. А ведь это - небольшой файл, а он мог быть и в 300 кб и даже больше.
Формат же PRC обеспечивает не самую лучшую степень компрессии, но зато он совместим с программами чтения электронных книг на Palm (там он известен как формат Aportis). Поэтому если вы пользуетесь еще и Palm'ом, либо планируете поделиться книгой с его владельцем, то выбирайте этот формат.
Запускаем makedoc.exe и видим справку по его использованию:
Здесь тоже есть возможность декомпрессии сжатого файла (тоже ключ -d). Но нас сейчас интересует сжатие, и чтобы выполнить эту операцию, надо указать имя исходного файла, имя конечного файла и заголовок книги:
Результат сжатия получился не такой хороший, как в предыдущем случае: полученный файл имеет объем 63 кб. Но зато вы можете поделиться им с любым палмером.
Вне зависимости от выбранного формата, теперь просто копируем полученный файл на КПК и открываем его любой читалкой: EBook или VReader5. Обе они имеют какие-то плюсы, какие-то минусы, но для сделанного нами файла наиболее благоприятна EBook. Ко всем своим прелестям она еще и русифицирована.
Ну, а теперь можно просто порадоваться результатам своих трудов! Мы создали аккуратный и правильный файл, который читать - одно наслаждение :)!
Дата статьи: | 22 февраля 2001 г |
« Назад в каталог | Обсудить в конференции »
|