|
Ссылки - Советы |
|
ldn-knigi.lib.ru - основная
страница
ldn-knigi.narod.ru - зеркало
Важная информация для всех
скачивающих книжки из
интернета.
(обновление
- 11.07.2009)
Уважаемые читатели!
Уже ряд лет существуют в интернете частные, не коммерческие библиотеки книг в электронной форме, владельцы которых все бумажные книги сами переводят в электронную форму (напр. http://ldn-knigi.lib.ru), также библиотеки, на которых трудятся сами владельцы и им помогают в качестве волонтеров другие книголюбы. (напр. http://lib.ru, http://belolibrary.imwerden.de/, http://militera.lib.ru/ и другие).
Такая работа состоит из поиска нужных книг в бумажных библиотеках, самом сканировании, переводе в электронную форму; часто также подбор дополнительного материала из других источников.
В качестве
единственной награды за свой труд, ОЦР-щики обычно пишут свое имя или
ник в
начале электронного текста. Читатели могут, имея данные ОЦР-щика,
обратится к нему по поводу выложенной книги, поскольку ОЦР-щик
обычно сохраняет отсканированные
материалы (пока жив...) в графическом формате – tif,
jpg, gif. Данные ОЦР-щика нужны
также читателю,
если он находит неточность в правке или
желает напр.
некоторые страницы текста в другом формате.
Подбирая к существующим темам книги,
коллеги по
сайтам
ОЦР иногда, чтобы не делать двойную работу, помещают уже обработанные
тексты с
других сайтов. При этом оставляя данные первого ОЦР-щика,
даже если
при переводе в другой формат им пришлось и самим поработать над
текстом. С этим большинство
ОЦР-щиков согласны.
Как уже всем стало
известно...
капитализм некоторых развращает и не все уважают труд
других. Особенно в
последние годы появляются все чаще сайты, основная цель которых –
нажива.
Электронные книги
являются у них в основном только приманкой неопытных читателей.
Зарабатывают
такие сайты на рекламе совсем других продуктов, включительно
порнографию, которая
появляются на мониторе и без желания читателя. Недобросовестные
и жадные на легкую прибыль персоны скачивают книжки с
ОЦР-сайтов и
выкладывают на
своих.
Переделывая для
своих нужд чужой текст, они не только убирают данные ОЦР-щика и взамен вписывают свое имя, они
часто снижают и
ценность текста, убирая фотографии,
номера страниц,
примечания.
Одни делят текст на много частей (напр.
HTM) чтобы за каждый дополнительный
вызов им
начислялось - больше платили за рекламу, другие даже имеют наглость
требовать за скачивание денег.
У некоторых
можно скачивать книги только после регистрации.
Обнаружил напр. такую «работу» у
библиотеки Aldebaran,
написал уже об этом в гостевой нашей
страницы. Заметил недавно, на сайте http://www.mirknig.com/- нами
обработанную
книгу 1910 г., выложенную на нашей
странице в формате DjVu. Чтобы
убрать ссылку на наш сайт, они конвертировали
DjVu-bmp,
bmp опять в DjVu – при этом качество конечно ухудшилось.
Где были только
эти «умники», когда еще не было сайтов первых идеалистов
ОЦР-щиков?!
Неуважение к чужому труду показывает соответствующую мораль и некоторую
детскую
наивность!
Нужно при этом упомянуть также
одну из новых библиотек, которая, пока не в корыстных целях, помещает
вовсю
работу других, (из нашего и других сайтов) снимая данные ОЦР-щиков:
библиотека либрусек
(http://lib.rus.ec - в Эквадоре). Тексты выдаются у них без фотографий,
часто без
нумерации
страниц - что особенно важно в книгах напр. исторического содержания;
также
отсутствуют данные о том, где, когда была издана книга.
В итоге у них на сайте находятся
много
«голых»
текстов, читатель получает э. книгу, у которой словно бы ободрали
обложки
и вырвали титульные
листы.
Совершенно непонятно,
зачем так уродовать текст?!
–
копирайт эквадорианца ведь не волнует! Очевидно одно - сайт запущен
без единых, обязательных правил подготовки текста; лишь бы побыстрее и
побольше
книг на сайт... получился в итоге просто склад текстов, большинство
которых неизвестного
происхождения!
Библиотека lib.rus.ec
одна из многих, таким образом уродующих оригинальный электронный текст.
Почти все
электронные библиотеки с «огромным количеством» книг, которые в течении
года-двух появились на сцене, берут вовсю к
себе готовые тексты с частных сайтов, убирая данные ОЦР-щиков.
Большинство
ОЦР-щиков не возмущались бы самим фактом размножения книг на других
серверах –
если бы их данные в оцифрованных ими текстах сохранялись.
Посмотрел нами
оцифрованные
книги в разных такого типа библиотеках... каждый глумился над текстом
по своему
– наверно и сам автор узнал бы свое сочинение только с большим трудом!
Книгами
с сайтов ОЦР иногда «делятся» коммерческие библиотеки, между
которыми существуют явно торговые связи.
Напр. наша работа, «Дело
Бейлиса, стенографический отчет, в трех
томах», сначала попала, кроме других, на сайт
infanata.org, у нее эти файлы взяла
страница mirknig.com с
соответствующей пометкой. Жаль, что «по дороге» у них пропали
дополнительные
файлы, которые мы выдали в другом формате.
Таким образом от сайта к
сайту
«путешествующий» текст, у которого уже сняли данные ОЦР-щика, не может
быть при
надобности восстановлен, ибо читатель не знает к кому обращаться!
Наш сайт (и наверно большинство других такого типа) бороться с такими «пиратами» не имеет ни возможности ни желания – жалко времени и сил, в интернете появляются постоянно новые, такого типа сайты, «распространителей» книг!
Мы
хотели бы
поэтому посоветовать нашим читателям: при поисках книг в
интернете не
ленится,
сравнивать, искать
первоисточный электронный вариант на бесплатном сайте, проверять выдана
ли книга
полностью – с фотографиями и иллюстрациями, если таковые имелись в бумажном оригинале!
Желаем Вам всем в этом удачи!
Прим.
Наверно уже настало время
составить список «белых» электронных библиотек, у
которых находятся только первоисточные оцифрованные книги.
Кто же за такую работу возьмется?
Ему/ей были бы очень
благодарны все читатели,
которые смогли бы свой поиск книг начать с сайтов ОЦР-щиков
и этим сэкономили бы себе много времени. Им стал бы
сразу доступен полный э. вариант со всеми дополнениями и примечаниями,
они
избавили бы себя от надобности смотреть ненужную рекламу,
регистрироваться,
платить за быстрый download и т.д.
Главная
предпосылка для ОЦР-щика – уважение перед бумажной книгой, ее автором,
редактором, переводчиком, иллюстратором; уразуметь, что без основных
данных о
том когда, где, в каком издании вышла книга, она теряет свою ценность
как
носитель информации. Для напр. студента, историка, литературоведа,
электронный
текст без таких данных – совершенно никчемный, они не будут на
чтение такого
текста даже время тратить!
Не каждый
умеющий читать и немножко работать на компьютере должен брать на себя
задачу
переделывать электронные тексты или оцифровывать бумажные книги (ОЦР),
но если
ему/ей очень уж хочется... пусть сначала поучится на примере
оцифрованных текстов
старых частных электронных библиотек; сформирует для себя шаблон правил
обработки текста. Самого себя контролировать, быть редактором
собственной
работы дано не каждому!
Леон Дотан (19.06.2009)
Библиотеки
http://lib.ru - большая э. библиотека Максима Мошкова
http://zmiy.by.ru/libs.htm - э. библиотеки -
список, поиск книг
http://www.belousenko.com/- Электронная библиотека Александра Белоусенко
„.. русская художественная и документальная проза, а также стихи, статьи, очерки,
биографии, интервью; малоизвестные авторы, которые вынуждены были покинуть
СССР и были преданы забвению...“
http://www.franklang.ru/ - страница Ильи Франка,
полезная
информация для изучающих языки:
Книги с параллельным
текстом на двух языках, советы, грамматика...
http://ihtik.lib.ru/ -
Философская электронная полнотекстовая библиотека от
Ихтика
http://moy-bereg.ru - Библиотека
«Символика».
Все о символике, символах и символизме. Литературный журнал «Мой берег».
http://www.kuprin.de/russian.htm
http://www.all-2music.com/index.html
- "Музыканты о классической музыке и джазе"
http://forumklassika.ru/ -
Форумы - музыка, важная информация
Thema: Die
schleichende Islamisierung Europas
Тема: Ползучая экспанция ислама в Европу (тихая исламизация)
Материалы на русском и немецком. In Russisch und Deutsch.
http://www.grass-gis.de/bibliotheken/buecher.html -
книги на
немецком, английском и других языках
http://digital.library.upenn.edu/books -
книги на английском и других языках
http://abu.cnam.fr/index.html
http://digital.library.upenn.edu/books/archives.html#foreign
http://www.lysator.liu.se/runeberg/katalog.html
http://www.fh-augsburg.de/~harsch/germanica/Chronologie/d_chrono.html
http://www.literature.at/webinterface/library
http://www.antologija.lt/ - Lietuviskos knygos (Книги на литовском)
http://www.onlinenewspapers.com/russia.htm - русская
пресса
http://www.onlinenewspapers.com/ - мировая пресса
(еврейские стр.
на разных языках, Израиль, Ветхий- Новый Завет...)
Поисковые Системы:
в России и за
границей.
(полнотекстовые)
библиотеки (неполный
список)
http://www.kulichki.com/inkwell - удобный поиск
книг, ссылки к библиотекам
http://zmiy.by.ru/libs.htm - Библиотеки-
список, поиск книг
http://www.google.com/ - очень быстрый поиск, можно искать на нескольких
языках одновременно
http://www.telefonbuch.com/europe.htm - Телефонные справочники
Европы, Америки ...
(freeware,
shareware)
одновременно
и не боится временного прекращения
связи.
Все файлы
скачиваются в C:\Downloads. (быстрее чем с Microsoft)
стандартные
распаковочные и
(и FTP)
долго, можно с FlashGet не
вызывая ее,
себе на H.D., там открыть и с нее же вызывать желаемые
ссылки.
Также можно ускорить скачивание текстов, которые сначала
нужно вызвать на экране –
скачать с FlashGet! (правой мышкой
на ссылку –
скачать с FlashGet)
Если у вас нет программы Винворд 2000 (WinWord 2000) – можно удобно читать
форматы *.doc (WW2000) а также *.rtf , *.txt – программой «MicrosoftWordViewer».
С ее помощью можно читать тексты (и с картинками), также распечатать.
Скачать ее можно бесплатно у фирмы Microsoft.
Название фил'а (для поиска и скачивания) - wd97vwr32.exe (величина 4,1 Mb)
или
Wordview.exe
Читать тексты и просматривать картинки в формате *.tif, *.bmp, *.jpg и др., удобно с помощью
бесплатной программы IrfanView (view32.exe). Искать через Яндекс или Google.
Ей можно
просматривать, читать, распечатывать, обрабатывать.
Работая с этой программой вы можете менять величину объектов, перелистывать (мышкой и тастатурой),
поворачивать, записать в другом формате.
Также
можно, по одной, вставлять *.tif; *.jpg в файл *.doc (программа ВинВорд) и там просматривать и
распечатывать...
WinDjView
0.4.2 (или новая
версия, напр. 1.0.3) - удобная программа
для
просмотра DjVu файлов под
Windows, в которой впервые реализован непрерывный
режим просмотра.
Программа основана на свободно распространяемой
библиотеке
DjVuLibre.
Формат DjVu
позволяет распространять документы и картинки
высокого качества при минимальном размере файла; сжатие
5,0-6,5 раз, притом качество не ухудшается.
Таким образом
отсканированная книга
в картинках (формат *.tif) напр. 25 MB, будет
в формате djVu всего прим. 4,0 MB.
Работая с WinDJView
можно регулировать качество
изображения на мониторе (File-Settings)
и очень комфортабельно распечатывать.
Работая с WinDJView можно регулировать качество изображения на мониторе. Советую попробовать разные установки «Gamma».
Напр. при слишком светлом шрифте: «File-Settings-Gamma», «Gamma» установить 0,6-0,8. Если же шрифт слишком «жирный», «Gamma» установить 1,2 или больше.Иногда лучше читать, если качество
неудовлетворительное - установить
в прог. WinDjView: по
одной странице, «Fit Width-По
ширине», если монитор большой – то «View-Fullscreen – Вид на полный экран».
Последующие страницы вызывать (как и в
прог. IrfanView) клавишой Space,
назад клавишой Backspace.
Есть также возможность с WinDJView отдельные страницы записывать-переводить в формат *.bmp который можно напр. вставлять в *.doc.
Русская
версия -
http://dwg.ru/dwl/775
английская - http://sourceforge.net/project/showfiles.php?group_id=114927
или здесь http://ldn-knigi.lib.ru/WinDjView-1.0.3-Setup.exe
Важно! есть
отдельные версии для систем Win-XP
и
Win-98!
Под
системой Win-98
версия для Win-XP – не
работает!
Для более смелых:
С этой
программой, после инсталирования, вы сможете в: InternetExplorer, Mozilla-Firefox, прямо вызывать файл djvu.
Около 6,7 MB.
Работает как плагин AcrobatReader-а
для
файла pdf.
http://djvu-inf.narod.ru/
Еще ссылки к
страницам с информацией о djvu и даже целыми библиотеками в
формате djvu
http://www.biografia.ru/odjvu.html
http://www.biografia.ru/knigi1.html
http://lib.mexmat.ru/helpdesk.php
Дополнительно о работе с файлами DjVu
Вопросы
читателя:
К сожалению,чтение книг в формате DjVu (в библиотеке
появилось очень много ценных книг в этом формате) для меня очень трудно.
Существует ли
возможность конвертировать книги из DjVu в Microsoft Word? Могу ли я
сам
переводить книги в другой формат и как это сделать?
Ldn-knigi, ответ:
Если Вы инсталлировали плагин djvu
для InternetExplorer,
(Mozilla-Firefox) то
сможете вызвать файлы djvu и в тех браузерах, может быть так будет Вам
удобнее...
Самый быстрый
и удобный метод получить отдельные файлы tif , jpg из djvu – покупной
программой FineReader 9.0. Потом можно удобно читать напр. с бесплатной
IrfanView.
Есть также
возможность с WinDJView отдельные страницы, по одной,
записывать-переводить в формат *.bmp,
который можно напр. вставлять в *.doc (как картинку) или тоже читать по
одной странице
с
IrfanView.
Или разбить
файл DjVu - одним приказом на отдельные файлы
--- см. ниже! new!!!
Вопросы
читателя:
Существует ли
возможность перевода DjVu-файла в Pdf-файл,а из Pdf-файла можно ли
перевести в
Microsoft-Word (не как картинку, а с изменением шрифта и формата
текста)?
Ldn-knigi, ответ: Способ прямо
из DjVu перевести в Pdf мне не известен, может быть будет когда ни
будь. Pdf
можно создавать или из картинок, форматы tif, bmp, jpg, или с
программой OCR,
напр. FineReader 9, сначала узнать, перевести из tif, bmp в текст,
который,
после обработки и форматирования (c прог. WinWord) можно соединить в
Pdf разными
программами.
Такой файл Pdf, из узнанного текста, будет меньше чем файл Pdf из
картинок.
Если уже
имеется файл Pdf, созданный из
картинок, его можно разбить на отдельные картинки и потом
перевести в текст, с программой OCR напр. FineReader 9; после этого
можно
создать файл doc в WinWordе.
Если же имеется файл
Pdf, созданный из текста, то с программой OCR напр. FineReader 9 можно
сразу
весь текст узнать (OCR),
послать его в программу WinWord и там
его обрабатывать.
NEW! – 09.2009
Способ с
программой IrfanView (version 4+) одним
приказом разбить файл DjVu на
отдельные файлы, по желанию: tif,
jpg, bmp.
(Читать тексты и просматривать картинки в формате *.tif, *.bmp, *.jpg и др., удобно с помощью
бесплатной программы IrfanView (view32.exe). http://www.irfanview.com/ инсталлировать прог. вместе с PlugIns)
(Подробно, для начинающих.)
Сначала надо вызвать прог. IrfanView и «открыть» желаемый файл DjVu (до того выбрать в окне
диалога тип файлов - DjVu.)
Когда первая страница
файла видна, в прог. IrfanView пойти на меню
(наверху) и нажать «сервис-извлечь все кадры». Тут программа предлагает
вам
возможность выбрать папку, в которую вы желаете поместить файлы
из
DjVu и выбрать графический формат
файлов; все установив, нажать на "выполнить".
Прим. Если в
книге-файле DjVu только текст, можно
выбрать формат tif, если же имеются цветные
иллюстрации, фотографии – то лучше выбрать формат jpg, bmp.
Практически
разница в величине файлов, самые
малые – tif (черно-белые); файлы цветных страниц - форматы jpg больше, bmp еще
больше. Если в книге всего
несколько цветных
страниц, то оптимально сначала файл DjVu разбить на отдельные
файлы tif, а после этого вызвать файл DjVu с программой WinDjView
и эти
цветные страницы по одной записать в ту же папку в формате jpg или bmp.
Для этого надо
щелкнуть на желаемую страницу в прог. WinDjView
левой мышкой,
(на изображение с правой стороны), потом на нее щелкнуть правой мышкой.
В
окошечке
выбрать опцию „Export Page“. Сейчас
осталось только указать папку, куда записать файл и формат файла, напр.
jpg или bmp. (WinDjView
Version 1.0.3+)
Имея
отдельные файлы страниц,
вы сможете их читать (и распечатать, обработать) так же программой
IrfanView. Вызвать первую
страницу и тастатурой или стрелками (см. меню, наверху в прог.
IrfanView)
«вперед-назад» двигаться по страницам.