Abd, 17.06.2005 06:36

26го мая запущен новый сервис
Google Print в рамках проекта по оцифровке книжных фондов ряда американских университетов и общественных библиотек.
Программа Google Print также предусматривает заключение соглашений с книгоиздателями, которые предоставляют книги для оцифровки и полнотекстового поиска, но пользователь может просмотреть не более двух-трех страниц книги за одну поисковую сессию. Печатные издания, не защищенные авторским правом, будут доступны в полном объеме.
Сепаратные соглашения Google с каждой отдельной библиотекой предусматривают следующий объем сканирования:
- библиотека Стенфорда - полностью (8.000.000 книг);
- библиотека университета Мичигана - полностью (7.000.000 книг);
- библиотека Гарварда - 40.000 книг;
- библиотека Оксфорда - все книги, изданные до 1900 г.;
- общественная библиотека Нью-Йорка - не защищенный копирайтом материал для школьников и студентов.Примеры поиска с помощью нового сервиса:
biological; biochemistry; DNA damage
musand, 17.06.2005 08:00
попробывал, но чёйта я не врубился и как добраться , собссна, до содержания книги, именно, до сути, а не до оглавления с индексом-а их они копировать тоже не дают. принтскрин, правда , не отменял никто, но 96 деципикселей всего быходит качество
Abd, 17.06.2005 09:14
Можно поиском искать внутри книг и читать с экрана

Большего от буржуинов мы никогда не дождемся
daniil naumoff, 17.06.2005 09:25
Abd, 17.06.2005 09:34
Упс, надо мне оказывается изредка заглядывать и в Беседу
FACSorter, 17.06.2005 13:25
shure, 15.06.2005 15:28
sudya po vsemu, samu knizhku on ne ischet, no predlagaet kupit'....
daniil_naumoff, 15.06.2005 15:37
Нет! Я сам пользовался: он показывает на экране ту страницу из книги, где упомянуто искомое слово.
FACSorter, 15.06.2005 19:26
Даниил, респект!
жалко только, что fulltext не выдает
Раздразнился я по поводу желанных книжек, ух!..
daniil_naumoff, 16.06.2005 13:01
А по одной страничке скачивать не устраивает? Там вроде есть листалка.
FACSorter, 16.06.2005 13:59
Ну вот, отвлекаете меня от подготовки к экзамену своими конструктивными вопросами.
Надо тему переносить в поиск литературы и там компостировать по полной программе. Чувствую, намечается "нечто" в поиске оцифрованной литературы.
А теперь по делу:
Иногда получается очень замечательно, когда поисковик выдает для просмотра несколько страниц из вожделенной книжки. Повторюсь, несколько страниц. Даже при наличии листалки, существуют границы дозволенного в виде интервала 2-3 страницы плюс или минус от выданной поисковиком.
Я по-разному пытался перехитрить систему, добивался выдачи совершенно разных страниц из книги, по 20 и более. Плюс тот самый интервал, о котором упоминал выше, итого можно получить до 30%книги.
Все равно для некоторых книг существуют копирайтные ограничения. Поисковик выдает номер нужной страницы, но сама она замаскированна. Типа "restricted access".
Как я понял, при наличии некой регистрации в сервисе (не повторяется ли история с инвайтами?) можно просматривать и защищенные страницы.
Существуют книги, с возможностью просмотра только лишь оглавления и не более.
Вопрос чисто методологический. Мне необходима книга, которой у меня никогда в руках не было, т.е. конкретных слов встречающихся на определнных страницах я не знаю. Вот и надо придумать, как добиваться того, чтобы поисковик выдавал как можно больше страниц разбросанных по всей книге, и при учете тех самых интервалов просмотра по 2-3 плюс-минус можно было бы выкачивать всю книгу.
Сохранять страницы в вдие html(mht) я пока не пробовал. Но сохранить именно скан листа со страницы браузера в виде картинки, как я понял, нельзя.
Обратил внимание на то, что при загрузке страницы браузера с нужным листом книги, последний выводтся в виде файла-изображения, но с подсвеченными искомыми словами. Подозреваю, что на гугле книги хронятся не просто в отсканированном виде... Вот бы туда...
ijontichy, 17.06.2005 11:26
Mozilla/Firefox после небольших изменени позволяет сохранять сканы на диске в виде *.jpg, но к сожалению только в 68 dpi разрешении. Интереса ради как ето делается:
1) Install Adblock plugin (http://adblock.mozdev.org/dev.html)
2) Set it to *hide*, not *remove* ads - Tools->Adblock->Preferences...->Hide ads.
3) Right click (you have to disallow disabling of popup menus, as in blog entry) on the image, Adblock image and feel free to save any pages you want, You'll be able to View Background Image and then save it.
FACSorter, 17.06.2005 14:23
Почтовый аккаунт с GMail активен и в этом сервисе. Так что, если у вас есть таковой, можно использовать.
Но Restricted Page все равно не дает смотреть.
Sergeant, 17.06.2005 19:20
Меня этот сервис как то не вдохновил. Прочитать конечно можно, но глаза приходится сильно напрягать. Да и с тремя страницами не очень то разбежисься. С другой стороны конечно от халявы другого было бы ожидать глупо. Интересно, с помощью каких мегабаксовых сканеров они все это делают?
RKK, 17.06.2005 22:04
Здесь еще в марте предложен вариант снятия ограничения с количества страниц, правда самой программы автор не выложил.
Hacking Google Print
http://www.kuro5hin.org/story/2005/3/7/95844/59875
Silence, 27.06.2005 13:11
Опять же информация со страницы, указанной RKK - у меня сработало на ура!
{THIS IS VERY FUNNY (none / 0) (#100)
by prima1 on Tue Jun 21st, 2005 at 12:11:25 PM EST
man this is very funny because just yesterday i found a way to browse through whole books and save their pages and i am no computer expert i found out that if i type the number 200 in the search box inside the book it will show all the pages of the book not missing one single page and everytime my account doesn't allow to view more pages i simply create a new account with a fake email and password no need to verify i have tons of accounts now i just enter a new one everytime and continue browsing but some pages of the books are restricted no matter what actually the restricted pages start at the middle of the book to the end whileas first half of the book is always viewable all of it anyway it doesn't seem to work anymore i am happy i saved everything that i needed they do not have everything anyway many books do not exist and many are old editions}
Mykhaylo, 27.06.2005 19:08
ijontichy, 28.06.2005 09:43
Самое интересное, что restricted pages меняются либо после захода с другого аккаунта или по прошествии нескольких дней. Те страницы, которых я не мог видеть неделю назад сегодня скачал без проблем зайдя с другого логина.
RKK, 03.07.2005 00:20
Насчет копирования=сохранения полученных страниц:
Вариант для имеющих ReGet Deluxe.
Если включить встроенный в него MSIE Spy, видны url всех закачиваемых броузером файлов.
Получаем доступ ко всем страницам книги с помощью магического числа 200 (см. пост Silence выше). Открывая их подряд в новых окнах, наблюдаем за закачиваемыми в броузер файлами. На каждой странице будет один файл вида
http://print.google.com/print?id=..., где есть выражение print?id и дальше длинная строка типа
http://print.google.com/print?id=g-Lxk5c23...DsZhVDtkqhLrV1MРазмер его в среднем 65-70 кб, что дает нам картинку приблизительно 570 на 770 пикселов. Эти файлы перехватываем с помощью ReGet Deluxe непосредственно в MSIE Spy броузера, кликая на ссылке правой кнопкой мыши и выбирая опцию <<закачать при помощи ReGet Deluxe>>
В результате на диске сохраняются файлы с названиями print, print(1), print(2) и т.д. не имеющими расширения. Остается добавить им расширения .jpeg и без ограничений смотреть в графическом редакторе.
бутанол, 03.07.2005 12:43
ну примитивыный способ сохранения - поставил разрешение на мониторе по максиму, и сохранил рабочий стол граббером экрана
гость: d, 04.07.2005 10:36
всё, что вы видели на экране своего компа, уже закачано на ваш комп.
хранится в папке "temporary internet files"
там поиском можно найти все файлы *print*.jpg
это и будут ваши странички с гугл. принта.
только херня все это - при распечатке качество очень плохое, и с помощью ABBY Finereader текст не распознается
Это — лёгкая версия форума. Чтобы попасть на полную,
щелкните здесь.