Google Книги


Google Книги (англ. Google Books, Google Print, Project Ocean) — масштабный проект компании Google, запущенный в 2004 году и направленный на оцифровку и публикацию в интернете миллионов печатных произведений. Основная идея заключалась в том, чтобы сделать все когда-либо напечатанные книги доступными для чтения и поиска в интернете, обеспечив пользователям неограниченный доступ к знаниям. В 2010 году Google сообщила, что, по её оценкам, в мире насчитывается более 129 млн печатных изданий, которые компания планирует полностью оцифровать за 10 лет.

Бо́льшая часть коллекции поступала на оцифровку из университетских библиотек. В обмен на бесплатный доступ к книгам, университеты получали бесплатные электронные копии, а Google — материалы для улучшения поисковой системы и создания обширной коллекции цифровых материалов. Компания сотрудничала с более чем 40 крупнейшими библиотеками, включая библиотеки Мичиганского, Гарвардского, Стэнфордского, Оксфордского университетов, а также Нью-Йоркскую публичную библиотеку. Часть коллекции поступала от издателей и авторов, предоставляющих Google разрешение на оцифровку материалов в обмен на доход от контекстной рекламы или от увеличения продаж благодаря росту спроса на электронные книги.

Компания проспонсировала разработку специальных аппаратов для сканирования книг, которые с помощью высокоточных камер могли обрабатывать до 1000 страниц в час. Встроенное программное обеспечение исправляло искажения, корректировало цвет и контраст, а также преобразовывало сноски в цитаты, что впоследствии позволило системе ранжировать книги по релевантности. При этом операторы переворачивали страницы вручную. К 2019 году в рамках проекта было оцифровано более 40 млн произведений.

В 2005 году Гильдия Авторов[англ.] и ряд других издателей подали коллективный иск против Google[англ.], обвинив компанию в несанкционированном сканировании защищённых авторским правом материалов. Судебный процесс продолжался до 2016 года, после чего суд принял решение в пользу Google, определив, что сканирование материалов соответствует принципу добросовестного использования. Однако из-за нерешённых правовых споров оцифровка значительно замедлилась. По состоянию на 2023 год остаётся неясным, продолжает ли компания оцифровывать библиотечные издания.

Со времён аспирантуры в Стэнфордском университете сооснователи Google Ларри Пейдж и Сергей Брин задумывались об оцифровке огромных коллекций печатных изданий и предоставлении к ним широкого доступа[1]. Эти идеи — оцифровка, доступность, возможность поиска по всем текстам мира — побудили Брина и Пейджа создать «поисковый робот», который впоследствии лёг в основу поисковой системы Google[2].