Проект «Гутенберг»


Прое́кт «Гу́тенберг» (англ. Project Gutenberg, или PG) — общественная некоммерческая инициатива, направленная на создание и распространение цифровой коллекции находящихся в общественном достоянии произведений. «Гутенберг» считается старейшей в мире электронной библиотекой. Большинство работ было оцифровано волонтёрами и доступны для свободного скачивания.

Проект был создан 4 июля 1971 года, когда студент Иллинойсского университета Майкл Харт вручную перепечатал текст Декларации независимости США и отправил его другим пользователям своей сети, на тот момент состоявшей из 15 узлов ARPANET — прародителя интернета[1][2]. В течение последующих 20 лет Харт перепечатал около 100 книг. С распространением интернета в начале 1990-х к оцифровке работ подключились волонтёры университета и — уже в 2000-х — организации Distributed Proofreaders. Харт занимался административной работой и сбором средств для поддержки работы веб-сайта. На 1997 год количество произведений в коллекции составило 1000, в 2003 — 10 000, в 2011 — 40 000. На 2021 год в коллекции проекта более 60 000 книг[1].

Все электронные тексты оцифровываются в 7-битном американском стандартном коде ASCII под названием Plain Vanilla. Подобный формат считывается на любом устройстве и совместим с 99 % любого программного обеспечения. Для книг с акцентированными символами, например, на немецком и французском языках, Project Gutenberg также создает 7-битную версию ASCII с акцентами[3]. Помимо Plain Vanilla ASCII, «Гутенберг» использует и другие форматы, в том числе HTML, XML, RTF, Юникод[3].

Формальной датой создания проекта считается 4 июля 1971 года, когда студент Иллинойсского университета Майкл Харт вручную перепечатал текст Декларации независимости США и отправил его другим пользователям сети ARPANET, состоявшей из 15 узлов и около 100 зарегистрированных юзеров[2]. На тот момент отправка файла объёмом 5 килобайт вызвала бы сбой в сети, поэтому Харт разослал место хранения цифрового текста, после чего его скачали шесть пользователей[3][4].

Реализация проекта стала возможной благодаря тому, что Харту была предоставлена возможность поработать с мейнфреймом Xerox Sigma 5[en] — позже создатель проекта посчитал, что выделенное ему компьютерное время стоило примерно 100 млн долларов США. Студент хотел потратить это время на «стоящий» проект, однако его не привлекала обработка данных — основная сфера применения компьютеров на тот момент[5][6].