Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Википедия предлагает заинтересованным пользователям бесплатные копии всего доступного контента. Эти базы данных можно использовать для зеркального отображения , личного использования, неформального резервного копирования, автономного использования или запросов к базе данных (например, для Wikipedia: Maintenance ). Весь текстовый контент лицензирован по лицензии Creative Commons Attribution-ShareAlike 3.0 (CC-BY-SA) и GNU Free Documentation License (GFDL). Изображения и другие файлы доступны на разных условиях , как указано на их страницах с описанием. Наши советы по соблюдению этих лицензий см. В Википедии: Авторские права .

Читатели Википедии офлайн

Некоторые из множества способов читать Википедию в автономном режиме:

  • XOWA : ( § XOWA )
  • Кивикс : ( § Кивикс )
  • WikiTaxi: § WikiTaxi (для Windows)
  • aarddict: § Словарь Aard
  • BzReader: § BzReader и MzReader (для Windows)
  • Избранные статьи Википедии в формате PDF, OpenDocument и т. Д .: Википедия: Книги
  • Избранные статьи Википедии в виде печатной книги: Справка: Книги / Печатные книги
  • Вики как электронная книга: § Электронная книга
  • WikiFilter: § WikiFilter
  • Википедия на Rockbox: § Wikiviewer для Rockbox

Некоторые из них являются мобильными приложениями - см. « Список мобильных приложений Википедии ».

Где мне это достать?

Англоязычная Википедия

  • Дампы из любого проекта Фонда Викимедиа: дампы .wikimedia .org и Интернет-архив
  • Английские дампы Википедии в SQL и XML: дампы .wikimedia .org / enwiki / и Интернет-архив
    • Загрузите дамп данных с помощью клиента BitTorrent (торрент имеет много преимуществ и снижает нагрузку на сервер, экономя затраты на полосу пропускания).
    • pages-article-multistream.xml.bz2 - Только текущие версии, без обсуждений или пользовательских страниц; это, вероятно, то, что вы хотите, и он составляет примерно 18 ГБ в сжатом виде (расширяется до более 78 ГБ при распаковке).
    • pages-meta-current.xml.bz2 - только текущие версии, все страницы (включая обсуждение)
    • abstract.xml.gz - аннотации страниц
    • all-title-in-ns0.gz - только заголовки статей (с редиректами)
    • Также доступны файлы SQL для страниц и ссылок.
    • Все редакции, все страницы: эти файлы расширяются до нескольких терабайт текста. Пожалуйста, загружайте их только в том случае, если вы знаете, что можете справиться с таким объемом данных. Перейдите в Последние дампы и найдите все файлы, в имени которых есть «страницы-мета-история».
  • Чтобы загрузить подмножество базы данных в формате XML, например определенную категорию или список статей, см .: Special: Export , использование которого описано в Help: Export .
  • Интерфейсное программное обеспечение Wiki: MediaWiki [1] .
  • Программное обеспечение базы данных: MySQL .
  • Дампы изображений: см. Ниже.

Стоит ли покупать многопоточность?

TL; DR : ПОЛУЧИТЕ МНОГОПОЗИЦИОННУЮ ВЕРСИЮ! (и соответствующий индексный файл pages-article-multistream-index.txt.bz2 )

Страницы-статьи.xml.bz2 и страницы-статьи-multistream.xml.bz2 содержат одинаковое содержимое XML . Так что, если вы распаковываете, вы получаете те же данные. Но с многопоточностью можно получить статью из архива, не распаковывая целиком. Ваш читатель должен справиться с этим за вас, если ваш читатель не поддерживает его, он все равно будет работать, поскольку многопоточность и не многопоточность содержат один и тот же xml . Единственным недостатком многопоточности является то, что она немного больше. У вас может возникнуть соблазн получить меньший по размеру не многопоточный архив, но это будет бесполезно, если вы его не распаковываете. И он будет распакован примерно в 5-10 раз от своего исходного размера. Мудрый пенни, глупый фунт. Получите многопоточность.

ПРИМЕЧАНИЕ, ЧТО файл многопоточного дампа содержит несколько «потоков» bz2 (заголовок, тело, нижний колонтитул bz2), объединенных в один файл, в отличие от стандартного файла, который содержит один поток. Каждый отдельный «поток» (или действительно файл) в многопоточном дампе содержит 100 страниц, кроме, возможно, последней.

Как использовать многопоточность?

Для многопоточности вы можете получить индексный файл pages-article-multistream-index.txt.bz2 . Первое поле этого индекса - это количество байтов для поиска в сжатом архиве pages- article -multistream.xml.bz2 , второе - это идентификатор статьи, третье - заголовок статьи.

Вырежьте небольшую часть из архива с помощью dd, используя байтовое смещение, указанное в индексе. Затем вы можете либо распаковать его с помощью bzip2, либо использовать bzip2recover и выполнить поиск в первом файле по идентификатору статьи.

См. Https://docs.python.org/3/library/bz2.html#bz2.BZ2Decompressor для получения информации о таких многопоточных файлах и о том, как распаковать их с помощью python; см. также https://gerrit.wikimedia.org/r/plugins/gitiles/operations/dumps/+/ariel/toys/bz2multistream/README.txt и связанные файлы для старой рабочей игрушки.

Другие языки

В отвалах .wikimedia .org каталог вы найдете последний SQL и XML дампы для проектов, а не только на английском языке. Подкаталоги названы по коду языка и соответствующему проекту. Существуют и другие каталоги (например, простые, ностальгические) с такой же структурой. Эти дампы также доступны в Интернет-архиве .

Где загруженные файлы (изображения, аудио, видео и т. Д.)?

Изображения и другие загруженные медиафайлы доступны не только с серверов Викимедиа, но и с зеркал. Массовая загрузка (по состоянию на сентябрь 2013 г.) доступна с зеркал, но не предлагается напрямую с серверов Викимедиа. См. Список текущих зеркал . Вы должны Rsync от зеркала, а затем заполнить недостающие изображения с upload.wikimedia.org ; при загрузке из upload.wikimedia.orgвы должны ограничить себя до 1 промаха кеша в секунду (вы можете проверить заголовки в ответе, чтобы узнать, был ли промах или промах, а затем отступить, когда вы получите промах), и вы не должны использовать более одного или двух одновременные HTTP-соединения. В любом случае убедитесь, что у вас точный пользовательский агент.строка с контактной информацией (адрес электронной почты), чтобы операторы могли связаться с вами, если возникнет проблема. Вы должны получать контрольные суммы из mediawiki API и проверять их. API Этикет страница содержит некоторые рекомендации, хотя и не все из них применимы (например, из - за upload.wikimedia.org не MediaWiki, нет maxlagпараметра).

В отличие от текста большинства статей, изображения не обязательно лицензируются в соответствии с GFDL и CC-BY-SA-3.0. Они могут находиться под одной из многих бесплатных лицензий , в общественном достоянии , считаться добросовестным использованием или даже нарушать авторские права (которые следует удалить ). В частности, использование изображений добросовестного использования вне контекста Википедии или аналогичных работ может быть незаконным. Для изображений по большинству лицензий требуется указание кредита и, возможно, другая приложенная информация об авторских правах. Эта информация включена в страницы описания изображений, которые являются частью текстовых дампов, доступных на dumps.wikimedia.org . В заключение, загрузите эти изображения на свой страх и риск ( Юридически )

Работа со сжатыми файлами

Сжатые файлы дамп значительно сжаты, таким образом , после того , как декомпрессия будет занимать большие объемы дискового пространства. Большой список программ распаковки описан в разделе Сравнение файловых архиваторов . Следующие программы, в частности, можно использовать для распаковки файлов bzip2 .bz2 .zip и .7z .

Окна

Начиная с Windows XP , базовая программа распаковки позволяет распаковывать zip-файлы. [1] [2] Среди прочего, для распаковки файлов bzip2 можно использовать следующее.

  • bzip2 (командная строка) ( отсюда ) доступен бесплатно по лицензии BSD.
  • 7-Zip доступен бесплатно по лицензии LGPL .
  • WinRAR
  • WinZip
Macintosh (Mac)
  • OS X поставляется с утилитой командной строки bzip2.
GNU / Linux
  • Большинство дистрибутивов GNU / Linux поставляются с утилитой командной строки bzip2.
Распространение программного обеспечения Беркли (BSD)
  • Некоторые системы BSD поставляются с утилитой командной строки bzip2 как частью операционной системы. Другие, такие как OpenBSD , предоставляют его как пакет, который необходимо сначала установить.
Заметки
  1. Некоторые старые версии bzip2 могут не обрабатывать файлы размером более 2 ГБ, поэтому убедитесь, что у вас установлена ​​последняя версия, если у вас возникнут какие-либо проблемы.
  2. Некоторые старые архивы сжимаются с помощью gzip, который совместим с PKZIP (наиболее распространенный формат Windows).

Работа с большими файлами

По мере увеличения размера файлов увеличивается вероятность того, что они превысят определенный предел вычислительного устройства. Каждая операционная система, файловая система, жесткий диск и программное обеспечение (приложение) имеют ограничение на максимальный размер файла. У каждого из них, вероятно, будет свой максимум, и самый низкий предел для всех из них станет ограничением размера файла для устройства хранения.

Чем старше программное обеспечение на вычислительном устройстве, тем больше вероятность, что где-то в системе будет ограничение на размер файла 2 ГБ. Это связано с тем, что более старое программное обеспечение использует 32-битные целые числа для индексации файлов, что ограничивает размеры файлов до 2 ^ 31 байтов (2 ГБ) (для целых чисел со знаком) или 2 ^ 32 (4 ГБ) (для целых чисел без знака). Старые библиотеки программирования C имеют этот предел 2 или 4 ГБ, но новые библиотеки файлов были преобразованы в 64-битные целые числа, таким образом поддерживая размеры файлов до 2 ^ 63 или 2 ^ 64 байт (8 или 16 ЭБ ).

Перед началом загрузки большого файла проверьте устройство хранения, чтобы убедиться, что его файловая система может поддерживать файлы такого большого размера, и проверьте количество свободного места, чтобы убедиться, что на нем может храниться загруженный файл.

Ограничения файловой системы

Для файловой системы существует два ограничения: ограничение на размер файловой системы и ограничение на файловую систему. В общем, поскольку ограничение на размер файла меньше, чем ограничение файловой системы, большие ограничения файловой системы являются спорным вопросом. Большой процент пользователей полагает, что они могут создавать файлы размером до размера своего устройства хранения, но ошибаются в своем предположении. Например, устройство хранения объемом 16 ГБ, отформатированное как файловая система FAT32, имеет ограничение в 4 ГБ для любого отдельного файла. Ниже приведен список наиболее распространенных файловых систем. Дополнительные сведения см. В разделе Сравнение файловых систем .

Окна
  • FAT16 поддерживает файлы размером до 4 ГБ . FAT16 - это заводской формат USB- накопителей меньшего размера и всех SD- карт размером 2 ГБ или меньше.
  • FAT32 поддерживает файлы размером до 4 ГБ. FAT32 - это заводской формат для USB- накопителей большего размера и всех карт SDHC емкостью 4 ГБ или больше.
  • exFAT поддерживает файлы размером до 127 ПБ . exFAT является заводским форматом всех карт SDXC , но несовместим с большинством разновидностей UNIX из-за проблем с лицензированием.
  • NTFS поддерживает файлы размером до 16 ТБ . NTFS - это файловая система по умолчанию для современных компьютеров с Windows , включая Windows 2000, Windows XP и всех их преемников на сегодняшний день. Версии после Windows 8 могут поддерживать файлы большего размера, если файловая система отформатирована с большим размером кластера.
  • ReFS поддерживает файлы размером до 16 ЭБ .
Macintosh (Mac)
  • HFS Plus (HFS +) поддерживает файлы размером до 8 ЭБ в Mac OS X 10.2+ и iOS . HFS + была файловой системой по умолчанию для компьютеров OS X до macOS High Sierra в 2017 году, когда она была заменена по умолчанию на файловую систему Apple , APFS .
Linux
  • ext2 и ext3 поддерживают файлы размером до 16 ГБ, но до 2 ТБ с блоками большего размера. См. Https://users.suse.com/~aj/linux_lfs.html для получения дополнительной информации.
  • ext4 поддерживает файлы размером до 16 ТБ при размере блока 4 КБ. ( ограничение удалено в e2fsprogs-1.42 (2012) )
  • XFS поддерживает файлы размером до 8 ЭБ.
  • ReiserFS поддерживает файлы размером до 1 ЭБ, 8 ТБ в 32-битных системах.
  • JFS поддерживает файлы размером до 4 ПБ.
  • Btrfs поддерживает файлы размером до 16 ЭБ.
  • NILFS поддерживает файлы размером до 8 ЭБ.
  • YAFFS 2 поддерживает файлы размером до 2 ГБ
FreeBSD
  • ZFS поддерживает файлы размером до 16 ЭБ.
FreeBSD и другие BSD
  • Файловая система Unix (UFS) поддерживает файлы размером до 8 ZiB.

Ограничения операционной системы

Каждая операционная система имеет ограничения внутренней файловой системы на размер файла и размер диска, которые не зависят от файловой системы или физического носителя. Если операционная система имеет какие-либо ограничения ниже, чем файловая система или физический носитель, то ограничения ОС будут реальным пределом.

Окна
  • Windows 95, 98, ME имеют ограничение в 4 ГБ для всех размеров файлов.
  • Windows XP имеет ограничение в 16 ТБ для всех размеров файлов.
  • Windows 7 имеет ограничение в 16 ТБ для всех размеров файлов.
  • Windows 8, 10 и Server 2012 имеют ограничение в 256 ТБ для всех размеров файлов.
Linux
  • 32-разрядные системы с ядром 2.4.x имеют ограничение в 2 ТБ для всех файловых систем.
  • 64-битные системы ядра 2.4.x имеют ограничение в 8 ЭБ для всех файловых систем.
  • В 32-битных системах с ядром 2.6.x без опции CONFIG_LBD для всех файловых систем установлен предел в 2 ТБ.
  • В 32-битных системах с ядром 2.6.x с опцией CONFIG_LBD и во всех 64-битных системах с ядром 2.6.x для всех файловых систем установлено ограничение в 8 ЗБ. [3]
Google Android

Google Android основан на Linux, что определяет его базовые ограничения.

  • Внутреннее хранилище:
    • Android 2.3 и более поздние версии используют файловую систему ext4 . [4]
    • Android 2.2 и более ранние версии используют файловую систему YAFFS 2.
  • Слоты для внешних накопителей:
    • Все устройства Android должны поддерживать файловые системы FAT16, FAT32, ext2.
    • Android 2.3 и более поздние версии поддерживают файловую систему ext4.
Apple iOS (см. Список устройств iOS )
  • Все устройства поддерживают HFS Plus (HFS +) для внутренней памяти. Ни на одном устройстве нет слотов для внешних накопителей. На устройствах версии 10.3 и новее используется файловая система Apple, поддерживающая максимальный размер файла 8 ЭБ.

Советы

Обнаружение поврежденных файлов

Полезно проверить суммы MD5 (указанные в файле в каталоге загрузки), чтобы убедиться, что загрузка была полной и точной. Это можно проверить, запустив команду «md5sum» для загруженных файлов. Учитывая их размеры, это может занять некоторое время. Из-за технических деталей того, как файлы хранятся, размеры файлов могут сообщаться по-разному в разных файловых системах, и поэтому не обязательно являются надежными. Кроме того, во время загрузки могло произойти повреждение, хотя это маловероятно.

Переформатирование внешних USB-накопителей

Если вы планируете загружать файлы дампа Википедии на один компьютер и использовать внешний USB-накопитель или жесткий диск для их копирования на другие компьютеры, то вы столкнетесь с ограничением размера файла FAT32 в 4 ГБ. Чтобы обойти это ограничение, переформатируйте USB-накопитель размером> 4 ГБ в файловую систему, которая поддерживает файлы большего размера. Если вы работаете исключительно с компьютерами под управлением Windows XP-Vista-7, переформатируйте USB-накопитель в файловую систему NTFS.

Linux и Unix

Если кажется, что вы достигли предела в 2 ГБ, попробуйте использовать wget версии 1.10 или выше, cURL версии 7.11.1-1 или выше или последнюю версию lynx (с помощью -dump). Также вы можете возобновить загрузку (например, wget -c).

Почему бы просто не получить данные с wikipedia.org во время выполнения?

Предположим, вы создаете программу, которая в определенные моменты отображает информацию из Википедии. Если вы хотите, чтобы ваша программа отображала информацию иначе, чем в реальной версии, вам, вероятно, понадобится викикод, который используется для ее ввода, вместо готового HTML.

Кроме того, если вы хотите получить все данные, вы, вероятно, захотите передать их наиболее эффективным способом. Серверы wikipedia.org должны проделать довольно много работы, чтобы преобразовать викикод в HTML. Это требует времени как для вас, так и для серверов wikipedia.org, поэтому простое сканирование всех страниц - не лучший вариант.

Чтобы получить доступ к любой статье в XML по одной, выберите Special: Export / Title of the article .

Подробнее об этом читайте в Special: Export .

Имейте в виду, что живые зеркала Википедии, которые динамически загружаются с серверов Викимедиа, запрещены. См. Википедию: Зеркала и вилки .

Пожалуйста, не используйте веб-сканер

Пожалуйста, не используйте веб-сканер для загрузки большого количества статей. Агрессивное сканирование сервера может вызвать резкое замедление работы Википедии.

Образец сообщения электронной почты заблокированного сканера

IP-адрес nnn.nnn.nnn.nnn получал до 50 страниц в секунду с адресов wikipedia.org. Что-то вроде как минимум секундной задержки между запросами разумно. Пожалуйста, уважайте эту настройку. Если вам необходимо немного превысить его, делайте это только в наименее загруженное время, указанное в графиках загрузки нашего сайта по адресу stats .wikimedia .org / EN / ChartsWikipediaZZ .htm . Стоит отметить, что сканирование всего сайта со скоростью одного обращения в секунду займет несколько недель. Исходный IP-адрес сейчас заблокирован или скоро будет заблокирован. Свяжитесь с нами, если вы хотите его разблокировать. Пожалуйста, не пытайтесь его обойти - мы просто заблокируем весь ваш диапазон IP.
Если вам нужна информация о том, как более эффективно получать наш контент, мы предлагаем различные методы, включая еженедельные дампы базы данных, которые вы можете загружать в MySQL и сканировать локально в любой удобной для вас скорости. Также доступны инструменты, которые будут делать это за вас так часто, как вы захотите, если у вас есть инфраструктура.
Вместо ответа по электронной почте вы можете посетить #mediawiki connect на irc.freenode.net, чтобы обсудить свои варианты с нашей командой.

Выполнение SQL-запросов к текущему дампу базы данных

Вы можете выполнять SQL-запросы к текущему дампу базы данных, используя Quarry (как замену отключенной странице Special: Asksql ).

Схема базы данных

Схема SQL

См. Также: mw: Manual: макет базы данных

Файл sql, используемый для инициализации базы данных MediaWiki, можно найти здесь .

Схема XML

Схема XML для каждого дампа определяется в верхней части файла. А также описано на странице справки по экспорту MediaWiki .

Помогите разобрать дамп для использования в скриптах

  • Википедия: Справочная служба компьютера / ParseMediaWikiDump описывает библиотеку Perl Parse :: MediaWikiDump, которая может анализировать дампы XML.
  • Препроцессор Википедии (wikiprep.pl) - это сценарий Perl, который предварительно обрабатывает необработанные дампы XML и создает таблицы ссылок, иерархии категорий, собирает текст привязки для каждой статьи и т. Д.
  • Парсер дампа SQL из Википедии - это .NET-библиотека для чтения дампа MySQL без необходимости использования базы данных MySQL.
  • WikiDumpParser - библиотека .NET Core для анализа дампов базы данных.
  • Dictionary Builder - это программа на Rust, которая может анализировать дампы XML и извлекать записи в файлах.
  • Скрипты для разбора дампов Википедии - скрипты на основе Python для разбора файлов sql.gz из дампов Википедии.
  • parse-mediawiki-sql - библиотека Rust для быстрого анализа файлов дампа SQL с минимальным выделением памяти

Выполнение Hadoop MapReduce в текущем дампе базы данных Википедии

Вы можете выполнять запросы Hadoop MapReduce для текущего дампа базы данных, но вам потребуется расширение для InputRecordFormat, чтобы каждый <page> </page> был отдельным входом сопоставителя. Рабочий набор java-методов (jobControl, mapper, reducer и XmlInputRecordFormat) доступен в Hadoop в Википедии.

Помогите импортировать дамп в MySQL

Видеть:

  • mw: Руководство: Импорт дампов XML
  • m: Дампы данных

Статические дампы дерева HTML для зеркалирования или распространения компакт-дисков

MediaWiki 1.5 включает в себя процедуры для сброса вики-страницы в HTML, визуализации HTML с помощью того же парсера, который используется в действующей вики-странице. Как указано на следующей странице, размещение одной из этих дампов в Интернете без изменений будет являться нарушением прав на товарный знак. Они предназначены для частного просмотра в интрасети или на рабочем столе.

  • Если вы хотите создать черновик традиционного веб-сайта в Mediawiki и вывести его в формат HTML, вы можете попробовать mw2html от пользователя: Connelly .
  • Если вы хотите помочь в разработке инструментов для преобразования дампа в статический HTML, напишите нам в список рассылки разработчиков .
  • Статические дампы HTML теперь доступны здесь , но не актуальны.

Смотрите также:

  • mw: Альтернативные парсеры перечисляют некоторые другие неработающие варианты получения статических дампов HTML.
  • Википедия: Снимки
  • Википедия: база данных TomeRaider

Кивикс

Kiwix на планшете Android

Kiwix на сегодняшний день является крупнейшим оффлайновым дистрибутивом Википедии . Как офлайн-программа для чтения, Kiwix работает с библиотекой содержимого, которое представляет собой zim-файлы: вы можете выбрать любой проект Викимедиа (Википедия на любом языке, Викисловарь , Википедия и т. Д.), А также TED Talks , PhET Interactive Maths & Physics. симуляции , проект Гутенберга и т. д.

Это бесплатное приложение с открытым исходным кодом, и в настоящее время его можно скачать на следующих сайтах:

  • Android
  • iOS
  • macOS
  • Windows и Windows 10 (UWP)
  • GNU / Linux

... а также расширения для браузеров Chrome и Firefox , серверные решения и т. д. Полное портфолио Kiwix см. на официальном веб-сайте .

Словарь Аард

Aard Dictionary - это автономная программа для чтения Википедии. Нет изображений. Кроссплатформенность для Windows, Mac, Linux, Android, Maemo. Работает на устройствах чтения электронных книг Nook и Sony PRS-T1 с root-доступом. https://github.com/aarddict

Электронная книга

Вики-как-книга магазин электронных книг , созданные из большого набора статей Википедии с черно - белыми изображениями для электронных книг читателей (2013).

Wikiviewer для Rockbox

Плагин wikiviewer для Rockbox позволяет просматривать преобразованные дампы Википедии на многих устройствах Rockbox . Требуется индивидуальная сборка и преобразование дампов вики, используя инструкции, доступные на http://www.rockbox.org/tracker/4755 . При преобразовании файл повторно сжимается и разбивается на файлы размером 1 ГБ и индексный файл, которые должны находиться в одной папке на устройстве или на карте micro SD.

Старые свалки

  • Статическая версия Википедии, созданная Викимедиа: http://static.wikipedia.org/, 11 февраля 2013 г. - Похоже, сейчас она недоступна. Контента не было.
  • Wiki2static (сайт закрыт с октября 2005 г. ) была экспериментальной программой, созданной пользователем: Alfio для создания дампов HTML, включая изображения, функцию поиска и алфавитный указатель. На указанном сайте можно скачать экспериментальные дампы и сам скрипт. В качестве примера он был использован для создания этих копий английской WikiPedia 24 апреля 04 , Simple WikiPedia 1 мая 04 (старая база данных) и английского формата WikiPedia 24 июля 04, Simple WikiPedia 24 июля 04 , WikiPedia Francais 27 июля 2004 (новый формат). BozMo использует версию для создания периодических статических копий с фиксированной ссылкой. (сайт закрыт по состоянию на октябрь 2017 г.).

Генерация динамического HTML из дампа локальной XML-базы данных

Вместо преобразования файла дампа базы данных во множество фрагментов статического HTML можно также использовать динамический генератор HTML. Просмотр вики-страницы похож на просмотр вики-сайта, но контент извлекается и конвертируется из локального файла дампа по запросу из браузера.

XOWA

XOWA - это бесплатное приложение с открытым исходным кодом, которое помогает загружать Википедию на компьютер. Доступ ко всей Википедии в автономном режиме, без подключения к Интернету! В настоящее время он находится на стадии бета-разработки, но работает. Его можно скачать здесь .

Функции

  • Отображает все статьи из Википедии без подключения к Интернету.
  • Загрузите полную, последнюю копию английской Википедии.
  • Отображение более 5,2 миллиона статей в полном HTML-форматировании.
  • Показывать изображения в статье. Доступ к 3,7+ миллионам изображений с помощью автономных баз данных изображений.
  • Работает с любой Wikimedia wiki, включая Wikipedia, Wiktionary, Wikisource, Wikiquote, Wikivoyage (также некоторые дампы, отличные от wmf)
  • Работает с любыми неанглоязычными вики, такими как французская Википедия, немецкая Википедия, голландская википедия и т.
  • Работает с другими специализированными вики, такими как Wikidata, Wikimedia Commons, Wikispecies или любой другой дамп, созданный MediaWiki.
  • Настроить более 660+ других вики, включая:
    • Английский викисловарь
    • Английский Wikisource
    • Английский викицитатник
    • Английский википедия
    • Неанглийские вики-сайты, такие как французский викисловарь, немецкий википедия, голландский википедия.
    • Викиданные
    • Wikimedia Commons
    • Викивиды
    • ... и многое другое!
  • Обновляйте свою вики, когда захотите, используя резервные копии базы данных Викимедиа.
  • Перемещайтесь между офлайн-вики. Нажмите «Найти это слово в Викисловаре» и сразу же просмотрите страницу в Викисловаре.
  • Отредактируйте статьи, чтобы удалить вандализм или ошибки.
  • Установите на карту флэш-памяти для переноса на другие машины.
  • Запускается в Windows, Linux и Mac OS X.
  • Просмотрите HTML-код любой вики-страницы.
  • Найдите любую страницу по названию, используя поле поиска, подобное Википедии.
  • Просматривайте страницы в алфавитном порядке, используя Special: AllPages.
  • Найдите слово на странице.
  • Доступ к истории просмотренных страниц.
  • Добавляйте в закладки свои любимые страницы.
  • Загружает изображения и другие файлы по запросу (при подключении к Интернету)
  • Устанавливает Simple Wikipedia менее чем за 5 минут
  • Можно настроить на многих уровнях: от сочетаний клавиш до макетов HTML и внутренних параметров.

Основные особенности

  1. Очень быстрый поиск
  2. Поиск по ключевым словам (фактически, заголовочным словам)
  3. Поиск дает несколько возможных статей: вы можете выбрать одну из них.
  4. Рендеринг математических формул на основе LaTeX
  5. Минимальные требования к месту: исходный файл .bz2 плюс индекс.
  6. Очень быстрая установка (вопрос часов) по сравнению с загрузкой дампа в MySQL

WikiFilter

WikiFilter - это программа, которая позволяет просматривать более 100 файлов дампа без посещения Wiki-сайта.

Системные требования WikiFilter

  • Последняя версия Windows (WinXP в порядке; Win98 и WinME не будут работать, потому что у них нет поддержки NTFS)
  • Достаточно места на жестком диске (для установки вам понадобится около 12-15 гигабайт; после вам понадобится всего около 10 гигабайт)

Как настроить WikiFilter

  1. Начните загрузку файла дампа базы данных Википедии, например дампа английской Википедии . Лучше всего использовать диспетчер загрузки, такой как GetRight, чтобы вы могли возобновить загрузку файла, даже если ваш компьютер выйдет из строя или выключится во время загрузки.
  2. Загрузите XAMPPLITE из [2] (для работы необходимо установить версию 1.5.0). Обязательно выберите файл, имя которого заканчивается на .exe.
  3. Установите / извлеките его в C: \ XAMPPLITE.
  4. Загрузите WikiFilter 2.3 с этого сайта: http://sourceforge.net/projects/wikifilter . У вас будет выбор файлов для загрузки, поэтому убедитесь, что вы выбрали версию 2.3. Распакуйте его в C: \ WIKIFILTER.
  5. Скопируйте WikiFilter.so в папку C: \ XAMPPLITE \ apache \ modules.
  6. Отредактируйте файл C: \ xampplite \ apache \ conf \ httpd.conf и добавьте следующую строку:
    • LoadModule WikiFilter_module "C: /XAMPPLITE/apache/modules/WikiFilter.so"
  7. По завершении загрузки файла Википедии распакуйте его в папку C: \ WIKIFILTER. (Я использовал демо-версию WinRAR http://www.rarlab.com/ - BitZipper http://www.bitzipper.com/winrar.html тоже работает хорошо.)
  8. Запустите WikiFilter (WikiIndex.exe), перейдите в папку C: \ WIKIFILTER и перетащите XML-файл в окно, нажмите «Загрузить», затем «Пуск».
  9. После завершения выйдите из окна и перейдите в папку C: \ XAMPPLITE. Запустите файл setup_xampp.bat, чтобы настроить xampp.
  10. Когда вы закончите с этим, запустите файл Xampp-Control.exe и запустите Apache.
  11. Перейдите по адресу http: // localhost / wiki и посмотрите, работает ли он.
    • Если не работает, смотрите форумы .

WikiTaxi (для Windows)

WikiTaxi - это автономная программа для чтения вики в формате MediaWiki. Он позволяет пользователям искать и просматривать популярные вики-сайты, такие как Wikipedia, Wikiquote или WikiNews, без подключения к Интернету. WikiTaxi хорошо работает с разными языками, такими как английский, немецкий, турецкий и другие, но имеет проблемы со скриптами с написанием справа налево. WikiTaxi не отображает изображения.

Системные требования WikiTaxi

  • Любая версия Windows, начиная с Windows 95 или новее. Поддержка больших файлов (более 4 ГБ, что требует файловой системы exFAT) для огромных вики (на момент написания этой статьи только на английском языке).
  • Он также работает в Linux с Wine .
  • Минимум 16 МБ ОЗУ для читателя WikiTaxi, 128 МБ рекомендуется для импортера (больше для скорости).
  • Место для хранения базы данных WikiTaxi. Для этого требуется около 11,7 ГБ для английской Википедии (по состоянию на 5 апреля 2011 г.), 2 ГБ для немецкого языка и меньше для других вики. Эти цифры, вероятно, будут расти в будущем.

Использование WikiTaxi

  1. Скачайте WikiTaxi и распакуйте в пустую папку. В противном случае установка не требуется.
  2. Загрузите дамп XML-базы данных (* .xml.bz2) вашей любимой вики.
  3. Запустите WikiTaxi_Importer.exe, чтобы импортировать дамп базы данных в базу данных WikiTaxi. Импортер позаботится о распаковке дампа при импорте, поэтому не забудьте сохранить место на диске и не распаковывать заранее.
  4. Когда импорт будет завершен, запустите WikiTaxi.exe и откройте созданный файл базы данных. Вы можете немедленно начать поиск, просмотр и чтение.
  5. После успешного импорта файл дампа XML больше не нужен, и его можно удалить, чтобы освободить место на диске.
  6. Чтобы обновить автономный Wiki для WikiTaxi, загрузите и импортируйте более свежий дамп базы данных.

Для чтения WikiTaxi требуются только два файла: WikiTaxi.exe и база данных .taxi. Скопируйте их на любое устройство хранения (карту памяти или карту памяти) или запишите на CD или DVD и возьмите с собой Википедию, куда бы вы ни пошли!

BzReader и MzReader (для Windows)

BzReader - это автономная программа для чтения Википедии с возможностями быстрого поиска. Он отображает текст Wiki в HTML и не требует распаковки базы данных. Требуется Microsoft .NET framework 2.0.

MzReader от Mun206 работает с BzReader (хотя и не связан с ним) и позволяет выполнять дальнейшую визуализацию викикода в улучшенный HTML, включая интерпретацию скина монокниги. Его цель - сделать страницы более читабельными. Требуется среда выполнения Microsoft Visual Basic 6.0, которая не входит в комплект загрузки. Также требуется Inet Control и Internet Controls (Internet Explorer 6 ActiveX), которые входят в комплект загрузки.

EPWING

Автономную базу данных Википедии в формате словаря EPWING, который является распространенным и устаревшим японским промышленным стандартом (JIS) в Японии, можно читать, включая миниатюрные изображения и таблицы с некоторыми ограничениями на отображение, в любых системах, где есть программа для чтения ( Boookends ). Существует множество бесплатных и коммерческих программ для чтения для Windows (включая мобильные), Mac OS X, iOS (iPhone, iPad), Android, Unix-Linux-BSD, DOS и браузерных приложений на основе Java ( EPWING Viewers ).

Зеркальное здание

WP-ЗЕРКАЛО

Важно: WP-mirror не поддерживается с 2014 года, и требуется проверка сообществом, что оно действительно работает. См. Страницу обсуждения .

WP-MIRROR - это бесплатная утилита для зеркалирования любого желаемого набора вики-сайтов WMF. То есть он создает вики-ферму, которую пользователь может просматривать локально. WP-MIRROR создает полное зеркало с медиафайлами оригинального размера. WP-MIRROR доступен для скачивания .

Смотрите также

  • DBpedia
  • WikiReader
  • м: Экспорт
  • m: Справка: Загрузка страниц
  • m: Импорт
  • Мета: дампы данных / другие инструменты , для связанных инструментов, например, экстракторов и «считывателей дампа».
  • Википедия: Выбор компакт-диска Википедии
  • Википедия: размер Википедии
  • meta: Зеркальное отображение XML-дампа проекта Викимедиа
  • meta: инструменты статической версии
  • Офлайн-проекты Викимедиа

Рекомендации

  1. ^ "Тестирование: какой лучший формат сжатия файлов?" . Как Компьютерщику . How-To Geek, LLC . Проверено 18 января 2017 года . CS1 maint: обескураженный параметр ( ссылка )
  2. ^ "Архивировать и разархивировать файлы" . Microsoft . Microsoft . Проверено 18 января 2017 года . CS1 maint: обескураженный параметр ( ссылка )
  3. ^ Поддержка больших файлов в Linux
  4. ^ Android 2.2 и ранее использовала файловую систему YAFFS; 14 декабря 2010 г.

Внешние ссылки

  • Загрузки Викимедиа .
  • Домас посещает журналы ( прочтите это! ). Также старые данные в Интернет-архиве .
  • Архивы списков рассылки Викимедиа .
  • Пользователь: Emijrp / Архив Википедии . Попытка найти все доступные данные Wiki [mp] edia и побудить людей скачивать и сохранять их по всему миру.
  • Скрипт для скачивания всех дампов Википедии 7z .