Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Система астрофизических данных ( ADS ) - это онлайновая база данных, содержащая более восьми миллионов статей по астрономии и физике из рецензируемых и нерецензируемых источников. Рефераты доступны бесплатно в Интернете почти для всех статей, а полные отсканированные статьи доступны в формате обмена графикой (GIF) и формате переносимого документа (PDF) для старых статей. Он был разработан Национальным управлением по аэронавтике и исследованию космического пространства (НАСА) и управляется Гарвард-Смитсоновским центром астрофизики .

ADS - это мощный исследовательский инструмент, который оказал значительное влияние на эффективность астрономических исследований с момента его запуска в 1992 году. Поиск литературы, который раньше занимал дни или недели, теперь может выполняться за секунды с помощью поисковой системы ADS, которая изготовлен на заказ для астрономических нужд. Исследования показали, что выгода от ADS для астрономии эквивалентна нескольким сотням миллионов долларов США в год [1], и, по оценкам, система утроила читательскую аудиторию астрономических журналов. [2]

Использование ADS почти повсеместно среди астрономов во всем мире, поэтому статистику использования ADS можно использовать для анализа глобальных тенденций в астрономических исследованиях. Эти исследования показали, что объем исследований, проводимых астрономом, связан с валовым внутренним продуктом (ВВП) на душу населения страны, в которой он / она базируется, и что количество астрономов в стране пропорционально ВВП. страны, поэтому общий объем исследований, проведенных в стране, пропорционален квадрату ее ВВП, деленного на ее население. [2]

История [ править ]

В течение многих лет растущей проблемой в астрономических исследованиях (как и в других академических дисциплинах) было то, что количество статей, опубликованных в основных астрономических журналах, неуклонно росло, а это означало, что астрономы могли читать все меньше и меньше последних результатов исследований. В течение 1980-х годов астрономы увидели, что зарождающиеся технологии, которые легли в основу Интернета, в конечном итоге могут быть использованы для создания электронной системы индексации научных работ по астрономии, которая позволит астрономам быть в курсе гораздо более широкого диапазона исследований. [3]

Первое предложение о создании базы данных рефератов из журнальных статей было сделано на конференции по астрономии из больших баз данных, состоявшейся в Гархинг-бай-Мюнхен в 1987 году. Первоначальная разработка электронной системы доступа к астрофизическим рефератам происходила в течение следующих двух лет; в 1991 г. велись дискуссии о том, как интегрировать ADS с базой данных SIMBAD , содержащей все доступные обозначения в каталоге для объектов за пределами Солнечной системы , чтобы создать систему, в которой астрономы могли бы искать все статьи, написанные о данном объекте. [1]

Первоначальная версия ADS с базой данных, состоящей из 40 статей, была создана в качестве подтверждения концепции в 1988 году, а база данных ADS была успешно связана с базой данных SIMBAD летом 1993 года. Создатели полагали, что это было первое использование Интернет, позволяющий одновременно запрашивать трансатлантические научные базы данных. До 1994 года сервис был доступен через проприетарное сетевое программное обеспечение, но в начале того же года он был перенесен во всемирную паутину . Число пользователей службы увеличилось в четыре раза за пять недель после внедрения веб-службы ADS. [1]

Сначала журнальные статьи, доступные через ADS, были отсканированными растровыми изображениями, созданными из бумажных журналов, но с 1995 года Astrophysical Journal начал публиковать онлайн-издание, вскоре за ним последовали другие основные журналы, такие как Astronomy and Astrophysics и The Monthly. Уведомления Королевского астрономического общества. ADS предоставила ссылки на эти электронные издания с момента их первого появления. Примерно с 1995 года количество пользователей ADS удваивается примерно каждые два года. В настоящее время ADS имеет соглашения почти со всеми астрономическими журналами, которые предоставляют рефераты. Отсканированные статьи начала XIX века доступны через сервис, который сейчас содержит более восьми миллионов документов. Сервис распространяется по всему миру, с двенадцатью зеркальными сайтами в двенадцати странах на пяти континентах, с синхронизацией базы данных посредством еженедельных обновлений с помощью rsync , утилиты зеркалирования, которая позволяет обновлять только те части базы данных, которые изменились. Все обновления запускаются централизованно, но они запускают сценарии на зеркальных сайтах, которые «извлекают» обновленные данные с основных серверов ADS.[4]

Данные в системе [ править ]

1284 статьи о M101 доступны через ADS еще с 1850 года.

Статьи индексируются в базе данных по их библиографическим записям, содержащим сведения о журнале, в котором они были опубликованы, и различные связанные метаданные , такие как списки авторов, ссылки и цитаты . Первоначально эти данные хранились в формате ASCII , но в конечном итоге ограничения этого стимулировали тех, кто обслуживает базы данных, в 2000 году перенести все записи в формат XML (Extensible Markup Language). Библиографические записи теперь хранятся как элемент XML с подэлементами для различные метаданные. [4]

С появлением онлайн-изданий журналов рефераты загружаются в ADS не позднее даты публикации статей, а полный текст журнала доступен для подписчиков. Старые статьи были отсканированы, а аннотация была создана с использованием программного обеспечения для оптического распознавания символов . Отсканированные статьи примерно до 1995 г. обычно доступны бесплатно по соглашению с издателями журнала. [5]

Отсканированные статьи сохраняются в формате TIFF как со средним, так и с высоким разрешением . Файлы TIFF по запросу преобразуются в файлы GIF для просмотра на экране и файлы PDF или PostScript для печати. Сгенерированные файлы затем кэшируются, чтобы исключить излишне частое обновление популярных статей. По состоянию на 2000 год ADS содержал 250 ГБ сканированных изображений, которые состояли из 1 128 955 страниц статей, содержащих 138 789 статей. К 2005 году он вырос до 650 ГБ и, как ожидается, вырастет еще до примерно 900 ГБ к 2007 году. [5] Никакой дополнительной информации опубликовано не было.

Изначально база данных содержала только астрономические ссылки, но теперь она выросла до трех баз данных, охватывающих ссылки по астрономии (включая планетарные науки и физику Солнца), ссылки по физике (включая приборы и науки о Земле), а также препринты научных статей из arXiv . База данных по астрономии, безусловно, является самой продвинутой, и на ее использование приходится около 85% от общего использования ADS. Статьи назначаются в разные базы данных в соответствии с темой, а не журналом, в котором они публикуются, так что статьи из любого одного журнала могут появляться во всех трех тематических базах данных. Разделение баз данных позволяет настраивать поиск по каждой дисциплине, чтобы слова могли автоматически задаваться разнымивесовые функции в различных поисках в базе данных, в зависимости от того, насколько они распространены в соответствующем поле. [4]

Данные в архиве препринтов обновляются ежедневно из arXiv , главного хранилища препринтов по физике и астрономии. Появление серверов препринтов, как и ADS, оказало значительное влияние на скорость астрономических исследований, поскольку статьи часто становятся доступными с серверов препринтов за недели или месяцы до их публикации в журналах. Включение препринтов из arXiv в ADS означает, что поисковая система может возвращать самые свежие доступные исследования, с оговоркой, что препринты могут не пройти рецензирование или корректуру.к требуемому стандарту для публикации в основных журналах. База данных ADS связывает препринты с впоследствии опубликованными статьями везде, где это возможно, так что поиск по цитированию и справочникам будет возвращать ссылки на статью журнала, где был процитирован препринт. [6]

Программное и аппаратное обеспечение [ править ]

Программное обеспечение работает в системе, которая была написана специально для него, что позволяет выполнять обширную настройку для астрономических нужд, что было бы невозможно с программным обеспечением баз данных общего назначения . Сценарии разработаны так, чтобы быть максимально независимыми от платформы , учитывая необходимость облегчения зеркалирования в различных системах по всему миру, хотя растущее использование Linux в качестве предпочтительной операционной системы в астрономии привело к увеличению оптимизации сценариев для установки на эта платформа. [4]

Сервер основные ADS расположен в Гарвард-Смитсоновского центра астрофизики в Кембридже, штат Массачусетс , и представляет собой двойной 64-битный X86 Intel сервер с двумя четырёхъядерный 3,0 ГГц процессоров и 32 ГБ оперативной памяти , работающих под управлением CentOS 5.4 Linux распределение. [5] Зеркала находятся в Бразилии, Китае, Чили, Франции, Германии, Индии, Индонезии, Японии, России, Южной Корее, Великобритании и Украине. [7]

Индексирование [ править ]

В настоящее время ADS получает рефераты или оглавления почти из двухсот журнальных источников. Сервис может получать данные, относящиеся к одной и той же статье из нескольких источников, и создает одну библиографическую ссылку на основе наиболее точных данных из каждого источника. Обычное использование TeX и LaTeX почти всеми научными журналами значительно облегчает включение библиографических данных в систему в стандартизированном формате, а также просто импортировать веб-статьи в формате HTML . ADS использует сценарии Perl для импорта, обработки и стандартизации библиографических данных. [4]

По- видимому , обыденная задача преобразования имен авторов в стандартную Фамилию , Первоначальный формат действительно один из наиболее трудно автоматизировать, из - за большое разнообразие именования по всему миру и возможности того, что данное имя , такие как Дэвис может стать первым имя , отчество или фамилия. Точное преобразование имен требует детального знания имен авторов, работающих в астрономии, и ADS поддерживает обширную базу данных имен авторов, которая также используется при поиске в базе данных (см. Ниже).

Для электронных статей легко извлечь список ссылок, приведенный в конце статьи. Для отсканированных статей извлечение ссылок зависит от OCR. Справочную базу данных можно затем «перевернуть», чтобы перечислить цитаты для каждой статьи в базе данных. Списки цитирования использовались в прошлом для выявления популярных статей, отсутствующих в базе данных; в основном они были созданы до 1975 года и теперь добавлены в систему.

Покрытие [ править ]

База данных сейчас содержит более восьми миллионов статей. В случае с основными журналами по астрономии ( Astrophysical Journal , Astronomical Journal , Astronomy and Astrophysics , Publications of the Astronomical Society of the Pacific и Monthly Notices of the Royal Astronomical Society ) охват полный, все выпуски индексируются с номера 1 в настоящее время. На эти журналы приходится около двух третей статей в базе данных, остальные состоят из статей, опубликованных в более чем 100 других журналах со всего мира, а также в материалах конференций. [5]

В то время как база данных содержит полное содержание всех основных журналов, а также многих второстепенных, количество ссылок и цитирований в ней гораздо менее полно. Ссылки и цитаты статей в основных журналах достаточно полны, но такие ссылки, как «частное общение», «в прессе» или «в процессе подготовки», не могут быть сопоставлены, а ошибки автора в списках литературы также представляют потенциальные ошибки. Астрономические статьи могут цитироваться и цитироваться статьями в журналах, выходящих за рамки ADS, таких как журналы по химии , математике или биологии . [8]

Поисковая система [ править ]

Пример сложного поиска, объединяющего объектные, заголовочные и абстрактные запросы с фильтром по дате

С момента своего создания ADS разработала очень сложную поисковую систему для запросов к абстрактным и объектным базам данных. Поисковая машина специально разработана для поиска астрономических рефератов, и эта машина и ее пользовательский интерфейс предполагают, что пользователь хорошо разбирается в астрономии и может интерпретировать результаты поиска, которые предназначены для поиска не только наиболее релевантных статей. В базу данных можно запросить имена авторов, астрономический объект.имена, слова заголовков и слова в абстрактном тексте, а также результаты можно фильтровать по ряду критериев. Он работает, сначала собирая синонимы и упрощая условия поиска, как описано выше, а затем генерируя «инвертированный файл», который представляет собой список всех документов, соответствующих каждому термину поиска. Выбранная пользователем логика и фильтры затем применяются к этому инвертированному списку для генерации окончательных результатов поиска. [9]

Запросы об имени автора [ править ]

Система индексирует имена авторов по фамилии и инициалам и учитывает возможные варианты написания имен, используя список вариантов. Это распространено в случае имен, включающих акценты, такие как умляуты и транслитерации арабского или кириллического алфавита . Пример записи в списке синонимов авторов:

АФАНАСЬЕВ В
АФАНАСЬЕВ В
АФАНАСЬЕВ В
АФАНАСЕВ В
АФАНАСЬЕВ В
АФАНСЬЕВ В
АФАНСЕВ В

Поиск по имени объекта [ править ]

Возможность поиска статей по конкретным астрономическим объектам - один из самых мощных инструментов ADS. Система использует данные из SIMBAD , внегалактической базы данных NASA / IPAC , циркуляров Международного астрономического союза и Лунного и планетарного института для идентификации документов, относящихся к данному объекту, а также может выполнять поиск по положению объекта, перечисляя документы, которые касаются объектов в пределах определенного объекта. Радиус 10  угловых минут заданного прямого восхождения и склонения . Эти базы данных объединяют в себе множество каталожных обозначений, которые может иметь объект, так что поиск Плеяд также найдет статьи, в которых перечислены известныеоткрытое скопление в Тельце под любыми другими обозначениями в каталоге или популярными названиями, такими как M45, Семь сестер или Melotte 22. [10]

Заголовки и аннотации [ править ]

Поисковая система сначала фильтрует условия поиска несколькими способами. Символ M, за которым следует пробел или дефис, удаляет пробел или дефис, так что поиск объектов каталога Мессье упрощается и пользовательский ввод M45, M 45 или M-45 все приводит к выполнению одного и того же запроса; аналогично, обозначения NGC и общие поисковые запросы, такие как Shoemaker Levy и T Tauri , лишены пробелов. Неважные слова, такие как AT, OR и TO, удаляются, хотя в некоторых случаях сохраняется чувствительность к регистру , так что пока a nd игнорируется, A nd преобразуется в " Andromedae ", а Hэ преобразуется в « Геркулес », но ч эр игнорируется. [11]

Замена синонима [ править ]

После предварительной обработки условий поиска в базу данных запрашивается измененный термин поиска, а также синонимы для него. Помимо простой замены синонимов, такой как поиск форм множественного и единственного числа , ADS также выполняет поиск большого количества специфических астрономических синонимов. Например, спектрограф и спектроскоп имеют в основном одно и то же значение, а в астрономическом контексте металличность и изобилие также являются синонимами. Список синонимов ADS был создан вручную путем группирования списка слов в базе данных по схожим значениям. [4]

Наряду с синонимами на английском языке , ADS также выполняет поиск переводов на английский язык иностранных поисковых терминов и наоборот, так что поиск по французскому слову soleil дает ссылки на Sun , а статьи на языках, отличных от английского, могут быть возвращены по английским условиям поиска.

Замена Синоним может быть отключена , если это необходимо, так что редкий термин , который является синонимом гораздо более общий термин (например, « выходных данных » , а не « дата ») можно искать специально.

Логика выбора [ править ]

Поисковая система допускает логику выбора как внутри полей, так и между полями. Условия поиска в каждом поле можно комбинировать с помощью ИЛИ, И, простой логики или логической логики , и пользователь может указать, какие поля должны совпадать в результатах поиска. Это позволяет строить сложные поисковые запросы; например, пользователь может искать документы, касающиеся NGC 6543 ИЛИ NGC 7009 , с заголовками, содержащими (радиус ИЛИ скорость) И НЕ (количество ИЛИ температура).

Фильтрация результатов [ править ]

Результаты поиска могут быть отфильтрованы по ряду критериев, в том числе с указанием диапазона лет, например «с 1945 по 1975 год», «с 2000 года по настоящее время» или «до 1900 года», а также по типу журнала, в котором публикуется статья. - рецензируемые статьи, такие как материалы конференций, могут быть исключены или специально найдены, или определенные журналы могут быть включены в поиск или исключены из него.

Результаты поиска [ править ]

Страница результатов поиска из ADS - A, F, G, C, R и т. Д. - это ссылки на связанные данные для каждого реферата, такие как полнотекстовая статья, цитаты, также прочитанные статьи и т. Д.

Хотя он был задуман как средство доступа к рефератам и статьям, ADS предоставляет значительный объем вспомогательной информации наряду с результатами поиска. Для каждого возвращенного реферата предоставляются ссылки на другие статьи в базе данных, на которые есть ссылки и которые цитируют статью, а также предоставляется ссылка на препринт, если он существует. Система также создает ссылку на статьи, которые также можно прочитать, то есть на те, к которым чаще всего обращаются те, кто читает статью. Таким образом, пользователь ADS может определить, какие статьи представляют наибольший интерес для астрономов, интересующихся предметом данной статьи. [9]

Также возвращаются ссылки на базы данных имен объектов SIMBAD и / или NASA Extragalactic Database, с помощью которых пользователь может быстро найти основные данные наблюдений об объектах, проанализированных в статье, и найти дополнительные статьи по этим объектам.

Влияние на астрономию [ править ]

ADS почти повсеместно используется в качестве исследовательского инструмента среди астрономов, и есть несколько исследований, которые количественно оценили, насколько более эффективными стали ADS в астрономии; один подсчитал, что ADS повысил эффективность астрономических исследований на 333 исследовательских года, эквивалентных полной занятости, в год [1], а другой обнаружил, что в 2002 году его эффект был эквивалентен 736 штатным исследователям или всем астрономическим исследованиям, проведенным во Франции. [2] ADS позволила поиску литературы, на выполнение которого раньше требовалось несколько дней или недель, завершить за секунды, и, по оценкам, ADS увеличила читательскую аудиторию и использование астрономической литературы примерно в три раза с момента ее создания. . [2]

В денежном выражении это повышение эффективности представляет собой значительную сумму. Во всем мире насчитывается около 12000 активных астрономических исследователей, поэтому ADS составляет около 5% работающего населения астрономов. Бюджет глобальных астрономических исследований оценивается в размере от 4 000 до 5 000 миллионов долларов США [12], так что ценность ADS для астрономии будет составлять около 200–250 миллионов долларов США в год. Его операционный бюджет составляет небольшую часть этой суммы. [2]

Огромное значение ADS для астрономов было признано Организацией Объединенных Наций , Генеральная Ассамблея которой высоко оценила работу и успех ADS, особенно отметив ее важность для астрономов в развивающихся странах, в докладах Комитета Организации Объединенных Наций по делам миролюбивых людей. Использование космического пространства . Между тем в отчете гостевой комиссии Центра астрофизики за 2002 год говорится, что эта служба «произвела революцию в использовании астрономической литературы» и была «вероятно, самым ценным отдельным вкладом в астрономические исследования, который CfA сделал за время своего существования. ". [13]

Социологические исследования с использованием ADS [ править ]

Поскольку ADS используется почти повсеместно астрономами, она может многое рассказать о том, как астрономические исследования распространяются по всему миру. Большинство пользователей получают доступ к системе из высших учебных заведений, чей IP-адрес может быть легко использован для определения географического положения пользователя. Исследования показывают, что самыми высокими пользователями ADS на душу населения являются астрономы из Франции и Нидерландов , а в более развитых странах (измеряемых ВВП на душу населения)) пользуются системой более чем в менее развитых странах; связь между ВВП на душу населения и использованием ADS не является линейной. Диапазон использования ADS на душу населения намного превышает диапазон ВВП на душу населения, и фундаментальные исследования, проведенные в стране, измеряемые использованием ADS, оказались пропорциональны квадрату ВВП страны, деленного на ее население. [2]

Статистика использования ADS также предполагает, что астрономы в более развитых странах, как правило, более продуктивны, чем астрономы в менее развитых странах. Объем проведенных фундаментальных исследований пропорционален количеству астрономов в стране, умноженному на ВВП на душу населения. Статистика также подразумевает, что астрономы в европейских культурах проводят примерно в три раза больше исследований, чем в азиатских культурах , что, возможно, свидетельствует о культурных различиях в важности астрономических исследований. [2]

ADS также использовалась, чтобы показать, что доля статей по астрономии, написанных одним автором, значительно уменьшилась с 1975 года и что астрономические статьи с более чем 50 авторами стали более распространенными с 1990 года [14].

См. Также [ править ]

  • Список академических баз данных и поисковых систем
  • Bibcode
  • INSPIRE-HEP
  • Внегалактическая база данных НАСА / IPAC (NED)
  • Система планетарных данных НАСА (PDS)
  • PubMed
  • SIMBAD
  • Майкл Дж. Курц

Ссылки [ править ]

  1. ^ а б в г Курц, MJ; Eichhorn G .; Аккацци А .; Грант CS; Мюррей СС; Уотсон Дж. М. (2000). "Система астрофизических данных НАСА: Обзор". Дополнение по астрономии и астрофизике . 143 (1): 41–59. arXiv : astro-ph / 0002104 . Bibcode : 2000A и AS..143 ... 41K . DOI : 10.1051 / AAS: 2000170 . S2CID  17583122 .
  2. ^ Б с д е е г Kurtz, МДж; Eichhorn G .; Аккацци А .; Грант CS; Демлейтнер М .; Мюррей СС (2005). «Всемирное использование и влияние цифровой библиотеки системы астрофизических данных НАСА». Журнал Американского общества информационных наук и технологий . 56 (1): 36–45. arXiv : 0909.4786 . Bibcode : 2005JASIS..56 ... 36K . DOI : 10.1002 / asi.20095 . S2CID 15181632 . ( Препринт )
  3. ^ Хорошо, JC (1992). «Обзор системы астрофизических данных (ADS)». В Диане М. Уорролл, Крисе Бимесдерфер и Жаннетт Барнс (ред.). Астрономическое программное обеспечение анализа данных и системы я . Серия конференций ASP. 25 . п. 35. Bibcode : 1992ASPC ... 25 ... 35G .
  4. ^ a b c d e f Аккацци, А .; Eichhorn G .; Курц MJ; Грант CS; Мюррей СС (2000). "Система данных астрофизики НАСА: архитектура". Дополнение по астрономии и астрофизике . 143 (1): 85–109. arXiv : astro-ph / 0002105 . Bibcode : 2000A и AS..143 ... 85A . DOI : 10.1051 / AAS: 2000172 . S2CID 7182316 . 
  5. ^ a b c d "Информация о зеркальном отображении абстрактной службы ADS НАСА" . Гарвард-Смитсоновский центр астрофизики. 23 июня 2005 . Проверено 2 ноября 2008 .
  6. ^ «Мартовское собрание APS 2007 г. - Событие - myADS-arXiv: полностью настраиваемый виртуальный журнал с открытым доступом» . Бюллетень Американского физического общества . 52 (1): U20.9 . Проверено 30 октября 2008 .
  7. ^ "SAO / NASA ADS в SAO: Mirror Sites" . doc.adsabs.harvard.edu . Проверено 30 октября 2008 .
  8. ^ «Библиографические коды ADS: аббревиатуры журнала» . adsabs.harvard.edu . Проверено 30 октября 2008 .
  9. ^ a b Eichhorn, G .; Курц MJ; Аккацци А .; Грант CS; Мюррей СС (2000). «Система данных астрофизики НАСА: поисковая машина и ее пользовательский интерфейс». Дополнение по астрономии и астрофизике . 143 (1): 61–83. arXiv : astro-ph / 0002102 . Bibcode : 2000A & AS..143 ... 61E . DOI : 10.1051 / AAS: 2000171 . S2CID 2787647 . 
  10. ^ "SAO / NASA ADS HELP: Абстрактная форма запроса - позиция" . doc.adsabs.harvard.edu . Проверено 30 октября 2008 .
  11. ^ «SAO / NASA ADS HELP: Абстрактная форма запроса - стоп» . doc.adsabs.harvard.edu . Проверено 30 октября 2008 .
  12. ^ Woltjer, L. (1998). «Экономические последствия ухудшения астрономической среды». Сохранение астрономических окон . Серия конференций ASP. 139 . п. 243.
  13. ^ «Награды и признание ADS» . НАСА ADS . Проверено 2 ноября 2008 .

Внешние ссылки [ править ]

  • Официальный веб-сайт
  • НАСА ADS: Форма запроса - начните поиск статьи здесь.
  • Страницы справки ADS