Из Википедии, свободной энциклопедии
  (Перенаправлено из НАСА ADS )
Перейти к навигации Перейти к поиску

Система астрофизических данных ( ADS ) - это онлайновая база данных, содержащая более восьми миллионов статей по астрономии и физике из рецензируемых и не рецензируемых источников. Рефераты доступны бесплатно в Интернете почти для всех статей, а полные отсканированные статьи доступны в формате обмена графикой (GIF) и формате переносимого документа (PDF) для старых статей. Он был разработан Национальным управлением по аэронавтике и исследованию космического пространства (НАСА) и управляется Гарвард-Смитсоновским центром астрофизики .

ADS - это мощный исследовательский инструмент, который оказал значительное влияние на эффективность астрономических исследований с момента его запуска в 1992 году. Поиск литературы, который раньше занимал дни или недели, теперь может выполняться за секунды с помощью поисковой системы ADS, которая является изготовлен по индивидуальному заказу для астрономических нужд. Исследования показали, что выгода для астрономии от ADS эквивалентна нескольким сотням миллионов долларов США в год [1], и, по оценкам, система утроила читательскую аудиторию астрономических журналов. [2]

Использование ADS почти повсеместно среди астрономов во всем мире, поэтому статистику использования ADS можно использовать для анализа глобальных тенденций в астрономических исследованиях. Эти исследования показали, что объем исследований, проводимых астрономом, связан с валовым внутренним продуктом (ВВП) на душу населения страны, в которой он / она проживает, и что количество астрономов в стране пропорционально ВВП. страны, поэтому общий объем исследований, проведенных в стране, пропорционален квадрату ее ВВП, деленного на ее население. [2]

История [ править ]

В течение многих лет растущей проблемой в астрономических исследованиях (как и в других академических дисциплинах) было то, что количество статей, опубликованных в крупных астрономических журналах, неуклонно росло, а это означало, что астрономы могли читать все меньше и меньше последних результатов исследований. В 1980-х годах астрономы увидели, что зарождающиеся технологии, которые легли в основу Интернета, в конечном итоге могут быть использованы для создания электронной системы индексации научных работ по астрономии, которая позволит астрономам быть в курсе гораздо более широкого диапазона исследований. [3]

Первое предложение о создании базы данных рефератов из журнальных статей было сделано на конференции по астрономии из больших баз данных, состоявшейся в Гархинг-бай-Мюнхен в 1987 году. Первоначальная разработка электронной системы для доступа к астрофизическим рефератам происходила в течение следующих двух лет; в 1991 г. велись дискуссии о том, как интегрировать ADS с базой данных SIMBAD , содержащей все доступные обозначения в каталоге для объектов за пределами Солнечной системы , чтобы создать систему, в которой астрономы могли бы искать все статьи, написанные о данном объекте. [1]

Первоначальная версия ADS с базой данных, состоящей из 40 статей, была создана в качестве доказательства концепции в 1988 году, а база данных ADS была успешно связана с базой данных SIMBAD летом 1993 года. Создатели полагали, что это было первое использование Интернет, позволяющий одновременно запрашивать трансатлантические научные базы данных. До 1994 года сервис был доступен через проприетарное сетевое программное обеспечение, но в начале того же года он был перенесен в зарождающуюся всемирную паутину . Число пользователей службы увеличилось в четыре раза за пять недель после внедрения веб-службы ADS. [1]

Сначала журнальные статьи, доступные через ADS, были отсканированными растровыми изображениями, созданными из бумажных журналов, но с 1995 года Astrophysical Journal начал публиковать онлайн-издание, вскоре за ним последовали другие основные журналы, такие как Astronomy and Astrophysics и The Monthly. Уведомления Королевского астрономического общества. ADS предоставила ссылки на эти электронные издания с момента их первого появления. Примерно с 1995 года количество пользователей ADS удваивается примерно каждые два года. В настоящее время ADS имеет соглашения почти со всеми астрономическими журналами, которые предоставляют рефераты. Отсканированные статьи начала XIX века доступны через сервис, который сейчас содержит более восьми миллионов документов. Сервис распространяется по всему миру, с двенадцатью зеркальными сайтами в двенадцати странах на пяти континентах, с синхронизацией базы данных посредством еженедельных обновлений с помощью rsync , утилиты зеркалирования, которая позволяет обновлять только те части базы данных, которые изменились. Все обновления запускаются централизованно, но они запускают сценарии на зеркальных сайтах, которые «извлекают» обновленные данные с основных серверов ADS.[4]

Данные в системе [ править ]

1284 статьи о M101 доступны через ADS еще с 1850 года.

Статьи индексируются в базе данных по их библиографической записи, содержащей сведения о журнале, в котором они были опубликованы, и различные связанные метаданные , такие как списки авторов, ссылки и цитаты . Первоначально эти данные хранились в формате ASCII , но в конечном итоге ограничения этого стимулировали тех, кто обслуживает базы данных, в 2000 году перенести все записи в формат XML (Extensible Markup Language). Библиографические записи теперь хранятся как элемент XML с подэлементами для различные метаданные. [4]

С появлением онлайн-изданий журналов рефераты загружаются в ADS не позднее даты публикации статей, при этом полный текст журнала доступен для подписчиков. Старые статьи были отсканированы, а реферат создан с использованием программного обеспечения для оптического распознавания символов . Отсканированные статьи примерно до 1995 г. обычно доступны бесплатно по соглашению с издателями журнала. [5]

Отсканированные статьи сохраняются в формате TIFF как со средним, так и с высоким разрешением . Файлы TIFF по запросу преобразуются в файлы GIF для просмотра на экране и файлы PDF или PostScript для печати. Сгенерированные файлы затем кэшируются, чтобы исключить излишне частое обновление популярных статей. По состоянию на 2000 год ADS содержал 250 ГБ сканированных изображений, которые состояли из 1 128 955 страниц статей, содержащих 138 789 статей. К 2005 году этот объем вырос до 650 ГБ и, как ожидается, вырастет до 900 ГБ к 2007 году. [5] Никакой дополнительной информации опубликовано не было.

Изначально база данных содержала только астрономические ссылки, но теперь она выросла до трех баз данных, охватывающих ссылки по астрономии (включая планетарные науки и физику Солнца), ссылки по физике (включая приборы и науки о Земле), а также препринты научных статей из arXiv . База данных по астрономии, безусловно, является самой продвинутой, и на ее использование приходится около 85% от общего использования ADS. Статьи назначаются в разные базы данных в соответствии с темой, а не журналом, в котором они публикуются, так что статьи из любого одного журнала могут появляться во всех трех тематических базах данных. Разделение баз данных позволяет настраивать поиск по каждой дисциплине, чтобы слова могли автоматически задаваться разнымивесовые функции в различных поисках в базе данных, в зависимости от того, насколько они распространены в соответствующем поле. [4]

Данные в архиве препринтов обновляются ежедневно из arXiv , главного хранилища препринтов по физике и астрономии. Появление серверов препринтов, как и ADS, оказало значительное влияние на скорость астрономических исследований, поскольку статьи часто становятся доступными с серверов препринтов за несколько недель или месяцев до публикации в журналах. Включение препринтов из arXiv в ADS означает, что поисковая система может возвращать самые свежие доступные исследования, с оговоркой, что препринты могут не пройти рецензирование или корректуру.до требуемого стандарта для публикации в основных журналах. База данных ADS связывает препринты с впоследствии опубликованными статьями везде, где это возможно, так что поиск по цитированию и справочникам будет возвращать ссылки на статью журнала, где был процитирован препринт. [6]

Программное и аппаратное обеспечение [ править ]

Программное обеспечение работает в системе, которая была написана специально для него, что позволяет выполнять обширную настройку для астрономических нужд, что было бы невозможно с помощью универсального программного обеспечения для баз данных . Сценарии разработаны так, чтобы быть максимально независимыми от платформы , учитывая необходимость облегчения зеркалирования в различных системах по всему миру, хотя растущее использование Linux в качестве операционной системы выбора в астрономии привело к увеличению оптимизации сценариев для установки на эта платформа. [4]

Сервер основные ADS расположен в Гарвард-Смитсоновского центра астрофизики в Кембридже, штат Массачусетс , и представляет собой двойной 64-битный X86 Intel сервер с двумя четырёхъядерный 3,0 ГГц процессоров и 32 ГБ оперативной памяти , работающих под управлением CentOS 5.4 Linux распределение. [5] Зеркала находятся в Бразилии, Китае, Чили, Франции, Германии, Индии, Индонезии, Японии, России, Южной Корее, Великобритании и Украине. [7]

Индексирование [ править ]

В настоящее время ADS получает рефераты или оглавления почти из двухсот журнальных источников. Служба может получать данные, относящиеся к одной и той же статье из нескольких источников, и создает одну библиографическую ссылку на основе наиболее точных данных из каждого источника. Обычное использование TeX и LaTeX почти всеми научными журналами значительно облегчает включение библиографических данных в систему в стандартизированном формате, а также просто импортировать веб-статьи в формате HTML . ADS использует сценарии Perl для импорта, обработки и стандартизации библиографических данных. [4]

По- видимому , обыденная задача преобразования имен авторов в стандартную Фамилию , Первоначальный формат действительно один из наиболее трудно автоматизировать, из - за большое разнообразие именования по всему миру и возможности того, что данное имя , такие как Дэвис может стать первым имя , отчество или фамилия. Для точного преобразования имен требуется подробное знание имен авторов, работающих в астрономии, и ADS поддерживает обширную базу данных с именами авторов, которая также используется при поиске в базе данных (см. Ниже).

Для электронных статей легко извлечь список ссылок, приведенный в конце статьи. Для отсканированных статей извлечение ссылок зависит от OCR. Справочную базу данных затем можно «инвертировать», чтобы перечислить цитаты для каждой статьи в базе данных. Списки цитирования использовались в прошлом для выявления популярных статей, отсутствующих в базе данных; в основном они были созданы до 1975 года и теперь добавлены в систему.

Покрытие [ править ]

База данных сейчас содержит более восьми миллионов статей. В случае крупных журналов по астрономии ( Astrophysical Journal , Astronomical Journal , Astronomy and Astrophysics , Publications of the Astronomical Society of the Pacific и Monthly Notices of the Royal Astronomical Society ) охват полный, все выпуски индексируются с номера 1 в настоящее время. На эти журналы приходится около двух третей статей в базе данных, остальные состоят из статей, опубликованных в более чем 100 других журналах со всего мира, а также в материалах конференций. [5]

В то время как база данных содержит полное содержание всех основных журналов, а также многих второстепенных, количество ссылок и цитирований в ней гораздо менее полно. Ссылки и цитирование статей в основных журналах достаточно полны, но такие ссылки, как «частное общение», «в прессе» или «в процессе подготовки» не могут быть сопоставлены, а ошибки автора в списках литературы также представляют собой потенциальные ошибки. Астрономические статьи могут цитироваться и цитироваться статьями в журналах, выходящих за рамки ADS, таких как журналы по химии , математике или биологии . [8]

Поисковая система [ править ]

Пример сложного поиска, объединяющего объектные, заголовочные и абстрактные запросы с фильтром по дате

С момента своего создания ADS разработала очень сложную поисковую систему для запросов к абстрактным и объектным базам данных. Поисковая машина специально создана для поиска астрономических рефератов, и эта машина и ее пользовательский интерфейс предполагают, что пользователь хорошо разбирается в астрономии и может интерпретировать результаты поиска, которые предназначены для поиска не только наиболее релевантных статей. В базу данных можно запросить имена авторов, астрономический объект.имена, слова заголовка и слова в абстрактном тексте, а также результаты могут быть отфильтрованы по ряду критериев. Он работает, сначала собирая синонимы и упрощая условия поиска, как описано выше, а затем генерируя «инвертированный файл», который представляет собой список всех документов, соответствующих каждому термину поиска. Выбранная пользователем логика и фильтры затем применяются к этому инвертированному списку для генерации окончательных результатов поиска. [9]

Запросы об имени автора [ править ]

Система индексирует имена авторов по фамилии и инициалам и учитывает возможные варианты написания имен, используя список вариантов. Это распространено в случае имен, содержащих акценты, такие как умляуты и транслитерации арабского или кириллического алфавита . Пример записи в списке синонимов авторов:

АФАНАСЬЕВ В
АФАНАСЬЕВ В
АФАНАСЬЕВ В
АФАНАСЕВ В
АФАНАСЬЕВ В
АФАНСЬЕВ В
АФАНСЕВ В

Поиск по имени объекта [ править ]

Возможность поиска статей о конкретных астрономических объектах - один из самых мощных инструментов ADS. Система использует данные из SIMBAD , внегалактической базы данных NASA / IPAC , циркуляров Международного астрономического союза и Лунного и планетарного института для идентификации документов, относящихся к данному объекту, а также может выполнять поиск по положению объекта, перечисляя документы, которые касаются объектов в пределах определенного объекта. Радиус 10  угловых минут данного прямого восхождения и склонения . Эти базы данных объединяют в себе множество каталожных обозначений, которые может иметь объект, так что поиск Плеяд также найдет статьи, в которых перечислены известныеоткрытое скопление в Тельце под любым другим обозначением в каталоге или популярными названиями, такими как M45, Семь сестер или Melotte 22. [10]

Заголовок и аннотация поиски [ править ]

Поисковая система сначала фильтрует условия поиска несколькими способами. Символ M, за которым следует пробел или дефис, удаляет пробел или дефис, так что поиск объектов каталога Мессье упрощается, и пользовательский ввод M45, M 45 или M-45 все приводит к выполнению одного и того же запроса; аналогично, обозначения NGC и общие поисковые запросы, такие как Shoemaker Levy и T Tauri , лишены пробелов. Неважные слова, такие как AT, OR и TO, удаляются, хотя в некоторых случаях сохраняется чувствительность к регистру , так что, пока a nd игнорируется, A nd преобразуется в " Andromedae ", а Hэ преобразуется в « Геркулес », но ч эр игнорируется. [11]

Замена синонима [ править ]

После предварительной обработки условий поиска в базу данных запрашивается измененный термин поиска, а также синонимы для него. Помимо простой замены синонимов, такой как поиск форм множественного и единственного числа , ADS также выполняет поиск большого количества специфических астрономических синонимов. Например, спектрограф и спектроскоп имеют в основном одно и то же значение, а в астрономическом контексте металличность и изобилие также являются синонимами. Список синонимов ADS был создан вручную путем группирования списка слов в базе данных по схожим значениям. [4]

Наряду с синонимами на английском языке , ADS также выполняет поиск английских переводов иностранных поисковых терминов и наоборот, так что поиск по французскому слову soleil дает ссылки на Sun , а статьи на языках, отличных от английского, могут быть возвращены по английским условиям поиска.

Замена Синоним может быть отключена , если это необходимо, так что редкий термин , который является синонимом гораздо более общий термин (например, « выходных данных » , а не « дата ») можно искать специально.

Логика выбора [ править ]

Поисковая система допускает логику выбора как внутри полей, так и между полями. Условия поиска в каждом поле можно комбинировать с помощью ИЛИ, И, простой логики или логической логики , и пользователь может указать, какие поля должны совпадать в результатах поиска. Это позволяет строить сложные поисковые запросы; например, пользователь может искать статьи, касающиеся NGC 6543 ИЛИ NGC 7009 , с заголовками, содержащими (радиус ИЛИ скорость) И НЕ (количество ИЛИ температура).

Фильтрация результатов [ править ]

Результаты поиска могут быть отфильтрованы по ряду критериев, включая указание диапазона лет, например «с 1945 по 1975 год», «с 2000 года по настоящее время» или «до 1900 года», а также по типу журнала, в котором публикуется статья - без - рецензируемые статьи, такие как материалы конференций, могут быть исключены или специально найдены, или определенные журналы могут быть включены в поиск или исключены из него.

Результаты поиска [ править ]

Страница результатов поиска из ADS - A, F, G, C, R и т. Д. - это ссылки на связанные данные для каждого реферата, такие как полнотекстовая статья, цитаты, также прочитанные статьи и т. Д.

Хотя он был задуман как средство доступа к рефератам и статьям, ADS предоставляет существенный объем вспомогательной информации наряду с результатами поиска. Для каждого возвращенного реферата предоставляются ссылки на другие статьи в базе данных, на которые есть ссылки и которые цитируют статью, а также предоставляется ссылка на препринт, если таковой существует. Система также генерирует ссылку на статьи, которые также можно прочитать, то есть те, к которым чаще всего обращаются те, кто читает эту статью. Таким образом, пользователь ADS может определить, какие статьи представляют наибольший интерес для астрономов, интересующихся предметом данной статьи. [9]

Также возвращаются ссылки на базы данных имен объектов SIMBAD и / или NASA Extragalactic Database, с помощью которых пользователь может быстро узнать основные данные наблюдений об объектах, проанализированных в статье, и найти дополнительные статьи по этим объектам.

Влияние на астрономию [ править ]

ADS почти повсеместно используется в качестве исследовательского инструмента среди астрономов, и есть несколько исследований, которые количественно оценили, насколько эффективнее ADS сделала астрономию; один оценил, что ADS повысил эффективность астрономических исследований на 333 исследовательских года, эквивалентных полной занятости, в год [1], а другой обнаружил, что в 2002 году его эффект был эквивалентен 736 штатным исследователям или всем астрономическим исследованиям, проведенным во Франции. [2] ADS позволила поиску литературы, на выполнение которого раньше требовалось несколько дней или недель, завершить за секунды, и, по оценкам, ADS увеличила читательскую аудиторию и использование астрономической литературы примерно в три раза с момента ее создания. . [2]

В денежном выражении это повышение эффективности представляет собой значительную сумму. Во всем мире насчитывается около 12 000 активных астрономических исследователей, поэтому ADS составляет около 5% работающего населения астрономов. Бюджет глобальных астрономических исследований оценивается в сумму от 4 000 до 5 000 миллионов долларов США [12], поэтому ценность ADS для астрономии будет составлять около 200–250 миллионов долларов США в год. Его операционный бюджет составляет небольшую часть этой суммы. [2]

Огромное значение ADS для астрономов было признано Организацией Объединенных Наций , Генеральная Ассамблея которой дала высокую оценку работе и успеху ADS, особенно отметив ее важность для астрономов в развивающихся странах, в докладах Комитета Организации Объединенных Наций по проблемам миролюбивых людей. Использование космического пространства . Между тем в отчете гостевой комиссии Центра астрофизики за 2002 год говорится, что эта служба «произвела революцию в использовании астрономической литературы» и была «вероятно, самым ценным отдельным вкладом в астрономические исследования, который CfA сделал за время своего существования. ". [13]

Социологические исследования с использованием ADS [ править ]

Поскольку ADS используется почти повсеместно астрономами, она может многое рассказать о том, как астрономические исследования распространяются по всему миру. Большинство пользователей получают доступ к системе из высших учебных заведений, чей IP-адрес может быть легко использован для определения географического положения пользователя. Исследования показывают, что самыми высокими пользователями ADS на душу населения являются астрономы из Франции и Нидерландов , а в более развитых странах (измеряется ВВП на душу населения).) пользуются системой более чем в менее развитых странах; взаимосвязь между ВВП на душу населения и использованием ADS не является линейной. Диапазон использования ADS на душу населения намного превышает диапазон ВВП на душу населения, и фундаментальные исследования, проведенные в стране, измеряемые использованием ADS, оказались пропорциональны квадрату ВВП страны, деленному на ее население. [2]

Статистика использования ADS также свидетельствует о том, что астрономы в более развитых странах, как правило, более продуктивны, чем астрономы в менее развитых странах. Объем проведенных фундаментальных исследований пропорционален количеству астрономов в стране, умноженному на ВВП на душу населения. Статистика также подразумевает, что астрономы в европейских культурах проводят примерно в три раза больше исследований, чем в азиатских , что, возможно, предполагает культурные различия в важности астрономических исследований. [2]

ADS также использовалась, чтобы показать, что доля статей по астрономии, написанных одним автором, значительно уменьшилась с 1975 года и что астрономические статьи с более чем 50 авторами стали более распространенными с 1990 года [14].

См. Также [ править ]

  • Список академических баз данных и поисковых систем
  • Bibcode
  • ВДОХНОВЕНИЕ-HEP
  • Внегалактическая база данных НАСА / IPAC (NED)
  • Система планетарных данных НАСА (PDS)
  • PubMed
  • SIMBAD
  • Майкл Дж. Курц

Ссылки [ править ]

  1. ^ а б в г Курц, MJ; Eichhorn G .; Аккацци А .; Грант CS; Мюррей СС; Уотсон Дж. М. (2000). "Система астрофизических данных НАСА: Обзор". Дополнение по астрономии и астрофизике . 143 (1): 41–59. arXiv : astro-ph / 0002104 . Bibcode : 2000A & AS..143 ... 41K . DOI : 10.1051 / AAS: 2000170 . S2CID  17583122 .
  2. ^ Б с д е е г Kurtz, МДж; Eichhorn G .; Аккацци А .; Грант CS; Демлейтнер М .; Мюррей СС (2005). «Всемирное использование и влияние цифровой библиотеки системы астрофизических данных НАСА». Журнал Американского общества информационных наук и технологий . 56 (1): 36–45. arXiv : 0909.4786 . Bibcode : 2005JASIS..56 ... 36K . DOI : 10.1002 / asi.20095 . S2CID 15181632 . ( Препринт )
  3. ^ Хорошо, JC (1992). «Обзор системы астрофизических данных (ADS)». У Дайаны М. Уорролл, Криса Бимесдерфера и Жаннетт Барнс (ред.). Астрономическое программное обеспечение анализа данных и системы я . Серия конференций ASP. 25 . п. 35. Bibcode : 1992ASPC ... 25 ... 35G .
  4. ^ a b c d e f Аккацци, А .; Eichhorn G .; Курц MJ; Грант CS; Мюррей СС (2000). "Система астрофизических данных НАСА: Архитектура". Дополнение по астрономии и астрофизике . 143 (1): 85–109. arXiv : astro-ph / 0002105 . Bibcode : 2000A & AS..143 ... 85 . DOI : 10.1051 / AAS: 2000172 . S2CID 7182316 . 
  5. ^ a b c d "Информация о зеркальном отображении абстрактной службы ADS НАСА" . Гарвард-Смитсоновский центр астрофизики. 23 июня 2005 . Проверено 2 ноября 2008 .
  6. ^ «Мартовская встреча 2007 APS - Событие - myADS-arXiv: полностью настраиваемый виртуальный журнал с открытым доступом» . Бюллетень Американского физического общества . 52 (1): U20.9 . Проверено 30 октября 2008 .
  7. ^ "SAO / NASA ADS в SAO: Mirror Sites" . doc.adsabs.harvard.edu . Проверено 30 октября 2008 .
  8. ^ «Библиографические коды ADS: аббревиатуры журнала» . adsabs.harvard.edu . Проверено 30 октября 2008 .
  9. ^ a b Eichhorn, G .; Курц MJ; Аккацци А .; Грант CS; Мюррей СС (2000). «Система астрофизических данных НАСА: поисковая машина и ее пользовательский интерфейс». Дополнение по астрономии и астрофизике . 143 (1): 61–83. arXiv : astro-ph / 0002102 . Bibcode : 2000A & AS..143 ... 61E . DOI : 10.1051 / AAS: 2000171 . S2CID 2787647 . 
  10. ^ "SAO / NASA ADS HELP: Абстрактная форма запроса - позиция" . doc.adsabs.harvard.edu . Проверено 30 октября 2008 .
  11. ^ "SAO / НАСА ADS HELP: абстрактная форма запроса - стоп" . doc.adsabs.harvard.edu . Проверено 30 октября 2008 .
  12. ^ Woltjer, L. (1998). «Экономические последствия ухудшения астрономической среды». Сохранение астрономических окон . Серия конференций ASP. 139 . п. 243.
  13. ^ «Награды и признание ADS» . НАСА ADS . Проверено 2 ноября 2008 .

Внешние ссылки [ править ]

  • Официальный сайт
  • НАСА ADS: Форма запроса - начните поиск статьи здесь.
  • Страницы справки ADS