Информатика биоразнообразия - это применение методов информатики к информации о биоразнообразии , такой как таксономия , биогеография или экология . Современные компьютерные технологии могут дать новые способы просмотра и анализа существующей информации, а также прогнозирования будущих ситуаций (см. Нишевое моделирование ). Информатика биоразнообразия - это термин, который был введен в употребление только в 1992 году, но с быстро увеличивающимися наборами данных стал полезным в многочисленных исследованиях и приложениях, таких как создание таксономических баз данных или географических информационных систем . Информатика биоразнообразия контрастирует с « биоинформатикой».", который часто используется как синоним компьютеризированной обработки данных в специализированной области молекулярной биологии .
Обзор
Информатика биоразнообразия (другая, но связанная с биоинформатикой) - это применение методов информационных технологий к проблемам организации, доступа, визуализации и анализа первичных данных о биоразнообразии. Первичные данные о биоразнообразии состоят из названий, наблюдений и записей образцов, а также генетических и морфологических данных, связанных с образцом. Информатике биоразнообразия, возможно, также придется справляться с управлением информацией от неназванных таксонов, например, полученной путем отбора проб окружающей среды и определения последовательности смешанных проб. Термин «информатика биоразнообразия» также используется для обозначения вычислительных проблем, специфичных для названий биологических объектов, таких как разработка алгоритмов, позволяющих справляться с вариантными представлениями идентификаторов, таких как названия видов и авторитетные источники, и множественные схемы классификации, в рамках которых эти объекты могут находятся в соответствии с предпочтениями различных специалистов в этой области, а также синтаксисом и семантикой, с помощью которых контент в таксономических базах данных может быть сделан машинным запросом и совместимым для целей информатики биоразнообразия ...
История дисциплины
Можно считать, что информатика биоразнообразия началась с создания первых компьютеризированных таксономических баз данных в начале 1970-х годов и прогрессировала за счет последующей разработки инструментов распределенного поиска к концу 1990-х, включая специалиста по анализу видов из Канзасского университета, Североамериканскую информационную сеть по биоразнообразию NABIN. , CONABIO в Мексике, INBio в Коста-Рике и др. [1], создание Глобального информационного фонда по биоразнообразию в 2001 году и параллельная разработка различных нишевых моделей и других инструментов для работы с оцифрованными данными о биоразнообразии из средних Начиная с 1980-х годов (например, см. [2] ). В сентябре 2000 года американский журнал Science посвящен специальный выпуск «биоинформатики для биоразнообразия», [3] журнал Биоразнообразие информатики начавшихся издание в 2004 году, а также несколько международных конференций по 2000 - е годы принесли информатики биоразнообразия вместе практиков, в том числе Лондон e- Конференция по биосфере в июне 2009 года. Приложение к журналу BMC Bioinformatics (Volume 10 Suppl 14 [4] ), опубликованное в ноябре 2009 года, также посвящено информатике биоразнообразия.
История термина
Согласно переписке, воспроизведенной Уолтером Берендсоном [5], термин «информатика биоразнообразия» был введен Джоном Уайтингом в 1992 году для обозначения деятельности организации, известной как Канадский консорциум информатики биоразнообразия, группы, занимающейся объединением базовой информации о биоразнообразии с экономикой окружающей среды. и геопространственная информация в форме GPS и ГИС . Впоследствии он, по-видимому, потерял всякую обязательную связь с миром GPS / ГИС и был связан с компьютеризированным управлением любыми аспектами информации о биоразнообразии (например, см. [6] )
Цифровая таксономия (систематика)
Глобальный список всех видов
Одной из основных проблем в области информатики биоразнообразия в глобальном масштабе является отсутствие в настоящее время полного основного списка признанных в настоящее время видов в мире , хотя это является целью проекта « Каталог жизни », рассчитанного на ок. 1,65 миллиона видов из примерно 1,9 миллиона описанных видов в Ежегодном контрольном списке за 2016 год . Аналогичная попытка для таксонов ископаемых, база данных Paleobiology [7] документирует около 100 000+ названий ископаемых видов из неизвестного общего числа.
Научные названия родов и видов как уникальные идентификаторы
Применение линнеевской системы биномиальной номенклатуры для видов и одночленов для родов и более высоких рангов привело ко многим преимуществам, но также и к проблемам с омонимами (одно и то же имя используется для нескольких таксонов, случайно или законно в нескольких царствах), синонимов ( несколько названий для одного и того же таксона), а также вариантные представления одного и того же названия из-за орфографических различий, незначительных орфографических ошибок, вариаций в способе цитирования имен авторов и дат и т. д. Кроме того, названия могут меняться с течением времени в связи с изменением таксономических мнений (например, правильное родовое положение вида или повышение подвида до ранга вида или наоборот), а также ограниченность таксона может изменяться в зависимости от к таксономическим концепциям разных авторов. Одним из предлагаемых решений этой проблемы является использование идентификаторов наук о жизни ( LSID ) для машинно-машинной связи, хотя у этого подхода есть как сторонники, так и противники.
Консенсусная классификация организмов
Организмы можно классифицировать множеством способов (см. Главную страницу « Биологическая классификация» ), что может создать проблемы при проектировании систем информатики биоразнообразия, нацеленных на включение одной или нескольких классификаций в соответствии с потребностями пользователей или для того, чтобы направить их к единой ». предпочтительная "система". Возможно ли когда-либо достичь единой системы классификации консенсуса, это, вероятно, открытый вопрос, однако «Каталог жизни» инициировал деятельность в этой области [8] , на смену которой пришла опубликованная система, предложенная в 2015 году М. Руджеро и его коллегами. [9]
Мобилизация первичной информации о биоразнообразии
«Первичную» информацию о биоразнообразии можно рассматривать как базовые данные о встречаемости и разнообразии видов (или, действительно, о любых распознаваемых таксонах), обычно в сочетании с информацией об их распространении в пространстве, времени или в обоих случаях. Такая информация может быть в форме сохраненных образцов и связанной с ними информации, например, собранной в коллекциях естествознания музеев и гербариев , или в виде записей наблюдений, например, из официальных фаунистических или флористических исследований, проводимых профессиональными биологами и студентами, или в качестве любительских и других запланированных или незапланированных наблюдений, в том числе тех, которые все больше попадают в сферу гражданской науки . Обеспечение согласованного цифрового доступа в режиме онлайн к этой обширной коллекции разрозненных первичных данных является основной функцией информатики биоразнообразия, которая лежит в основе региональных и глобальных сетей данных о биоразнообразии, примерами последних являются OBIS и GBIF .
В качестве вторичного источника данных о биоразнообразии соответствующая научная литература может анализироваться либо людьми, либо (потенциально) специальными алгоритмами поиска информации для извлечения соответствующей первичной информации о биоразнообразии, которая сообщается в ней, иногда в агрегированной / сводной форме, но часто в виде первичных наблюдений в повествовательная или табличная форма. Элементы такой деятельности (такие как извлечение ключевых таксономических идентификаторов, ключевых слов / индексных терминов и т. Д.) Уже много лет практикуются на более высоком уровне отдельными академическими базами данных и поисковыми системами . Однако для максимальной ценности информатики биоразнообразия в идеале следует извлечь фактические данные о первичных встречах, а затем сделать их доступными в стандартизированной форме или формах; например, проекты Plazi и INOTAXA преобразуют таксономическую литературу в форматы XML , которые затем могут быть прочитаны клиентскими приложениями: первые используют TaxonX-XML, а вторые - формат taXMLit. Библиотека наследия биоразнообразия также вносит значительный прогресс в своей целью оцифровку существенные части вне-авторского права таксономической литературы, который затем подвергается оптического распознавания символов (OCR) , с тем , чтобы поддаваться дальнейшей обработке с использованием информатики биоразнообразия инструментов.
Стандарты и протоколы
Как и другие дисциплины, связанные с данными, информатика биоразнообразия извлекает выгоду из принятия соответствующих стандартов и протоколов для поддержки машинно-машинной передачи и взаимодействия информации в рамках своей конкретной области. Примеры соответствующих стандартов включают схему Darwin Core XML для данных о биоразнообразии на основе образцов и наблюдений, разработанную с 1998 года, плюс ее расширения, Схему передачи таксономических концепций , а также стандарты для структурированных описательных данных и доступа к данным биологической коллекции (ABCD). ; в то время как протоколы поиска и передачи данных включают DiGIR (в настоящее время в основном заменен) и TAPIR (протокол доступа TDWG для поиска информации). Многие из этих стандартов и протоколов в настоящее время поддерживаются, а их разработка контролируется Стандартами информации о биоразнообразии (TDWG) .
Текущая деятельность
На конференции по электронной биосфере в Великобритании в 2009 г. [10] были приняты следующие темы, которые указывают на широкий спектр текущих мероприятий в области информатики биоразнообразия и на то, как они могут быть классифицированы:
- Применение: сохранение / сельское хозяйство / рыболовство / промышленность / лесное хозяйство
- Применение: инвазивные чужеродные виды
- Применение: Систематическая и эволюционная биология
- Применение: системы таксономии и идентификации.
- Новые инструменты, услуги и стандарты для управления данными и доступа к ним
- Новые инструменты моделирования
- Новые инструменты для интеграции данных
- Новые подходы к инфраструктуре биоразнообразия
- Новые подходы к определению видов
- Новые подходы к картированию биоразнообразия
- Национальные и региональные базы данных и сети по биоразнообразию
Послеконференционный семинар ключевых лиц , выполняющих в настоящее время важные роли в области информатики биоразнообразия, также привел к принятию Резолюции семинара, в которой, среди прочего, подчеркивалась необходимость создания надежных глобальных реестров ресурсов, которые являются базовыми для информатики биоразнообразия (например, репозитории, коллекции ); завершить создание прочной таксономической инфраструктуры; и создавать онтологии для данных о биоразнообразии.
Примеры проектов
Глобальный:
- Глобальный информационный фонд по биоразнообразию (GBIF) и информационная система Ocean Биогеографической (OBIS) (для морских видов)
- В Видовой 2000 , ИТИС (Интегрированная информационная система Таксономический) и Каталог жизни проектов
- Глобальные имена
- EOL , проект "Энциклопедия жизни"
- Консорциум по Barcode Жизни проекта
- Карта жизни проекта
- База данных Рептилии проект
- AmphibiaWeb проект
- Вперёд Универсального Биологическое индексатор и организатор, от Вудсхола морской биологической лаборатории
- Указатель имена ОРГАНИЗМА (ION) из Clarivate Analytics, обеспечивающий доступ к научным названиям таксонов из многочисленных журналов , как индексируются в Зоологической записи
- Временный Реестр морских и неморских РОДОВ (IRMNG)
- ZooBank , реестр номенклатурных актов и соответствующей систематической литературы по зоологии
- Index Nominum Genericorum , составление общих названий , опубликованных для организмов , охватываемых Международным кодексом ботанической номенклатуры , поддерживается в Смитсоновском институте в США
- Международный индекс названий растений
- MycoBank , документирующий новые названия и комбинации грибов
- Список имен прокариотических с Standing в Номенклатуре ( LPSN ) - Официальный реестр действительных имен для бактерий и архей , а регулируется Международным кодексом номенклатуры бактерий
- Проект Библиотеки наследия биоразнообразия - оцифровка литературы по биоразнообразию
- Викивиды , компиляция таксономической информации с открытым исходным кодом (редактируемая сообществом), сопутствующий проект для Википедии
- TaxonConcept.org , проект связанных данных, который объединяет разрозненные базы данных видов.
- Instituto de Ciencias Naturales . Национальный университет Колумбии. Отдел виртуальных коллекций и информатики биоразнообразия
- АНТАБИФ . Информационный фонд по биоразнообразию Антарктики предоставляет свободный и открытый доступ к данным о биоразнообразии Антарктики в духе Договора об Антарктике.
- Genesys (веб-сайт) , база данных генетических ресурсов растений, поддерживаемая в национальных, региональных и международных генных банках
- VertNet , Доступ к первичным данным о встречаемости позвоночных из наборов данных по всему миру.
Региональные / национальные проекты:
- Фауна Европы
- Атлас живой Австралии
- Инфраструктура панъевропейских каталогов видов (PESI)
- Симбиота
- iDigBio , Integrated Digitized Biocollections (США)
- проект i4Life
- Sistema de Información sobre Biodiversidad de Colombia
- Портал по биоразнообразию Индии (IBP)
- Портал биоразнообразия Бутана (BBP)
- Идентификация сорняков и знания в западной части Индийского океана (WIKWIO)
- ESFRI предлагает LifeWatch в качестве общеевропейской исследовательской (электронной) инфраструктуры для поддержки исследований в области биоразнообразия и разработки политики.
Список более 600 текущих мероприятий, связанных с информатикой биоразнообразия, можно найти в базе данных TDWG «Мировые информационные проекты по биоразнообразию» .
Смотрите также
- Глобальное биоразнообразие
- Таксономическая база данных
- Веб-таксономия
- Список баз данных по биоразнообразию
Рекомендации
- Перейти ↑ Krishtalka L, Humphrey PS (2000). "Могут ли музеи естествознания запечатлеть будущее?" . Биология . 50 (7): 611–617. DOI : 10,1641 / 0006-3568 (2000) 050 [0611: CNHMCT] 2.0.CO; 2 .
- ^ Петерсон А.Т., Вьегле Д. (2001). «Прогнозирование вторжений видов с помощью моделирования экологической ниши: новые подходы биоинформатики для решения актуальной проблемы» (PDF) . Биология . 51 (5): 363–371. DOI : 10,1641 / 0006-3568 (2001) 051 [0363: PSIUEN] 2.0.CO; 2 .
- ^ "Биоинформатика для биоразнообразия?" . Наука . 289 : 2229–2440. 2000 г.
- ^ «Информатика биоразнообразия» . BMC Bioinformatics . 10 Suppl 14. 2009. Архивировано из оригинала на 2010-01-27 . Проверено 15 ноября 2009 .
- ^ « « Информатика биоразнообразия », термин» . Проверено 6 августа 2009 .
- ^ Бисби FA; и другие. (2000). «Тихая революция: информатика биоразнообразия и Интернет». Наука . 289 (5488): 2309–2312. Bibcode : 2000Sci ... 289.2309B . DOI : 10.1126 / science.289.5488.2309 . PMID 11009408 . S2CID 31852825 .
- ^ «База данных палеобиологии» . Проверено 6 августа 2009 .
- ^ «На пути к иерархии управления (классификации) Каталога жизни. Проект документа для обсуждения, доктор Деннис П. Гордон, май 2009 г.» . Архивировано из оригинала на 2009-08-08 . Проверено 6 августа 2009 .
- ^ Руджеро, Массачусетс; Гордон, Д.П .; Оррелл, TM; Байи, Н .; Bourgoin, T .; Бруска, RC; и другие. (2015). «Классификация всех живых организмов более высокого уровня» . PLOS ONE . 10 (4): e0119248. Bibcode : 2015PLoSO..1019248R . DOI : 10.1371 / journal.pone.0119248 . PMC 4418965 . PMID 25923521 .
- ^ http://www.e-biosphere09.org/
дальнейшее чтение
- Рабочая группа Форума меганауки ОЭСР по биологической информатике (1999). Заключительный отчет Megascience Форума Рабочей группы ОЭСР по биологической информатике, январь 1999 года . С. 1–74. Архивировано из оригинала на 2009-03-05 . Проверено 21 марта 2018 .
- Канос, вице-президент; Souza, S .; Джованни Р. и Канос, ДАЛ (2004). «Глобальная информатика биоразнообразия: создание условий для« нового мира »экологического моделирования» . Информатика биоразнообразия . 1 : 1–13. DOI : 10,17161 / bi.v1i0.3 .
- Соберон, Дж. И Петерсон, А. Т. (2004). «Информатика биоразнообразия: управление и применение первичных данных о биоразнообразии» . Фил. Пер. R. Soc. Лондон . B359 (1444): 689–698. DOI : 10.1098 / rstb.2003.1439 . PMC 1693343 . PMID 15253354 .[ постоянная мертвая ссылка ]
- Чепмен, AD (2005). Использование данных о первичных видах и встречаемости (PDF) . Копенгаген: Глобальный информационный фонд по биоразнообразию. С. 1–106. Архивировано из оригинального (PDF) 16 февраля 2010 года . Проверено 12 августа 2009 .
- Джонсон, Н.Ф. (2007). «Информатика биоразнообразия». Ежегодный обзор энтомологии . 52 : 421–438. DOI : 10.1146 / annurev.ento.52.110405.091259 . PMID 16956323 .
- Саркар, IN (2007). «Информатика биоразнообразия: организация и связывание информации по всему спектру жизни» . Брифинги по биоинформатике . 8 (5): 347–357. DOI : 10.1093 / нагрудник / bbm037 . PMID 17704120 .
- Гуралник, Р.П .; Хилл, А (2009). «Информатика биоразнообразия: автоматизированные подходы к документированию глобальных моделей и процессов биоразнообразия» . Биоинформатика . 25 (4): 421–428. DOI : 10.1093 / биоинформатики / btn659 . PMID 19129210 .
Внешние ссылки
- Информатика биоразнообразия (журнал)
- Веб-сайт Международной конференции по информатике биоразнообразия 2009 г.