Биодокументация - это область исследований в области наук о жизни, предназначенная для перевода и интеграции биомедицинских знаний из научных статей в совместимые базы данных. [1] [2] Биокоррекция биомедицинских знаний стала возможной благодаря совместной работе биокураторов, разработчиков программного обеспечения и биоинформатиков . [1]
Биокументация как профессия
Biocurator является профессиональным ученым , который является куратором , собирает, аннотирования, и проверяет информацию, распространяемую биологических и модельных баз данных организма . [3] [4] Это новая профессия, первые упоминания о которой датируются 2006 годом в научной литературе в контексте работы в таких базах данных, как База данных иммунных эпитопов и Ресурс анализа . [5] [6] Биокураторы обычно имеют степень доктора философии и обладают сочетанием опыта в мокрой лаборатории и компьютерного представления знаний (например, с помощью онтологий ). [7]
Роль биокуратора включает в себя контроль качества первичных данных биологических исследований, предназначенных для публикации, извлечения и систематизации данных из оригинальной научной литературы, а также описание данных с помощью стандартных протоколов аннотаций и словарей, которые обеспечивают функциональную совместимость с мощными запросами и биологическими базами данных . Биокураторы общаются с исследователями, чтобы гарантировать точность кураторской информации и способствовать обмену данными с исследовательскими лабораториями. [6]
Биокураторы присутствуют в различных исследовательских средах, но могут не идентифицировать себя как биокураторы. Такие проекты, как ELIXIR (Европейская медико-биологическая инфраструктура для биологической информации) и GOBLET (Глобальная организация по обучению, образованию и обучению в области биоинформатики) [8], продвигают обучение и поддерживают биодокументацию как карьерный путь. [9]
В 2011 году биодокументация уже была признана профессией, но не существовало официальных курсов для получения степени целенаправленной подготовки кураторов биологических данных. [10] С развитием этой области Университет Камбриджджа и EMBL-EBI начали совместно предлагать аспирантский сертификат по биодокументации, [11] который рассматривается как шаг к признанию биодокументации как самостоятельной дисциплины. [12]
Биологические базы знаний
Роль биокураторов наиболее известна в области биологических баз знаний . Такие базы данных, как UniProt [13] и PDB [14], полагаются на профессиональных биокураторов для организации информации. Помимо прочего, биокураторы работают над улучшением качества данных, например, путем объединения повторяющихся записей. [15]
Важной частью этих баз знаний являются базы данных по модельным организмам , которые полагаются на биокураторов для сбора информации, касающейся организмов определенных видов. Некоторыми известными примерами модельных баз данных организмов являются FlyBase , [16] PomBase , [17] и ZFIN , [18], посвященные хранению информации о Drosophila , Schizosaccharomyces pombe и рыбках данио соответственно.
Курирование и аннотации
Биодокументация - это интеграция биологической информации в онлайн-базы данных семантически стандартизированным способом с использованием соответствующих уникальных отслеживаемых идентификаторов и предоставлением необходимых метаданных, включая источник и происхождение.
Онтологии, контролируемые словари и стандартные имена
Биокураторы обычно используют и принимают участие в создании и развитии общих биомедицинских онтологий : структурированных, контролируемых словарей, которые охватывают многие области биологических и медицинских знаний, таких как открытые биомедицинские онтологии . Эти области включают геномику и протеомику , анатомию , развитие животных и растений , биохимию , метаболические пути , таксономическую классификацию и мутантные фенотипы . Учитывая разнообразие существующих онтологий, существуют руководящие принципы, которые ориентируют исследователей на то, как выбрать подходящую. [19]
Единая медицинская система Язык является одним из таких систем , которая объединяет и распространяет миллионы терминов , используемых в области наук о жизни. [20]
Биокураторы обеспечивают последовательное использование руководящих принципов по номенклатуре генов и участвуют в комитетах по генетической номенклатуре различных модельных организмов , часто в сотрудничестве с Комитетом по номенклатуре генов HUGO ( HGNC ). Они также обеспечивают соблюдение других рекомендаций по номенклатуре, таких как те, которые предоставлены Номенклатурным комитетом Международного союза биохимии и молекулярной биологии (IUBMB), одним из примеров которых является номер ЕС Комиссии по ферментам .
В более общем плане, использование постоянных идентификаторов приветствуется сообществом, чтобы улучшить ясность и облегчить понимание [21]
Аннотации ДНК
В геноме аннотации , например, идентификаторы , определяемые онтологии и консорциумы используются для описания частей генома. Например, онтология генов (GO) курирует термины для биологических процессов, которые используются для описания того, что мы знаем о конкретных генах .
Текстовая аннотация
По состоянию на 2021 год общение в области наук о жизни по-прежнему осуществляется в основном с помощью свободных естественных языков, таких как английский или немецкий , которые содержат определенную степень двусмысленности и затрудняют объединение знаний. Таким образом, помимо аннотирования биологических последовательностей, биокураторы также аннотируют тексты, связывая слова с уникальными идентификаторами. Это помогает устранить неоднозначность, прояснить предполагаемый смысл и сделать тексты доступными для обработки на компьютере. Одно из применений текстовой аннотации - указать точный ген, о котором говорит ученый. [22]
Общедоступные текстовые аннотации позволяют биологам использовать дополнительные преимущества биомедицинского текста. Европа PMC имеет интерфейс прикладного программирования , который централизует текст аннотаций из различных источников и сделать их доступными в пользовательского графического интерфейса под названием SciLite. [23] PubTator Central также предоставляет аннотации, но полностью основан на компьютеризованном анализе текста и не предоставляет пользовательского интерфейса. [24] Существуют также программы, которые позволяют пользователям вручную аннотировать интересующие их биомедицинские тексты, например, система ezTag. [25]
Международное общество биодокументации (ISB)
Международное общество Biocuration (ISB) является некоммерческой организацией «способствует поле biocuration и служит форумом для обмена информацией путем проведения совещаний и семинаров.» Он вырос из Международных конференций по биокументации и основан в начале 2009 года. [4]
ИМК предлагает Biocuration Карьера премии в biocurators в общины: Biocurator Career Award (вручается ежегодно) и премии ISB за исключительный вклад в Biocuration ( с учетом двухгодичной).
Официальный журнал ISB, База данных , специализируется на статьях о базах данных и биодокументации. [26]
Курирование сообщества
Традиционно биодокументацию проводят специализированные специалисты, которые интегрируют данные в базы данных. Курирование сообщества стало многообещающим подходом к улучшению распространения знаний из опубликованных данных и предоставлению экономичного способа повышения масштабируемости биодокументации. В некоторых случаях помощь сообщества усиливается на собраниях, которые знакомят экспертов предметной области с задачами курирования, выполняемыми во время мероприятия [27], в то время как другие полагаются на асинхронный вклад экспертов и неспециалистов. [28]
Биологические базы данных
Некоторые биологические базы данных в определенной степени включают вклад авторов в свою стратегию функционального курирования, который может варьироваться от связывания идентификаторов генов с публикациями или произвольным текстом до более структурированных и подробных аннотаций последовательностей и функциональных данных, выводящих кураторство по тем же стандартам, что и профессиональные биокураторы . Большая часть курирования сообществом баз данных модельных организмов включает аннотации оригинальных авторов опубликованных исследований (аннотации первого прохода) для эффективного получения точных идентификаторов для объектов, подлежащих курированию, или определения типов данных для детального изучения. Например:
- WormBase успешно запрашивает аннотации с первого прохода от пользователей и интегрировала авторское управление с процессом микропубликации. [30] WormBase также интегрирует анализ текста в свою платформу, предоставляя предложения кураторам сообщества. [29]
- FlyBase отправляет по электронной почте запросы авторам новых публикаций [31], предлагая им перечислить гены и типы данных, описанные с помощью онлайн-инструмента, а также мобилизовал сообщество для написания параграфов с обзором генов. [32]
Другие базы данных, такие как PomBase , полагаются на авторов публикаций, которые предоставляют подробные аннотации на основе онтологий для своих публикаций и метаданные, связанные с общегеномными наборами данных с использованием контролируемых словарей. Веб-инструмент Canto ; [33] был разработан для облегчения подачи заявок сообществом. Поскольку Canto является свободно доступным, универсальным и легко настраиваемым, он был принят в других проектах. [34] Курирование подвергается проверке профессиональными кураторами, что приводит к высококачественному углубленному изучению всех типов молекулярных данных. [35]
Широко используемая база знаний UniProt также имеет механизм курирования сообщества, который позволяет исследователям добавлять информацию о белках. [36]
Ресурсы в стиле вики
Биовики полагаются на свои сообщества в предоставлении контента, и для биодокументации доступен ряд ресурсов в стиле вики. [37] [38] AuthorReward , [39], например, является расширением MediaWiki, которое позволяет количественно оценить вклад исследователей в биовики. RiceWiki был примером базы данных на основе вики для сообщества по курированию генов риса, снабженной AuthorReward . [40] [41] CAZypedia - еще один такой вики-сайт для совместной биокументации информации об углеводно-активных ферментах (CAZys). [42]
В WikiProteins / WikiProfessional был проект семантически организации биологических данных во главе с Barend Монс . [43] [44] В проекте 2007 года непосредственный вклад внес Джимми Уэйлс , соучредитель Википедии, и он взял Викиданные как источник вдохновения. [43] В настоящее время активным проектом по адаптации программного обеспечения mediawiki является WikiPathways , который собирает информацию о биологических путях . [45]
Википедия
Существует некоторое совпадение между работой биокураторов и Википедией , при этом границы между научными базами данных и Википедией становятся все более размытыми. [46] [38] [47] Базы данных, такие как Rfam [48] [49] и Protein Data Bank [50], например, активно используют Википедию и ее редакторы для сбора информации. [51] [52] Однако большинство баз данных предлагают хорошо структурированные данные, которые можно искать в сложных комбинациях, что обычно невозможно в Википедии, хотя Викиданные нацелены на решение этой проблемы до некоторой степени.
Проект Gene Wiki использовал Википедию для совместного изучения тысяч генов и генных продуктов, таких как тайтин и инсулин . [53] В нескольких проектах Википедия также используется в качестве платформы для сбора медицинской информации. [28]
Еще один способ использования Википедии для биодокументации - это список статей . Например, Комплексная база данных по устойчивости к антибиотикам объединяет свою оценку баз данных об устойчивости к антибиотикам с конкретным списком в Википедии . [54]
Викиданные
База знаний Викимедиа. Викиданные все чаще используются сообществом специалистов по биодокументации в качестве интегрированного хранилища наук о жизни. [55] Некоторые рассматривают Викиданные как альтернативу с лучшими перспективами обслуживания и взаимодействия, чем небольшие независимые базы биологических знаний. [56]
Викиданные использовались для сбора информации о SARS-CoV-2 и пандемии COVID-19 [57] [58], а также проектом Gene Wiki для сбора информации о генах . [59] Данные из биодокументации Викиданных повторно используются на внешних ресурсах через запросы SPARQL . [60] Некоторые проекты используют кураторство через Викиданные как способ улучшить информацию о биологических науках в Википедии. [61]
Геймифицированные ресурсы
Подход к вовлечению толпы в биодокументацию заключается в использовании игровых платформ, которые используют принципы игрового дизайна для повышения вовлеченности. Вот несколько примеров:
- Mark2Cure, игровая платформа для сообщества сообщества биомедицинских рефератов [62] [63] [64]
- Cochrane Crowd [65], платформа Cochrane для проведения клинических испытаний, классификации и обобщения биомедицинской литературы. [66]
- CIViC, портал для аннотации геномных вариантов, связанных с раком [67], который отслеживает оценки и ведет списки лидеров. [68]
Геймификация также применялась в контексте профессионального кураторства для улучшения количественной оценки и признания вкладов. [69]
Вычислительный анализ текста для курирования
Технологии обработки естественного языка и интеллектуального анализа текста могут помочь биокураторам извлекать информацию для ручного редактирования. [71] Интеллектуальный анализ текста может масштабировать усилия по курированию, поддерживая, например, идентификацию имен генов, а также для частичного вывода онтологий . [72] [73] Преобразование неструктурированных утверждений к структурированной информации использует методы , как с именем распознавание лица и разбором из зависимостей. [74] Текстовый анализ биомедицинских концепций сталкивается с проблемами, связанными с вариациями в отчетах, и сообщество работает над повышением машиночитаемости статей. [75]
Во время пандемии COVID-19 интенсивно использовался биомедицинский анализ текста, чтобы справиться с большим количеством опубликованных научных исследований по этой теме (более 50 000 статей). [76]
Популярный пакет Python для НЛП SpaCy имеет модификацию для биомедицинских текстов, SciSpaCy, которая поддерживается Институтом ИИ Аллена . [77]
Среди проблем интеллектуального анализа текста, применяемого к биодокументированию, - сложность доступа к полным текстам биомедицинских статей из-за ограничения платежеспособности, связывая проблемы биодокументации с проблемами движения за открытый доступ . [78]
Дополнительный подход к биодокументированию посредством интеллектуального анализа текста включает применение оптического распознавания символов к биомедицинским фигурам в сочетании с автоматическими алгоритмами аннотации. Это было использовано для извлечения информации из генов Pathway фигур, например. [79]
Предложения по улучшению письменного текста для облегчения аннотаций варьируются от использования контролируемых естественных языков [80] до обеспечения четкой ассоциации понятий (таких как гены и белки ) с конкретными представляющими интерес видами . [81]
Несмотря на то, что проблемы остаются, интеллектуальный анализ текста уже является неотъемлемой частью рабочего процесса биодокументации в нескольких базах биологических знаний . [82]
Биокреативные проблемы
Взаимодействие между интеллектуальным анализом текста и биодокументацией было продвинуто в рамках конкурса BioCreAtIvE (Критическая оценка систем извлечения информации в биологии), серии соревнований по интеллектуальному анализу текста, которые впервые прошли в 2004 году. [83]
Смотрите также
- Международное общество биокументации
- Биологическая база данных
- База данных модельных организмов
- Цифровое курирование
- OBO Foundry
Рекомендации
- ^ Б «Что такое biocuration |? Международное общество Biocuration» . www.biocuration.org . Проверено 6 сентября 2020 .
- ^ Хоу Д., Костанцо М., Фей П., Годжобори Т., Хэнник Л., Хайд В. и др. (Сентябрь 2008 г.). «Большие данные: будущее биодокументации» . Природа . 455 (7209): 47–50. Bibcode : 2008Natur.455 ... 47H . DOI : 10.1038 / 455047a . PMC 2819144 . PMID 18769432 .
- ^ Бердж С., Аттвуд Т.К., Бейтман А., Берардини Т.З., Черри М., О'Донован С. и др. (2012-03-20). «Биокураторы и биокументация: обзор вызовов 21 века» . База данных . 2012 : bar059. DOI : 10,1093 / базы данных / bar059 . PMC 3308150 . PMID 22434828 .
- ^ а б Бейтман А. (апрель 2010 г.). «Кураторы мира объединяются: Международное общество биокументации» . Биоинформатика . 26 (8): 991. DOI : 10,1093 / биоинформатики / btq101 . PMID 20305270 .
- ^ Bourne PE, McEntyre J (октябрь 2006 г.). «Биокураторы: вкладчики в мир науки» . PLOS Вычислительная биология . 2 (10): e142. Bibcode : 2006PLSCB ... 2..142B . DOI : 10.1371 / journal.pcbi.0020142 . PMC 1626157 . PMID 17411327 .
- ^ а б Салими Н., Вита Р. (октябрь 2006 г.). «Биокуратор: объединение и расширение научных данных» . PLOS Вычислительная биология . 2 (10): e125. Bibcode : 2006PLSCB ... 2..125S . DOI : 10.1371 / journal.pcbi.0020125 . PMC 1626147 . PMID 17069454 .
- ^ Биокурация, Международное общество (2018-04-16). «Биодокументация: преобразование данных в знания» . PLOS Биология . 16 (4): e2002846. DOI : 10.1371 / JOURNAL.PBIO.2002846 .
- ^ "GOBLET | Глобальная организация по изучению, образованию и обучению в области биоинформатики" . Проверено 19 декабря 2020 .
- ^ Александра Холински; Мелисса Берк; Сара Л. Морган; Питер Маккуилтон; Патрисия М. Паладжи (4 сентября 2020 г.). «Биодокументация - отображение ресурсов и потребностей» . F1000 Исследования . 9 : 1094 DOI : 10,12688 / F1000RESEARCH.25413.1 . ISSN 2046-1402 . PMC 7590901 . PMID 33145007 . Викиданные Q101217428 .
- ^ Сандерсон, Кэтрин (февраль 2011 г.). «Биоинформатика: кураторское поколение» . Природа . 470 (7333): 295–296. DOI : 10.1038 / nj7333-295a . ISSN 1476-4687 . PMID 21348148 .
- ^ Аноним (30.10.2019). «Аттестат о аспирантуре по биокументации» . www.ice.cam.ac.uk . Проверено 6 октября 2020 .
- ^ Тан Я.А., Пихлер К., Фюльграбе А., Ломакс Дж., Мэлоун Дж., Муньос-Торрес М.С. и др. (Май 2019 г.). «Десять быстрых советов по биокументированию» . PLOS Вычислительная биология . 15 (5): e1006906. Bibcode : 2019PLSCB..15E6906T . DOI : 10.1371 / journal.pcbi.1006906 . PMC 6497217 . PMID 31048830 .
- ^ «UniProt: универсальная база знаний о белках» . Исследования нуклеиновых кислот . 45 (D1): D158 – D169. 2016-11-29. DOI : 10.1093 / NAR / gkw1099 . ISSN 0305-1048 .
- ^ Берман, Хелен М .; Westbrook, J .; Feng, Z .; Gilliland, G .; Бхат, штат Теннесси; Weissig, H .; Шиндялов Илья; Борн, Филипп (01.01.2000). «Банк данных о белках» . Исследования нуклеиновых кислот . 28 (1): 235–242. DOI : 10.1093 / NAR / 28.1.235 .
- ^ Чен, Цинъюй; Бритто, Рамона; Эрилл, Иван; Джеффри, Констанс Дж .; Либерзон, Артур; Магран, Микеле; Онами, Дзюн-Ичи; Робинсон-Рехави, Марк; Спонарова, Яна; Зобель, Джастин; Верспур, Карин (2020-07-08). «Вопросы качества: специалисты по биодокументации о влиянии дублирования и других проблемах качества данных в биологических базах данных» . Геномика, протеомика и биоинформатика . 18 (2): 91–103. DOI : 10.1016 / J.GPB.2018.11.006 .
- ^ "FlyBase: база данных Drosophila. Консорциум Flybase" . Исследования нуклеиновых кислот . 26 (1): 85–88. 1998-01-01. DOI : 10.1093 / NAR / 26.1.85 . ISSN 1362-4962 .
- ^ Замок, Антония; Резерфорд, Ким; Харрис, Мидори А; Хейлс, Жаклин; Оливер, Стивен Дж. Bähler, Jürg; Вуд, Валери (13.10.2018). «PomBase 2018: управляемая пользователем повторная реализация базы данных о делящихся дрожжах обеспечивает быстрый и интуитивно понятный доступ к разнообразной, взаимосвязанной информации» . Исследования нуклеиновых кислот . 47 (D1): D821 – D827. DOI : 10.1093 / NAR / gky961 . ISSN 0305-1048 .
- ^ Ружичка, Лейла; Howe, Douglas G .; Рамачандран, Шридхар; Торо, Сабрина; Слайк, Кери Э. Ван; Bradford, Yvonne M .; Орел, Энн; Фашена, Давид; Фрейзер, Кен; Калита, Патрик; Мани, Прита (1 января 2019 г.). «Информационная сеть по рыбкам данио: новая поддержка некодирующих генов, расширенные аннотации онтологий генов и Альянс геномных ресурсов» . Исследования нуклеиновых кислот . 47 (D1): D867 – D873. DOI : 10,1093 / NAR / GKY1090 .
- ^ Мэлоун Дж., Стивенс Р., Джапп С., Хэнкокс Т., Паркинсон Х., Бруксбанк С. (февраль 2016 г.). «Десять простых правил выбора биоонтологии» . PLOS Вычислительная биология . 12 (2): e1004743. Bibcode : 2016PLSCB..12E4743M . DOI : 10.1371 / journal.pcbi.1004743 . PMC 4750991 . PMID 26867217 .
- ^ Боденрейдер О. (январь 2004 г.). «Единая система медицинского языка (UMLS): интеграция биомедицинской терминологии» . Исследования нуклеиновых кислот . 32 (выпуск базы данных): D267-70. DOI : 10.1093 / NAR / gkh061 . PMC 308795 . PMID 14681409 .
- ^ Макмерри Дж. А., Джути Н., Бломберг Н., Бёрдетт Т., Конлин Т., Конте Н. и др. (Июнь 2017 г.). «Идентификаторы 21 века: как разрабатывать, предоставлять и повторно использовать постоянные идентификаторы для максимизации полезности и воздействия данных наук о жизни» . PLOS Биология . 15 (6): e2001414. DOI : 10.1371 / journal.pbio.2001414 . PMC 5490878 . PMID 28662064 .
- ^ Монс Б. (июнь 2005 г.). "Какой ген вы имели в виду?" . BMC Bioinformatics . 6 (1): 142. DOI : 10,1186 / 1471-2105-6-142 . PMC 1173089 . PMID 15941477 .
- ^ Венкатесан А., Ким Дж. Х., Тало Ф., Ид-Смит М., Гобейл Дж., Картер Дж. И др. (12.12.2016). «SciLite: платформа для отображения текстовых аннотаций в качестве средства связи научных статей с биологическими данными» . Добро пожаловать в открытое исследование . 1 : 25. DOI : 10,12688 / wellcomeopenres.10210.1 . PMC 5527546 . PMID 28948232 .
- ^ Вэй Чемпион, Аллот А, Лиман Р., Лу Зи (июль 2019 г.). «PubTator central: автоматическая аннотация концепций для биомедицинских полнотекстовых статей» . Исследования нуклеиновых кислот . 47 (W1): W587 – W593. DOI : 10.1093 / NAR / gkz389 . PMC 6602571 . PMID 31114887 .
- ^ Квон Д., Ким С., Вей СН, Лиман Р., Лу Зи (июль 2018 г.). «ezTag: тегирование биомедицинских концепций посредством интерактивного обучения» . Исследования нуклеиновых кислот . 46 (W1): W523 – W529. DOI : 10.1093 / NAR / gky428 . PMC 6030907 . PMID 29788413 .
- ^ Ландсман, Д .; Джентльмен, Р .; Kelso, J .; Фрэнсис Уэллетт, BF (05.01.2010). «БАЗА ДАННЫХ: новый форум для биологических баз данных и курирования» . База данных . 2009 (0): bap002 – bap002. DOI : 10,1093 / базы данных / bap002 . ISSN 1758-0463 .
- ^ Найтани, Сушма; Гупта, Парул; Прис, Джастин; Гарг, Приянка; Фрейзер, Валери; Padgitt-Cobb, Lillian K; Мартин, Мэтью; Вининг, Келли; Джайсвал, Панкадж (01.01.2019). «Вовлечение сообщества в процессы лечения генов и путей» . База данных . 2019 . DOI : 10,1093 / базы данных / bay146 . ISSN 1758-0463 .
- ^ а б Дениз А. Смит (18 февраля 2020 г.). Стефано Триберти (ред.). «Использование Википедии как информационного ресурса здравоохранения в различных контекстах: обзорный обзор» . PLOS ONE . 15 (2): e0228786. DOI : 10.1371 / JOURNAL.PONE.0228786 . ISSN 1932-6203 . PMC 7028268 . PMID 32069322 . Викиданные Q85632863 .
- ^ а б Арнабольди В., Рацити Д., Ван Аукен К., Чан Дж. Н., Мюллер Х. М., Штернберг П. В. (январь 2020 г.). «Интеллектуальный анализ текста соответствует курированию сообщества: недавно разработанная платформа курирования для улучшения опыта авторов и их участия в WormBase» . База данных . 2020 . DOI : 10,1093 / базы данных / baaa006 . PMC 7078066 . PMID 32185395 . S2CID 212750405 .
- ^ Ли Р.Й., Хоу К.Л., Харрис Т.В., Арнабольди В., Каин С., Чан Дж. И др. (Январь 2018). «WormBase 2017: переход в новый этап» . Исследования нуклеиновых кислот . 46 (D1): D869 – D874. DOI : 10.1093 / NAR / gkx998 . PMC 5753391 . PMID 29069413 .
- ^ Бунт С.М., Ворчание Г.Б., Филд HI, Мэриголд С.Дж., Браун Н.Х., Миллберн Г. «Прямая переписка по электронной почте с авторами недавно опубликованных статей способствует курированию сообщества» . База данных . 2012 : bas024. DOI : 10,1093 / базы данных / bas024 . PMC 3342516 . PMID 22554788 .
- ^ Антонаццо Дж., Урбано Дж. М., Мэриголд С. Дж., Миллберн Дж. Х., Браун Нью-Хэмпшир (январь 2020 г.). «Создание конвейера для получения экспертных знаний от сообщества для помощи в обобщении генов» . База данных . 2020 . DOI : 10,1093 / базы данных / baz152 . PMC 6971343 . PMID 31960022 .
- ^ Резерфорд К.М., Харрис М.А., Lock A, Оливер С.Г., Вуд V (июнь 2014 г.). «Песнь: онлайн-инструмент для изучения литературы в сообществе» . Биоинформатика . 30 (12): 1791–2. DOI : 10.1093 / биоинформатики / btu103 . PMC 4058955 . PMID 24574118 .
- ^ "помбасе / песня" . PomBase. 25 сентября 2020.
- ^ Lock A, Харрис М.А., Резерфорд К., Хейлс Дж., Вуд V (январь 2020 г.). «Сообщество курирования в PomBase: позволяет экспертам по делящимся дрожжам предоставлять подробные, стандартизованные и доступные аннотации из научных публикаций» . База данных . 2020 . DOI : 10,1093 / базы данных / baaa028 . PMC 7192550 . PMID 32353878 .
- ^ «UniProt: универсальная база знаний о белках» . Исследования нуклеиновых кислот . 45 (D1): D158 – D169. 2016-11-29. DOI : 10.1093 / NAR / gkw1099 . ISSN 0305-1048 .
- ^ Кхаре, Риту; Хорошо, Бенджамин М .; Лиман, Роберт; Вс, Андрей I .; Лу, Чжиюн (01.01.2016). «Краудсорсинг в биомедицине: проблемы и возможности» . Брифинги по биоинформатике . 17 (1): 23–32. DOI : 10,1093 / BIB / BBV021 .
- ^ а б Финн Р.Д., Гарднер П.П., Бейтман А. (январь 2012 г.). «Сделать вашу базу данных доступной через Википедию: плюсы и минусы» . Исследования нуклеиновых кислот . 40 (выпуск базы данных): D9-12. DOI : 10.1093 / NAR / gkr1195 . PMC 3245093 . PMID 22144683 .
- ^ Дай Л., Тиан М., Ву Дж, Сяо Дж, Ван Х, Таунсенд Дж. П., Чжан З. (июль 2013 г.). «Награда за авторство: усиление кураторства сообщества вики-источниками биологических знаний за счет автоматической количественной оценки авторства» . Биоинформатика . 29 (14): 1837–9. DOI : 10.1093 / биоинформатики / btt284 . PMC 3702255 . PMID 23732274 .
- ^ Zhang Z, Sang J, Ma L, Wu G, Wu H, Huang D и др. (Январь 2014). «RiceWiki: база данных на основе вики для сообщества, курирующего гены риса» . Исследования нуклеиновых кислот . 42 (Проблема с базой данных): D1222-8. DOI : 10.1093 / NAR / gkt926 . PMC 3964990 . PMID 24136999 .
- ^ «Os01g0883800 - RiceWiki» . 2017-10-20. Архивировано из оригинала на 2017-10-20 . Проверено 6 сентября 2020 .
- ^ Консорциум, CAZypedia (2017-10-11). «Десять лет CAZypedia: живая энциклопедия углеводно-активных ферментов» . Гликобиология . 28 (1): 3–8. DOI : 10.1093 / GLYCOB / CWX089 .
- ^ а б Монс Б., Эшбернер М., Чичестер С., Ван Муллиген Е., Вебер М., ден Даннен Дж. И др. (2008-05-28). «Обращение к миллиону умов для аннотации сообщества в WikiProteins» . Геномная биология . 9 (5): R89. DOI : 10.1186 / GB-2008-9-5-R89 . PMC 2441475 . PMID 18507872 .
- ^ Джайлз Дж (февраль 2007 г.). «Основные базы данных по биологии идут вики» . Природа . 445 (7129): 691. Bibcode : 2007Natur.445..691G . DOI : 10.1038 / 445691a . PMID 17301755 . S2CID 4410783 .
- ^ «WikiPathways - WikiPathways» . www.wikipathways.org . Проверено 14 октября 2020 .
- ^ Водак С.Дж., Митчен Д., Коллингс А.М., Рассел Р.Б., Борн П.Е. (2012). «Тематические страницы: вычислительная биология PLOS встречается с Википедией» . PLOS Вычислительная биология . 8 (3): e1002446. Bibcode : 2012PLSCB ... 8E2446W . DOI : 10.1371 / journal.pcbi.1002446 . PMC 3315447 . PMID 22479174 .
- ^ Страница RD (март 2011 г.). «Связывание NCBI с Википедией: подход, основанный на вики» . PLOS Currents . 3 : RRN1228. DOI : 10.1371 / currents.RRN1228 . PMC 3080707 . PMID 21516242 .
- ^ Гарднер П.П., Дауб Дж., Тейт Дж., Мур Б.Л., Осуч И.Х., Гриффитс-Джонс С. и др. (Январь 2011 г.). «Рфам: Википедия, кланы и« десятичный »выпуск» . Исследования нуклеиновых кислот . 39 (Проблема с базой данных): D141-5. DOI : 10.1093 / NAR / gkq1129 . PMC 3013711 . PMID 21062808 .
- ^ Дауб Дж., Гарднер П.П., Тейт Дж., Рамскельд Д., Манске М. , Скотт В.Г. и др. (Декабрь 2008 г.). "The RNA WikiProject: аннотации сообщества семейств РНК" . РНК . 14 (12): 2462–4. DOI : 10,1261 / rna.1200508 . PMC 2590952 . PMID 18945806 .
- ^ Буркхард К., Шнайдер Б., Ори Дж. (Октябрь 2006 г.). "Перспектива биокуратора: аннотация в Исследовательском сотрудничестве по структурной биоинформатике банка данных белков" . PLOS Вычислительная биология . 2 (10): e99. Bibcode : 2006PLSCB ... 2 ... 99B . DOI : 10.1371 / journal.pcbi.0020099 . PMC 1626146 . PMID 17069453 .
- ^ Логан Д.В., Сандал М., Гарднер П.П., Манске М. , Бейтман А. (сентябрь 2010 г.). «Десять простых правил редактирования Википедии» . PLOS Вычислительная биология . 6 (9): e1000941. Bibcode : 2010PLSCB ... 6E0941L . DOI : 10.1371 / journal.pcbi.1000941 . PMC 2947980 . PMID 20941386 .
- ^ Батлер Д. (2008). «Опубликовать в Википедии или погибнуть: журнал, требующий от авторов публикации в бесплатной онлайн-энциклопедии». Природа . DOI : 10.1038 / новости.2008.1312 .
- ^ Хасс Дж. В., Линденбаум П., Мартоне М., Робертс Д., Писарро А., Валафар Ф. и др. (Январь 2010 г.). «Джин Вики: интеллект сообщества в применении к аннотации генов человека» . Исследования нуклеиновых кислот . 38 (проблема с базой данных): D633-9. DOI : 10.1093 / NAR / gkp760 . PMC 2808918 . PMID 19755503 .
- ^ Alcock, Brian P .; Raphenya, Amogelang R .; Лау, Тэмми Т.Ю .; Цанг, Кара К .; Бушар, Меган; Эдалатманд, Арман; Huynh, Уильям; Нгуен, Анна-Лиза В .; Cheng, Annie A .; Лю, Сихан; Мин, Салли Ю. (2020-01-01). «CARD 2020: надзор за устойчивостью к антибиотикам с помощью обширной базы данных по устойчивости к антибиотикам» . Исследования нуклеиновых кислот . 48 (D1): D517 – D525. DOI : 10,1093 / NAR / GKZ935 .
- ^ Waagmeester A, Stupp G, Burgstaller-Muehlbacher S, Good BM, Griffith M, Griffith OL, et al. (Март 2020 г.). Роджерс П., Мунгалл С. (ред.). «Викиданные как граф знаний для наук о жизни» . eLife . 9 : e52614. DOI : 10.7554 / eLife.52614 . PMC 7077981 . PMID 32180547 . S2CID 212739087 .
- ^ Рутц, Адриано; Сорокина Мария; Галгонек, Якуб; Митчен, Даниэль; Виллигаген, Эгон; Грэм, Джеймс; Стефан, Ральф; Пейдж, Родерик; Вондрашек, Иржи (2021-03-01). «Открытое исследование природных продуктов: курирование и распространение биологических явлений химических структур с помощью Викиданных» . dx.doi.org . Проверено 14 апреля 2021 .
- ^ Турки, Хоусемеддин; Тайеб, Мохамед Али Хадж; Шафи, Томас; Любиана, Тьяго; Емельняк, Дариуш; Ауича, Мохамед Бен; Гайо, Хосе Эмилио Лабра; Янгстром, Эрик; Банат, Моссаб; Дас, Диптаншу; Митчен, Даниэль (18 февраля 2021 г.). Халлер, Армин (ред.). «Представление информации о COVID-19 в совместных графах знаний: случай Викиданных» . Цитировать журнал требует
|journal=
( помощь ) - ^ Ваагмистер, Андра; Willighagen, Egon L .; Вс, Андрей I .; Кутмон, Мартина; Гайо, Хосе Эмилио Лабра; Фернандес-Альварес, Даниэль; Жених, Квентин; Шаап, Питер Дж .; Верхаген, Лиза М .; Кохорст, Джаспер Дж. (22 января 2021 г.). «Протокол для добавления знаний в Викиданные: согласование ресурсов по человеческим коронавирусам» . BMC Biology . 19 (1). DOI : 10.1186 / s12915-020-00940-у . ISSN 1741-7007 .
- ^ Burgstaller-Muehlbacher S, Waagmeester A, Mitraka E, Turner J, Putman T., Leong J, et al. (2016). «Викиданные как семантическая структура для инициативы Gene Wiki» . База данных . 2016 : baw015. DOI : 10,1093 / базы данных / baw015 . PMC 4795929 . PMID 26989148 .
- ^ Виллигаген, Эгон; Мартенс, Марвин; Ясунори; Любиана, Тьяго; Нуногит; Митчен, Даниэль; Addshore (09.08.2020), egonw / SARS-CoV-2-Queries: Edition 1 , Zenodo, doi : 10.5281 / zenodo.3977414 , получено 14.04.2021
- ^ Александр Пфунднер; Тобиас Шёнберг; Джон Хорн; Ричард Д. Бойс; Матиас Самвальд (5 мая 2015 г.). «Использование системы Викиданных для улучшения качества медицинского контента в Википедии на разных языках: пилотное исследование» . Журнал медицинских интернет-исследований . 17 (5): e110. DOI : 10.2196 / JMIR.4163 . ISSN 1438-8871 . PMC 4468594 . PMID 25944105 . Викиданные Q21503276 .
- ^ Цуэн Г., Нанис С.М., Фукье Дж., Хороший Б.М., Су А.И. (31 декабря 2016 г.). "Гражданская наука для разработки биомедицинской литературы" . Гражданская наука . 1 (2): 14. DOI : 10,5334 / cstp.56 . PMC 6226017 . PMID 30416754 .
- ^ Tsueng G, Nanis M, Fouquier JT, Mayers M, Good BM, Su AI (февраль 2020 г.). «Применение гражданской науки к извлечению взаимосвязи генов, лекарств и болезней из биомедицинских резюме». Биоинформатика . 36 (4): 1226–1233. DOI : 10.1093 / биоинформатики / btz678 . PMID 31504205 .
- ^ «Играйте в Mark2Cure, помогайте определять ключевые термины в резюме биомедицинских исследований» . Гражданские научные игры . Проверено 6 сентября 2020 .
- ^ «Кокрановская толпа» . Crowd.cochrane.org . Проверено 25 сентября 2020 .
- ^ Гартленер Г., Аффенгрубер Л., Тичер В., Ноэль-Сторр А., Дули Г., Балларини Н., Кениг Ф. (май 2020 г.). «При скрининге тезисов с участием одного рецензента пропущено 13 процентов соответствующих исследований: рандомизированное контролируемое исследование на основе толпы» . Журнал клинической эпидемиологии . 121 : 20–28. DOI : 10.1016 / j.jclinepi.2020.01.005 . PMID 31972274 .
- ^ Гриффит, Малахия; Шпионы, Николай С; Крысяк, Киланнин; МакМайкл, Джошуа Ф; Коффман, Адам С; Данос, Арпад М; Ainscough, Бенджамин Дж; Рамирес, Коди А; Рике, Дамиан Т; Кужан, Линзей; Барнелл, Эрика К. (31.01.2017). «CIViC - это база знаний сообщества для экспертного краудсорсинга клинической интерпретации вариантов рака» . Генетика природы . 49 (2): 170–174. DOI : 10.1038 / ng.3774 . ISSN 1061-4036 .
- ^ «CIViC - Клиническая интерпретация вариантов рака» . civicdb.org . Проверено 14 апреля 2021 .
- ^ Хатос, Андрас; Квалья, Федерика; Пиовезан, Дамиано; Тосатто, Сильвио (2021-02-03). «APICURON: база данных для признания и признательности за работу биокураторов» . DOI : 10.1101 / 2021.02.03.429425 . Цитировать журнал требует
|journal=
( помощь ) - ^ Перча, Вифания; Альтман, Расс Б. (2018-08-01). «Глобальная сеть биомедицинских отношений, основанная на тексте» . Биоинформатика . 34 (15): 2614–2624. DOI : 10.1093 / биоинформатики / bty114 . ISSN 1367-4803 .
- ^ Hirschman L, Burns GA, Krallinger M, Arighi C, Cohen KB, Valencia A, et al. (2012). «Анализ текста для рабочего процесса биодокументации» . База данных . 2012 : bas020. DOI : 10,1093 / базы данных / bas020 . PMC 3328793 . PMID 22513129 .
- ^ Ананиаду, София; Келл, Дуглас Б.; Цудзи, Джун-ичи (декабрь 2006 г.). «Текстовый анализ и его потенциальные приложения в системной биологии» . Тенденции в биотехнологии . 24 (12): 571–579. DOI : 10.1016 / j.tibtech.2006.10.002 . ISSN 0167-7799 .
- ^ Winnenburg, R .; Wachter, T .; Plake, C .; Doms, A .; Шредер, М. (11 июля 2008 г.). «Факты из текста: может ли интеллектуальный анализ текста помочь в расширении масштабов высококачественной ручной обработки генных продуктов с помощью онтологий?» . Брифинги по биоинформатике . 9 (6): 466–478. DOI : 10.1093 / нагрудник / bbn043 . ISSN 1467-5463 . PMID 19060303 .
- ^ Перча, Вифания; Альтман, Расс (27.02.2018). «Глобальная сеть биомедицинских отношений, основанная на тексте» . Биоинформатика . 34 (15): 2614–2624. DOI : 10.1093 / Биоинформатика / BTY114 .
- ^ Роберт Лиман; Чжи-Сюань Вэй; Алексис Аллот; Чжиюн (1 июня 2020 г.). «Десять советов для статьи, готовой к интеллектуальному анализу текста: как улучшить автоматическое обнаружение и интерпретируемость». PLOS Биология . 18 (6): e3000716. DOI : 10.1371 / JOURNAL.PBIO.3000716 . ISSN 1544-9173 . PMID 32479517 . Викиданные Q96032351 .
- ^ Ван, Люси Лу; Ло, Кайл (07.12.2020). «Подходы интеллектуального анализа текста для работы с быстро растущей литературой по COVID-19» . Брифинги по биоинформатике . DOI : 10,1093 / BIB / BBAA296 .
- ^ Нойман М., Король Д., Бельтаги I, Аммар В. (2019). «ScispaCy: быстрые и надежные модели для биомедицинской обработки естественного языка» . Труды 18-го семинара BioNLP и общая задача . Флоренция, Италия: Ассоциация компьютерной лингвистики: 319–327. arXiv : 1902.07669 . DOI : 10.18653 / v1 / W19-5034 . S2CID 67788603 .
- ^ Альтман Р. Б., Бергман С. М., Блейк Дж., Блашке С., Коэн А., Ганнон Ф. и др. (2008). «Анализ текстов для биологии - путь вперед: мнения ведущих ученых» . Геномная биология . 9 Дополнение 2 (Дополнение 2): S7. DOI : 10.1186 / ГБ-2008-9-s2-s7 . PMC 2559991 . PMID 18834498 .
- ^ Хансперс, Кристина; Рютта, Андерс; Саммер-Кутмон, Мартина; Пико, Александр Р. (2020-11-09). «Информация о пути, извлеченная из цифр за 25 лет» . Геномная биология . 21 (1): 273. DOI : 10,1186 / S13059-020-02181-2 . PMC 7649569 . PMID 33168034 .
- ^ Кун, Тобиас; Ройер, Лоик; Fuchs, Norbert E .; Шредер, Майкл (01.01.2006). «Улучшение интеллектуального анализа текста с помощью контролируемого естественного языка: пример взаимодействия белков» . Конспект лекций по информатике : 66–81. DOI : 10.1007 / 11799511_7 .
- ^ Кун, Тобиас; Ройер, Лоик; Fuchs, Norbert E .; Шредер, Майкл (01.01.2006). «Улучшение интеллектуального анализа текста с помощью контролируемого естественного языка: пример взаимодействия белков» . Конспект лекций по информатике : 66–81. DOI : 10.1007 / 11799511_7 .
- ^ Сингхал, Аюш; Лиман, Роберт; Катлетт, Натали; Лембергер, Томас; Макэнтайр, Джоанна; Полсон, Шон; Ксенариос, Иоаннис; Ариги, Сесилия; Лу, Чжиюн (2016). «Актуальные потребности биомедицинского интеллектуального анализа текста в биокументации и за ее пределами: возможности и проблемы» . База данных . 2016 : baw161. DOI : 10,1093 / базы данных / baw161 . ISSN 1758-0463 .
- ^ Хиршман Л, Йе А, Блашке С, Валенсия А (2005). «Обзор BioCreAtIvE: критическая оценка извлечения информации для биологии» . BMC Bioinformatics . 6 Дополнение 1 (Дополнение 1): S1. DOI : 10,1186 / 1471-2105-6-s1-s1 . PMC 1869002 . PMID 15960821 . S2CID 5119495 .
Внешние ссылки
- Международное общество биокументации
- Биокреативный