Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
панголин логотип

Филогенетическое присвоение названных глобальных линий вспышек (панголин) - это программный инструмент, разработанный сотрудниками лаборатории Рамбо, а соответствующее веб-приложение разработано Центром надзора за геномными патогенами в Южном Кембриджшире . [1] Его цель - реализовать динамическую номенклатуру линий передачи SARS-CoV-2, известную как номенклатура Pango. [2] Это позволяет пользователю отнести образец SARS-CoV-2 (вируса, вызывающего COVID-19 ) к линии Pango , сравнивая последовательность генома образца с другими последовательностями генома, [3]и назначает наиболее вероятную линию происхождения (линия Pango) запросным последовательностям SARS-CoV-2 . [ требуется дальнейшее объяснение ]

Как описано в Andrew Rambaut et al. (2020), [2] линия Pango описывается как кластер последовательностей, связанных с эпидемиологическим событием, например, заносом вируса в определенную географическую область с признаками дальнейшего распространения. Линии созданы для того, чтобы уловить зарождающийся край пандемии, и имеют высокое разрешение, подходящее для геномного эпидемиологического надзора и расследования вспышек.

Описание [ править ]

Обозначение происхождения [ править ]

В отличие от инструмента панголина, линии передачи панго регулярно подбираются вручную в соответствии с текущим глобально распространенным разнообразием. Большое филогенетическое дерево строится на основе выравнивания, содержащего общедоступные геномы SARS-CoV-2, и подкластеры последовательностей в этом дереве проверяются вручную и сравниваются с эпидемиологической информацией для обозначения новых линий; они могут быть назначены производителями данных, а предложения по происхождению могут быть отправлены в базу данных. [ требуется разъяснение ] [4]

Модельное обучение [ править ]

Эти вручную отобранные обозначения клонов и связанные с ними последовательности генома являются входными данными для обучения модели машинного обучения. Эта модель, как обучение, так и задание, получила название «pangoLEARN». Текущая версия pangoLEARN использует дерево классификации, основанное на реализации scikit learn [5] классификатора дерева решений.

Присвоение происхождения [ править ]

Первоначально панголин использовал алгоритм назначения на основе максимального правдоподобия, чтобы присвоить запросу SARS-CoV-2 наиболее вероятную последовательность происхождения. Однако с июля 2020 года он использует алгоритм присвоения на основе машинного обучения pangoLEARN для присвоения клонов новым геномам SARS-CoV-2. Этот подход является быстрым и позволяет определить 10 000 геномов SARS-CoV-2 за 10 минут. [ необходима цитата ]

Доступность [ править ]

pangolin доступен в виде инструмента на основе командной строки , который можно загрузить с Conda и из репозитория github [6], а также в виде веб-приложения [7] с графическим пользовательским интерфейсом с возможностью перетаскивания. Веб-приложение Pangolin присвоило более 512000 уникальных последовательностей SARS-CoV-2 по состоянию на январь 2021 года.

Разработчики [ править ]

панголин был создан Айн О'Тул и лабораторией Рамбо 5 апреля 2020 года. Основными разработчиками панголина являются Айн О'Тул и Эмили Шер; многие другие внесли свой вклад в различные аспекты инструмента, в том числе Бен Джексон, Дж. Т. МакКрон, Верити Хилл и Рэйчел Колкухун из лаборатории Рамбо. [3]

Веб-приложение о панголинах было разработано Центром по надзору за геномными патогенами [7], а именно Энтони Андервуд, Бен Тейлор, Корин Йейтс, Хали Абу-Дахаб и Дэвид Аненсен. [3]

Он широко использовался во время пандемии COVID-19 . [2] [8] [9]

См. Также [ править ]

  • Варианты SARS-CoV-2
  • Ящер

Ссылки [ править ]

  1. ^ «Эпидемиология COVID-19 в реальном времени» . www.pathogensurveillance.net . Проверено 22 января 2021 года .
  2. ^ a b c Rambaut, A .; Холмс, ЕС; О'Тул, Б .; и другие. (2020). «Предложение по динамической номенклатуре для линий SARS-CoV-2 в помощь геномной эпидемиологии» . Природная микробиология . 5 (11): 1403–1407. DOI : 10.1038 / s41564-020-0770-5 . PMID 32669681 . S2CID 220544096 .  
  3. ^ a b c «Релиз веб-приложения Pangolin» . virological.org . Май 2020 . Проверено 18 февраля 2021 года .
  4. ^ "pangoLEARN Магазин обученной модели для доступа к панголину" . GitHub: cov-lineages / pangoLEARN . Проверено 13 февраля 2021 года .
  5. ^ "sklearn.tree.DecisionTreeClassifier" . scikit-learn.org . Проверено 13 февраля 2021 года .
  6. ^ "Ков-род / панголин" . GitHub: cov-lineages / pangolin . Проверено 13 февраля 2021 года .
  7. ^ a b «Панголин, назначивший происхождение COVID-19» . pangolin.cog-uk.io . Проверено 13 февраля 2021 года .
  8. ^ Пайпс, Ленор; Ван, Хунжу; Huelsenbeck, John P; Нильсен, Расмус (9 декабря 2020 г.). Малик, Хармит (ред.). «Оценка неопределенности в укоренении филогении SARS-CoV-2» . Молекулярная биология и эволюция . Издательство Оксфордского университета (ОУП). DOI : 10.1093 / molbev / msaa316 . ISSN 0737-4038 . 
  9. ^ Джейкоб, Джобин Джон; Васудеван, Картик; Прагасам, Агила Кумари; Гунасекаран, Картик; Канг, Гагандип; Вирарагхаван, Баладжи; Мутрежа, Анкур (22 декабря 2020 г.). «Эволюционное отслеживание генетических вариантов SARS-CoV-2 подчеркивает сложный баланс стабилизирующих и дестабилизирующих мутаций» . bioRxiv 10.1101 / 2020.12.22.423920 . Филогенетическое присвоение названной глобальной вспышки LINeages (панголин) был наиболее широко используемым инструментом для определения происхождения вновь появляющихся вариантов. 

Внешние ссылки [ править ]

  • программное обеспечение с открытым исходным кодом pangolin на GitHub.com
  • веб приложение
  • cov-lineages.org