Система управления рабочими процессами биоинформатики - это специализированная форма системы управления рабочими процессами, разработанная специально для составления и выполнения серии этапов вычислений или обработки данных или рабочего процесса , которые относятся к биоинформатике .
В настоящее время существует множество различных систем рабочего процесса. Некоторые из них были разработаны в более общем плане как системы научных рабочих процессов для использования учеными из самых разных дисциплин, таких как астрономия и науки о Земле . Все такие системы основаны на абстрактном представлении того, как выполняются вычисления, в форме ориентированного графа, где каждый узел представляет задачу, которая должна быть выполнена, а ребра представляют собой либо поток данных, либо зависимости выполнения между различными задачами. Каждая система обычно предоставляет визуальный интерфейс, позволяющий пользователю создавать и изменять сложные приложения с минимальными знаниями программирования или без них. [1] [2] [3]
Примеры
В алфавитном порядке некоторые примеры систем управления рабочим процессом биоинформатики включают:
- Anduril биоинформатика и анализ изображений [4] [5]
- BioBIKE : веб-программируемая интегрированная база биологических знаний [6]
- CLC bio , платформа для биоинформатического анализа и управления рабочими процессами от QIAGEN Digital Insights .
- Cuneiform : функциональный язык рабочего процесса для крупномасштабного анализа данных [7]
- Discovery Net : один из первых примеров системы научного документооборота, позже коммерциализированный как InforSense, который затем был приобретен IDBS. [ необходима цитата ]
- Галактика : изначально нацелена на геномику [8]
- GenePattern : мощная система научного рабочего процесса, которая обеспечивает доступ к сотням инструментов геномного анализа. [9]
- KNIME Констанц Информационный шахтер [10]
- OnlineHPC Конструктор рабочего процесса онлайн на основе Taverna [ необходима ссылка ]
- UGENE предоставляет систему управления рабочим процессом, которая устанавливается на локальном компьютере [11]
- VisTrails [12]
Сравнение систем рабочего процесса
При большом количестве систем рабочего процесса биоинформатики на выбор [13] становится трудно понять и сравнить особенности различных систем рабочего процесса. Было проведено мало работы по оценке и сравнению систем с точки зрения биоинформатиков, особенно когда дело доходит до сравнения типов данных, с которыми они могут иметь дело, встроенных функций, которые предоставляются пользователю, или даже их производительности или удобства использования. Примеры существующих сравнений включают:
- В статье «Научные системы рабочих процессов - может ли один размер подойти всем?» [3] представлена высокоуровневая структура для сравнения систем рабочих процессов на основе их потоков управления и свойств потока данных. Сравниваемые системы включают Discovery Net , Taverna , Triana, Kepler, а также Yawl и BPEL .
- Документ «Мета-рабочие процессы: взаимодействие на основе шаблонов между Galaxy и Taverna» [14], в котором приводится более ориентированное на пользователя сравнение между Taverna и Galaxy в контексте обеспечения взаимодействия между обеими системами.
- Бумажная инфраструктура «Обеспечение инфраструктуры ИКТ биомедицинских исследований» [15] сравнивает две системы документооборота, Anduril и Chipster, [16] с точки зрения требований к инфраструктуре в модели облачной доставки.
- В статье «Обзор биоинформатических структур конвейера» [17] делается попытка классифицировать системы управления рабочими процессами по трем параметрам: «использование неявного или явного синтаксиса, использование конфигурации, соглашения или парадигмы проектирования на основе классов и предложение командной строки или рабочей среды». интерфейс".
Рекомендации
- ^ Oinn, T .; Greenwood, M .; Аддис, М .; Альпдемир, Миннесота; Феррис, Дж .; Glover, K .; Гобл, К .; Годерис, А .; Hull, D .; Marvin, D .; Li, P .; Лорд, П .; Покок, MR; Сенгер, М .; Stevens, R .; Wipat, A .; Рое, К. (2006). «Таверна: уроки создания рабочей среды для наук о жизни» (PDF) . Параллелизм и вычисления: практика и опыт . 18 (10): 1067–1100. DOI : 10.1002 / cpe.993 . S2CID 10219281 .
- ^ Yu, J .; Буя, Р. (2005). «Таксономия научных систем документооборота для грид-вычислений». ACM SIGMOD Запись . 34 (3): 44. CiteSeerX 10.1.1.63.3176 . DOI : 10.1145 / 1084805.1084814 . S2CID 538714 .
- ^ а б Curcin, V .; Ганем, М. (2008). Системы научного документооборота - может ли всех подойти один размер? . 2008 Каирская международная конференция по биомедицинской инженерии . С. 1–9. DOI : 10,1109 / CIBEC.2008.4786077 . ISBN 978-1-4244-2694-2. S2CID 1885579 .
- ^ «Сайт Anduril Workflow» .
- ^ Оваска, Кристиан; Лааксо, Марко; Хаапа-Паананен, Сайджа; Лоухимо, Рику; Чен, Пинг; Айттомяки, Вильями; Вало, Эркка; Нуньес-Фонтарнау, Хавьер; Рантанен, Вилле (07.09.2010). «Фреймворк для крупномасштабной интеграции данных обеспечивает полное представление о мультиформной глиобластоме» . Геномная медицина . 2 (9): 65. DOI : 10,1186 / gm186 . ISSN 1756-994X . PMC 3092116 . PMID 20822536 .
- ^ Elhai, J .; Taton, A .; Massar, J .; Майерс, Дж. К.; Трэверс, М .; Кейси, Дж .; Слупески, М .; Шрагер, Дж. (2009). «BioBIKE: веб-программируемая интегрированная база биологических знаний» . Исследования нуклеиновых кислот . 37 (выпуск веб-сервера): W28 – W32. DOI : 10.1093 / NAR / gkp354 . PMC 2703918 . PMID 19433511 .
- ^ Брандт, Йорген; Bux, Marc N .; Лезер, Ульф (2015). «Клинопись: функциональный язык для крупномасштабного анализа научных данных» (PDF) . Материалы семинаров EDBT / ICDT . 1330 : 17–26.
- ^ Goecks, J .; Некрутенко, А .; Taylor, J .; Команда Галактики, Т. (2010). «Galaxy: комплексный подход к поддержке доступных, воспроизводимых и прозрачных вычислительных исследований в науках о жизни» . Геномная биология . 11 (8): R86. DOI : 10.1186 / ГБ-2010-11-8-r86 . PMC 2945788 . PMID 20738864 .
- ^ Райх, Майкл; и другие. (2006). «GenePattern 2.0». Генетика природы . 38 (1): 500–5001. DOI : 10.1038 / ng0506-500 . PMID 16642009 . S2CID 5503897 .
- ^ Тивари, Абхишек; Сехар, Арвинд К.Т. (2007). «Основа рабочего процесса для информатики наук о жизни». Вычислительная биология и химия . 31 (5–6): 305–319. DOI : 10.1016 / j.compbiolchem.2007.08.009 . PMID 17931570 .
- ^ Оконечников, К; Голосова, О; Фурсов, М; Угене, Команда (2012). «Unipro UGENE: Единый инструментарий биоинформатики» . Биоинформатика . 28 (8): 1166–7. DOI : 10.1093 / биоинформатики / bts091 . PMID 22368248 .
- ^ Bavoil, L .; Каллахан, ИП; Кроссно, П.Дж.; Freire, J .; Шайдеггер, CE; Сильва, Коннектикут; Во, HT (2005). VisTrails: возможность интерактивной визуализации с несколькими представлениями . VIS 05. Визуализация IEEE, 2005 . С. 135–142. DOI : 10.1109 / VISUAL.2005.1532788 . ISBN 978-0-7803-9462-9.
- ^ «Существующие системы документооборота» . Вики-сайт Common Workflow Language . Архивировано 17 октября 2019 года . Проверено 17 октября 2019 .
- ^ Abouelhoda, M .; Alaa, S .; Ганем, М. (2010). «Мета-рабочие процессы». Труды 1-го международного семинара по рабочим процессам в новой науке, ориентированной на данные - Wands '10 . п. 1. дои : 10,1145 / 1833398,1833400 . ISBN 9781450301886. S2CID 17343728 .
- ^ Nyrönen, TH; Laitinen, J; и другие. (2012), Обеспечение инфраструктуры ИКТ для биомедицинских исследований , Труды WICSA / ECSA 2012 Companion Том (WICSA / ECSA '12), ACM, стр 37-44,. Дои : 10,1145 / 2361999,2362006 , ISBN 9781450315685, S2CID 18199745
- ^ Каллио, Массачусетс; Tuimala, JT; Хуппонен, Т; Klemelä, P; Gentile, M; Шейнин, I; Коски, М; Каки, Дж; Корпелайнен, Э.И. (2011). «Chipster: удобное программное обеспечение для анализа микрочипов и других данных с высокой пропускной способностью» . BMC Genomics . 12 : 507. DOI : 10.1186 / 1471-2164-12-507 . PMC 3215701 . PMID 21999641 .
- ^ Лейпциг J (2016). «Обзор биоинформатических структур конвейера» . Брифинги по биоинформатике . 18 (3): 530–536. DOI : 10.1093 / нагрудник / bbw020 . PMC 5429012 . PMID 27013646 .