Kepler - это система бесплатного программного обеспечения для разработки, выполнения, повторного использования, развития, архивирования и обмена научными рабочими процессами . [2] [3] [4] Средства Kepler обеспечивают мониторинг процессов и данных, информацию о происхождении и высокоскоростное перемещение данных. Рабочие процессы в целом и научные рабочие процессы в частности представляют собой ориентированные графы, в которых узлы представляют дискретные вычислительные компоненты, а края представляют собой пути, по которым данные и результаты могут перемещаться между компонентами. [5]В Kepler узлы называются «Актерами», а ребра - «каналами». Kepler включает графический пользовательский интерфейс для создания рабочих процессов в среде рабочего стола, механизм выполнения для выполнения рабочих процессов в графическом интерфейсе пользователя и независимо от командной строки, а также опцию распределенных вычислений, которая позволяет распределять задачи рабочего процесса между вычислительными узлами в компьютерном кластере. или вычислительная сетка . Система Kepler в основном нацелена на использование метафоры рабочего процесса для организации вычислительных задач, направленных на конкретные цели научного анализа и моделирования. Таким образом, научные рабочие процессы Кеплера обычно моделируют поток данных от одного шага к другому в серии вычислений, которые достигают некоторой научной цели.
Стабильный выпуск | 2.5 / 2015-10-28 [1] |
---|---|
Репозиторий | |
Написано в | Ява |
Операционная система | Linux , Mac OS X , Windows |
Тип | Система научного документооборота |
Лицензия | Лицензия BSD |
Веб-сайт | kepler-project.org |
Научный рабочий процесс
Научный рабочий процесс - это процесс объединения данных и процессов в настраиваемый структурированный набор шагов, которые реализуют полуавтоматические вычислительные решения научной проблемы. Системы научного документооборота часто предоставляют графические пользовательские интерфейсы для объединения различных технологий с эффективными методами их использования и, таким образом, повышают эффективность ученых.
Доступ к научным данным
Kepler обеспечивает прямой доступ к научным данным, которые были заархивированы во многих широко используемых архивах данных. Например, Kepler обеспечивает доступ к данным, хранящимся на сервере Metacat Сети знаний о биокомплексности (KNB) [6] и описанным с использованием языка экологических метаданных . Дополнительные поддерживаемые источники данных включают данные, доступные с использованием протокола DiGIR, протокола OPeNDAP, GridFTP, JDBC , SRB и других.
Модели вычислений
Kepler отличается от многих других систем управления рабочим процессом биоинформатики тем, что он отделяет структуру модели рабочего процесса от модели вычислений, так что различные модели для вычисления рабочего процесса могут быть привязаны к данному графу рабочего процесса. Кеплер унаследовал несколько общих моделей вычислений от системы Птолемея , включая синхронный поток данных (SDF), непрерывное время (CT), технологическую сеть (PN) и динамический поток данных (DDF), среди других.
Иерархические рабочие процессы
Kepler поддерживает иерархию в рабочих процессах, что позволяет составлять сложные задачи из более простых компонентов. Эта функция позволяет авторам рабочих процессов создавать многократно используемые модульные компоненты, которые можно сохранять для использования во многих различных рабочих процессах.
Семантика рабочего процесса
Kepler предоставляет модель семантической аннотации компонентов рабочего процесса с использованием терминов, взятых из онтологии . Эти аннотации поддерживают множество дополнительных функций, включая улучшенные возможности поиска, автоматическую проверку рабочего процесса и улучшенное редактирование рабочего процесса. [7]
Совместное использование рабочих процессов
Компоненты Kepler могут использоваться совместно путем экспорта рабочего процесса или компонента в файл архива Kepler (KAR), который является расширением формата файла JAR из Java. После создания файла KAR его можно отправить коллегам по электронной почте, опубликовать на веб-сайтах или загрузить в репозиторий компонентов Kepler. Репозиторий компонентов - это централизованная система для обмена рабочими процессами Kepler, доступная как через веб-портал, так и через интерфейс веб-службы . Пользователи могут напрямую искать и использовать компоненты из репозитория из графического интерфейса рабочего процесса Kepler.
Происхождение
Провенанс - это критически важное понятие в научных рабочих процессах, поскольку оно позволяет ученым понять происхождение их результатов, повторить свои эксперименты и подтвердить процессы, которые использовались для получения продуктов данных. [8] Для воспроизведения рабочего процесса должна быть записана информация о происхождении, которая указывает, откуда были получены данные, как они были изменены, а также какие компоненты и какие настройки параметров использовались. Это позволит другим ученым повторно провести эксперимент, подтвердив результаты. [9] В современных системах существует небольшая поддержка, позволяющая конечным пользователям запрашивать информацию о происхождении научно значимыми способами, в частности, когда расширенные модели выполнения рабочих процессов выходят за рамки простых DAG (как в технологических сетях). [10]
История Кеплера
Проект Kepler был создан в 2002 году участниками проекта «Научная среда для экологических знаний» (SEEK) [4] и проекта «Управление научными данными» (SDM). Проект был основан исследователями в Национальном центре экологического анализа и синтеза (NCEAS) в Университете Калифорнии, Санта - Барбара и Сан - Диего суперкомпьютерного центра в Университете Калифорнии, Сан - Диего . Kepler расширяет Ptolemy II, программную систему для моделирования, симуляции и проектирования параллельных встроенных систем реального времени, разработанную в Калифорнийском университете в Беркли. Сотрудничество над Kepler быстро росло, поскольку представители различных научных дисциплин осознали преимущества научных рабочих процессов для анализа и моделирования и начали вносить свой вклад в систему. По состоянию на 2008 год сотрудники Кеплера представляют многие научные дисциплины, включая экологию, молекулярную биологию, генетику, физику, химию, природоохранную науку, океанографию, гидрологию, библиотечное дело, информатику и другие. Kepler - это механизм оркестровки рабочих процессов, который используется для упрощения рабочих процессов в форме актера.
Смотрите также
Рекомендации
- ^ https://kepler-project.org/users/whats-new/kepler-2.5-released
- ^ Ludäscher Б., Altintas И., Berkley С., Higgins Д., Jaeger-Франк Э., Джонс М., Ли Э., Tao J., Zhao Y. 2006. Научный Workflow Management и система Kepler. Специальный выпуск: Рабочий процесс в грид-системах. Параллелизм и вычисления: практика и опыт 18 (10): 1039-1065.
- ^ Altintas I, Berkley C, E Jaeger, Джонс М, Ludäscher B, Mock С. 2004. Kepler: Extensible система для проектирования и выполнения научных Workflows. Proceedings of the Future of Grid Data Environments, Global Grid Forum 10.
- ^ a b Миченер, Уильям К., Джеймс Х. Бич, Мэтью Б. Джонс, Бертрам Людашер, Дина Д. Пеннингтон, Рикардо С. Перейра, Аркот Раджасекар и Марк Шильдхауэр. 2007. «Среда знаний для биоразнообразия и экологических наук», Журнал интеллектуальных информационных систем, 29 (1): 111-126. DOI : 10.1007 / s10844-006-0034-8
- ^ Тейлор, Эй Джей; Дилман, Э .; Гэннон, ДБ; Шилдс, М. (ред.), «Рабочие процессы для электронной науки: научные рабочие процессы для гридов», 530 стр., Springer. ISBN 978-1-84628-519-6 .
- ^ Джонс, Мэтью Б., К. Беркли, Дж. Божилова, М. Шильдхауэр. 2001. Управление научными метаданными. IEEE Internet Computing 5 (5): 59-68.
- ↑ Беркли, Чад, Шон Бауэрс, Мэтью Б. Джонс, Бертрам Людашер, Марк Шильдхауэр, Цзин Тао. 2005. Включение семантики в создание научных рабочих процессов. 17-я Международная конференция по управлению научными и статистическими базами данных. Компьютерное общество IEEE.
- ^ http://twiki.ipaw.info/bin/view/Challenge/WebHome
- ^ http://www.adambarker.org/papers/ppam08.pdf
- ^ Шон Бауэрс, Тимоти Макфиллипс, Бертрам Людашер, Ширли Коэн, Сьюзан Б. Дэвидсон 2006. Модель ориентированного на пользователя происхождения данных в конвейерных научных рабочих процессах.
Внешние ссылки
- Сайт проекта Кеплер
- Репозиторий компонентов Kepler
- Сайт проекта Птолемея II
- Сеть знаний по биокомплексности (KNB) Архив данных
- Список программных инструментов [ постоянная мертвая ссылка ], связанных с рабочими процессами на веб-сайте DataONE