GenoCAD - один из первых инструментов компьютерного проектирования для синтетической биологии . [1] Программное обеспечение является инструментом биоинформатики разработан и поддерживается GenoFAB, Inc. . GenoCAD облегчает разработку векторов экспрессии белков, искусственных генных сетей и других генетических конструкций для генной инженерии и основан на теории формальных языков . [2] GenoCAD можно использовать онлайн, зайдя на клиентский портал GenoFAB по адресу https://genofab.com/.
Первый выпуск | 30 августа 2007 г. |
---|---|
Стабильный выпуск | 2.3.1 / 11 января 2014 г . |
Репозиторий | |
Написано в | PHP JavaScript C ++ MySQL |
Тип | Биоинформатика автоматизированного проектирования |
Лицензия | Apache v2.0 |
Веб-сайт | genocad |
История
GenoCAD возник как ответвление попытки формализовать функциональные ограничения генетических конструкций с использованием теории формальных языков . В 2007 году сайт genocad.org (сейчас на пенсии) была создана в качестве доказательства концепции исследователями в Вирджинии Биоинформатика института , Virginia Tech . Используя веб-сайт, пользователи могли создавать гены, многократно заменяя генетические конструкции высокого уровня генетическими конструкциями более низкого уровня и, в конечном итоге, реальными последовательностями ДНК . [2]
31 августа 2009 года Национальный научный фонд предоставил три года $ 1421725 грант доктор Жан Пекку, доцент в а биоинформатике институте Вирджинии в Вирджинии , для разработки GenoCAD. [3] GenoCAD был и продолжает разрабатываться GenoFAB, Inc. , компания , основанного Пекком ( в настоящее время ЦС и исполняющих обязанности генеральным директором ), который также был один из авторов исследования инициирующего. [2]
Исходный код GenoCAD был первоначально выпущен на Sourceforge в декабре 2009 года. [4]
GenoCAD версии 2.0 был выпущен в ноябре 2011 года и включал возможность моделирования поведения разработанного генетического кода. Эта функция стала результатом сотрудничества с командой COPASI . [5]
В апреле 2015 года Пеккоуд и его коллеги опубликовали библиотеку биологических компонентов под названием GenoLIB [6], которую можно включить в платформу GenoCAD. [7]
Цели
Четыре цели проекта заключаются в разработке: [8]
- компьютерный язык для представления структуры синтетических молекул ДНК, используемых в клетках E.coli , дрожжей , мышей и Arabidopsis thaliana.
- компилятор, способный переводить последовательности ДНК в математические модели для предсказания закодированного фенотипа
- среда совместного рабочего процесса, которая позволяет обмениваться деталями, проектами, производственными ресурсами
- означает передачу результатов сообществу пользователей через внешний консультативный совет, ежегодную конференцию пользователей и работу с отраслью.
Функции
Основные функции GenoCAD можно разделить на три основные категории. [9]
- Управление генетическими последовательностями : цель этой группы функций - помочь пользователям идентифицировать в больших коллекциях генетических частей части, необходимые для проекта, и организовать их в библиотеках для конкретных проектов.
- Генетические части : части имеют уникальный идентификатор, имя и более общее описание. У них также есть последовательность ДНК . Части связаны с грамматикой и относятся к категории частей, такой как промоутер , ген и т. Д.
- Библиотеки деталей : Коллекции деталей организованы в библиотеки. В некоторых случаях библиотеки деталей соответствуют деталям, импортированным из одного источника, например из другой базы данных последовательностей . В других случаях библиотеки соответствуют частям, используемым для конкретного дизайн-проекта. Детали можно перемещать из одной библиотеки в другую через область временного хранения, называемую тележкой (аналог тележки для покупок в электронной коммерции).
- Поиск деталей : пользователи могут выполнять поиск в базе данных деталей с помощью поисковой системы Lucene . Доступны базовый и расширенный режимы поиска. Пользователи могут разрабатывать сложные запросы и сохранять их для повторного использования в будущем.
- Импорт / экспорт частей : части можно импортировать и экспортировать по отдельности или как целые библиотеки с использованием стандартных форматов файлов (например, GenBank , с разделителями табуляцией , FASTA , SBML ).
- Объединение последовательностей в генетические конструкции : цель этой группы функций - упростить процесс объединения генетических частей в конструкции, соответствующие определенной стратегии проектирования.
- Инструмент проектирования "наведи и щелкни" : этот мастер помогает пользователю принять ряд проектных решений, которые определяют структуру проекта и выбор частей, включенных в проект.
- Управление дизайном : дизайны могут быть сохранены в рабочей области пользователя . Статусы проектов регулярно обновляются, чтобы предупреждать пользователей о последствиях редактирования деталей для ранее сохраненных проектов.
- Экспорт дизайнов : дизайны можно экспортировать с использованием стандартных форматов файлов (например, GenBank , с разделителями табуляцией , FASTA ).
- Безопасность дизайна : дизайн защищен от некоторых типов ошибок, заставляя пользователя следовать соответствующей стратегии дизайна.
- Моделирование : последовательности, разработанные в GenoCAD, могут быть смоделированы для отображения химической продукции в полученной ячейке. [10]
- Рабочее пространство пользователя : пользователи могут персонализировать свое рабочее пространство , добавляя детали в базу данных GenoCAD, создавая специализированные библиотеки, соответствующие конкретным проектным проектам, и сохраняя дизайны на разных этапах разработки.
Теоретическая основа
GenoCAD основан на теории формальных языков ; в частности, правила проектирования, описывающие, как комбинировать различные виды частей и формировать контекстно-свободные грамматики . [2]
Грамматика без контекста может быть определена с помощью ее терминалов, переменных, начальной переменной и правил подстановки. [11] В GenoCAD терминалами грамматики являются последовательности ДНК, которые выполняют конкретную биологическую функцию (например, промотор ). Переменные менее однородны: они могут представлять более длинные последовательности, которые выполняют несколько функций, или могут представлять участок ДНК, который может содержать одну или несколько различных последовательностей ДНК, но выполнять ту же функцию (например, переменная представляет собой набор промоторов). GenoCAD включает встроенные правила замены для обеспечения биологической жизнеспособности последовательности ДНК. Пользователи также могут определять свои собственные наборы правил для других целей.
Создание последовательности ДНК в GenoCAD во многом похоже на создание производной в контекстно-свободной грамматике. Пользователь начинает с начальной переменной и многократно выбирает переменную и замену для нее, пока не останутся только терминалы. [2]
Альтернативы
Наиболее распространенными альтернативами GenoCAD являются Proto, GEC и EuGene [12].
Инструмент | Преимущества | Недостатки |
---|---|---|
GEC |
|
|
EuGene |
|
|
Прото |
|
|
Рекомендации
- ^ а б Бил, Джейкоб; Филлипс, Эндрю; Денсмор, Дуглас; Цай, Ижи (2011). «Языки программирования высокого уровня для биомолекулярных систем». В Кеппле, Хайнце; Денсмор, Дуглас; Сетти, Джанлука; ди Бернардо, Марио (ред.). Дизайн и анализ биомолекулярных цепей . Нью-Йорк Дордрехт Гейдельберг Лондон: Спрингер. п. 241. DOI : 10.1007 / 978-1-4419-6766-4 . ISBN 978-1-4419-6765-7.
- ^ а б в г д Cai Y; Хартнетт Б; Gustafsson C; Пекко Дж (2007). «Синтаксическая модель для разработки и проверки синтетических генетических конструкций, полученных из стандартных биологических частей» . Биоинформатика . 23 (20): 2760–7. DOI : 10.1093 / биоинформатики / btm446 . PMID 17804435 .
- ^ Джоди Льюис (14 сентября 2009 г.). «Национальный научный фонд выделяет 1,4 миллиона долларов на разработку GenoCAD» . Архивировано из оригинала на 11 июня 2015 года . Проверено 7 октября 2013 года .
- ^ «Код GenoCAD» . Sourceforge . Проверено 8 октября 2013 года .
- ^ Уилсон, Мэнди. «Примечания к выпуску GenoCAD» . Peccoud Lab . Архивировано из оригинального 13 октября 2013 года . Проверено 8 октября 2013 года .
- ^ Адамес, Нил; Уилсон, Мэнди; Клык, банда; Люкс, Мэтью; Глик, Бенджамин; Пекко, Жан (29 апреля 2016 г.). «GenoLIB: база данных биологических частей, полученных из библиотеки общих характеристик плазмид» . Исследования нуклеиновых кислот . 43 (10): 4823–32. DOI : 10.1093 / NAR / gkv272 . PMC 4446419 . PMID 25925571 .
- ^ Адамес Н., Уилсон М., Фанг G, Люкс М., Глик Б., Пеккоуд Дж. (2015). «GenoLIB: база данных биологических частей, полученных из библиотеки общих характеристик плазмид» . Исследования нуклеиновых кислот . 43 (10): 4823–32. DOI : 10.1093 / NAR / gkv272 . PMC 4446419 . PMID 25925571 .
- ^ Жан Пекко (21 июня 2013 г.). «GenoCAD: компьютерный дизайн синтетической ДНК» . Архивировано из оригинала 7 июля 2013 года . Проверено 7 октября 2013 года .
- ^ Wilson ML; Hertzberg R; Адам Л; Peccoud J (2011). «Пошаговое введение в основанный на правилах дизайн синтетических генетических конструкций с использованием GenoCAD». Методы Энзимол . Методы в энзимологии. 498 : 173–88. DOI : 10.1016 / B978-0-12-385120-8.00008-5 . ISBN 9780123851208. PMID 21601678 .
- ^ Cai, Y .; Люкс, МВт; Adam, L .; Пекко, Дж. (2009). Сауро, Герберт М. (ред.). «Моделирование структурно-функциональных отношений в синтетических последовательностях ДНК с использованием грамматик атрибутов» . Вычислительная биология PLoS . 5 (10): e1000529. Bibcode : 2009PLSCB ... 5E0529C . DOI : 10.1371 / journal.pcbi.1000529 . PMC 2748682 . PMID 19816554 .
- ^ Сипсер, Майкл (2013). Введение в теорию вычислений, третье издание . Бостон, Массачусетс, США: Cengage Learning. п. 104. ISBN 978-1-133-18779-0.
- ^ Б с д е е г ч Habibi, N., Мохда хашим, SZ, Родригес, CA, & Samian, MR (2013 г. ). Обзор САПР, языков и моделей данных для синтетической биологии. Jurnal Teknologi, 63 (1).
- Перейти ↑ Pedersen, M. (2010). Модульные языки для систем и синтетической биологии.
Внешние ссылки
- GenoCAD.com
- Страница проекта на SourceForge
- Учебники и часто задаваемые вопросы
- Peccoud Lab