Информатика биоизображений - это подраздел биоинформатики и вычислительной биологии . [1] Основное внимание уделяется использованию вычислительных методов для анализа биоизображений, особенно изображений клеток и молекул, в крупном масштабе и с высокой пропускной способностью. Цель состоит в том, чтобы получить полезные знания из сложных и разнородных изображений и связанных с ними метаданных .
Автоматические микроскопы могут собирать большое количество изображений с минимальным вмешательством. Это привело к взрывному росту объемов данных, который абсолютно требует автоматической обработки. Вдобавок, что удивительно, для некоторых из этих задач есть свидетельства того, что автоматизированные системы могут работать лучше, чем люди. [2] [3] Кроме того, автоматизированные системы беспристрастны, в отличие от человеческого анализа, оценка которого может (даже неосознанно) зависеть от желаемого результата.
Все большее внимание уделяется разработке новых методов обработки изображений , компьютерного зрения , интеллектуального анализа данных, баз данных и визуализации для извлечения, сравнения, поиска и управления биологическими знаниями в этих проблемах с большим объемом данных. [4] [5]
Модальности данных
Используются несколько систем и платформ сбора данных, для которых требуются разные методы для оптимальной обработки.
Флуоресцентная микроскопия
Флуоресцентная микроскопия позволяет непосредственно визуализировать молекулы на субклеточном уровне как в живых, так и в фиксированных клетках. Представляющие интерес молекулы помечены либо зеленым флуоресцентным белком (GFP), либо другим флуоресцентным белком, либо флуоресцентно меченным антителом . Регулярно используются несколько типов микроскопов: широкопольный, конфокальный или двухфотонный . Большинство систем микроскопии также поддерживает сбор временных рядов (фильмов).
Как правило, фильтры используются так, что каждый краситель отображается отдельно (например, синий фильтр используется для изображения Hoechst , а затем быстро переключается на зеленый фильтр для изображения GFP). Для потребления изображения часто отображаются в ложном цвете , показывая каждый канал другим цветом, но это может даже не быть связано с исходными используемыми длинами волн. В некоторых случаях исходное изображение могло быть получено даже в невидимых длинах волн (инфракрасное излучение является обычным явлением).
Выбор на этапе получения изображения будет влиять на анализ и часто требует специальной обработки. Конфокальные стеки потребуют 3D-обработки, а псевдо-стеки с широким полем часто выигрывают от цифровой деконволюции для удаления не в фокусе света.
Появление автоматических микроскопов, которые могут автоматически получать множество изображений, является одной из причин, почему анализ нельзя проводить на глаз (в противном случае аннотации быстро стали бы узким местом исследования). Использование автоматических микроскопов означает, что некоторые изображения могут быть не в фокусе (системы автоматического определения фокуса иногда могут работать неправильно), содержать небольшое количество клеток или быть заполненными мусором. Следовательно, полученные изображения будет труднее анализировать, чем изображения, полученные оператором, поскольку он выбрал бы другие места для изображения и правильной фокусировки. С другой стороны, оператор может внести неосознанную ошибку в свой выбор, выбрав только те клетки, фенотип которых больше всего похож на тот, который ожидался до эксперимента.
Гистология
Гистология - это приложение для микроскопии, при котором срезы тканей окрашивают и наблюдают под микроскопом (обычно это световой микроскоп, но также используется электронная микроскопия).
При использовании светового микроскопа, в отличие от флуоресцентной визуализации, изображения обычно получают с помощью стандартных цветных камер. Это частично отражает историю области, где люди часто интерпретировали изображения, но также и тот факт, что образец можно освещать белым светом и собирать весь свет, а не возбуждать флуорофоры. Когда используется более одного красителя, необходимым этапом предварительной обработки является размешивание каналов и получение оценки интенсивностей, характерных для чистого красителя.
Было показано, что субклеточное расположение окрашенных белков можно определить по гистологическим изображениям.
Если целью является медицинская диагностика, то приложения для гистологии часто попадают в сферу цифровой патологии или автоматического анализа изображений тканей , которые являются родственными областями информатики биоизображений. Часто применимы одни и те же вычислительные методы, но цели ориентированы на медицину, а не на исследования.
Важные проблемы
Анализ субклеточного местоположения
Анализ субклеточного местоположения был одной из первых проблем в этой области. В контролируемом режиме проблема состоит в том, чтобы изучить классификатор, который может распознавать изображения основных клеточных органелл на основе изображений.
Используемые методы основаны на машинном обучении , построении различительного классификатора на основе числовых характеристик, вычисленных на основе изображения. Возможности - это либо общие особенности компьютерного зрения , такие как особенности текстуры Haralick, либо особенности, специально разработанные для захвата биологических факторов (например, совместная локализация с ядерным маркером является типичным примером).
Для основной проблемы идентификации органелл можно получить очень высокие значения точности, в том числе лучше чем? полученные результаты. [2] Эти методы полезны в фундаментальных исследованиях клеточной биологии, но также были применены для открытия белков, местоположение которых изменяется в раковых клетках. [6]
Однако разделение на органеллы представляет собой ограниченную форму проблемы, поскольку многие белки будут локализоваться в нескольких местах одновременно (смешанные структуры), и можно выделить многие структуры, даже если они не являются разными мембраносвязанными компонентами. В этой области есть несколько нерешенных проблем, и исследования продолжаются.
Скрининг с высоким содержанием
Экраны с высокой пропускной способностью с использованием технологии автоматизированной визуализации (иногда называемой скринингом с высоким содержанием ) стали стандартным методом как для открытия лекарств, так и для фундаментальных биологических исследований. Используя многолуночные планшеты, робототехнику и автоматизированную микроскопию, один и тот же анализ можно очень быстро применить к большой библиотеке возможных реагентов (обычно это небольшие молекулы или РНКи ), получая тысячи изображений за короткий промежуток времени. Из-за большого объема генерируемых данных автоматический анализ изображений является необходимостью. [7]
Когда доступны положительные и отрицательные контроли, к проблеме можно подойти как к проблеме классификации, и можно применить те же методы вычисления и классификации признаков, которые используются для анализа субклеточного местоположения.
Сегментация
Сегментация клеток - важная подзадача во многих из перечисленных ниже областей (и иногда полезна сама по себе, если цель состоит только в подсчете количества клеток в анализе жизнеспособности ). Цель состоит в том, чтобы определить границы ячеек на многоклеточном изображении. Это позволяет обрабатывать каждую ячейку индивидуально для измерения параметров. В трехмерных данных сегментация должна выполняться в трехмерном пространстве.
Поскольку отображение ядерного маркера является обычным для многих изображений, широко используется протокол для сегментации ядер. Это может быть полезно само по себе, если необходимы ядерные измерения, или может послужить водоразделом, который расширяет сегментацию на все изображение.
Для изображений ячеек описаны все основные методы сегментации, от простого определения порога до методов установки уровня. Поскольку существует несколько модальностей изображения и разные типы ячеек, каждый из которых предполагает разные компромиссы, единого принятого решения для этой проблемы не существует.
Сегментация изображения клеток как важная процедура часто используется для изучения экспрессии генов, взаимоотношений колокализации и т. Д. Отдельных клеток. В таких случаях одноклеточного анализа часто необходимо однозначно определить идентичность клеток при их сегментировании. Такая задача распознавания часто является нетривиальной в вычислительном отношении. Для модельных организмов, таких как C. elegans, которые имеют четко определенные клеточные клоны, можно явно распознать идентичность клеток с помощью анализа изображений, комбинируя методы сегментации изображения и распознавания образов. [9] Одновременная сегментация и распознавание клеток [10] также было предложено как более точное решение этой проблемы, когда доступен «атлас» или другая априорная информация о клетках. Поскольку экспрессия генов при разрешении отдельных клеток может быть получена с использованием этих типов подходов к визуализации, можно комбинировать эти методы с другими методами количественной оценки экспрессии генов отдельных клеток, такими как RNAseq.
Отслеживание
Отслеживание - еще одна традиционная проблема обработки изображений, которая появляется в информатике биоизображений. Проблема в том, чтобы связать объекты, которые появляются в последующих кадрах фильма. Как и в случае с сегментацией, проблема может быть поставлена как в двумерной, так и в трехмерной форме. [11]
В случае флуоресцентной визуализации отслеживание часто должно выполняться на очень низкоконтрастных изображениях. Поскольку получение высокого контраста достигается за счет большего количества света, который повреждает образец и разрушает краситель , освещение сохраняется на минимальном уровне. Часто бывает полезно подумать о бюджете фотонов: количество фотонов, которые можно использовать для построения изображений до того, как образец будет поврежден, настолько велико, что данным больше нельзя доверять. Следовательно, если необходимо получить высококонтрастные изображения, можно использовать только несколько кадров; в то время как для длинных фильмов каждый кадр будет иметь очень низкий контраст.
Регистрация
Когда рассматриваются образцы данных изображений различной природы, например, соответствующие различным методам маркировки, различным лицам, выборкам в разные моменты времени и т. Д., Изображения часто необходимо регистрировать для лучшего сравнения. Одним из примеров является то, что при сборе данных о динамике времени изображения в последующих кадрах часто должны регистрироваться, чтобы можно было скорректировать незначительные сдвиги в положении камеры. Другим примером является то , что , когда многие образы модели животного (например , С. Элеганс или Drosophila мозг или мозг мыши ) собраны, часто возникает существенная необходимость зарегистрировать эти изображения для сравнения их образцы (например , те , соответствуют одинаковые или разные популяция нейронов, которые разделяют или различаются экспрессией генов и т. д.).
Пакеты программного обеспечения для регистрации медицинских изображений были ранней попыткой использования приложений для регистрации микроскопических изображений. Однако из-за часто гораздо большего размера файла изображения и гораздо большего количества образцов в экспериментах во многих случаях необходимо разработать новое программное обеспечение для регистрации трехмерных изображений. BrainAligner[12] - это программное обеспечение, которое использовалось для автоматизации процесса трехмерной деформируемой и нелинейной регистрации с использованием стратегии надежного сопоставления ориентиров. Он в основном использовался для создания более 50 000 стандартизированных трехмерных изображений мозга плодовых мух на ферме Janelia в HHMI, а также для других приложений, включая стрекоз и мышей.
Важные места
Консорциум ученых из университетов и научно - исследовательских институтов проводили ежегодные совещания по bioimage информатике [13] с 2005 года ISMB конференция была Визуализация биоимиджинга и данных трек с 2010 года журнал Биоинформатика также представил Bioimage информатики трек в 2012 году OpenAccess В журнале BMC Bioinformatics есть раздел, посвященный анализу биоизображений, визуализации и связанным с ними приложениям. Другие журналы по компьютерной биологии и биоинформатике также регулярно публикуют работы по информатике биоизображений. В рамках программы расходов Европейского Союза NEUBIAS (сеть европейских аналитиков по биоизображениям) с 2017 года проводятся ежегодные конференции, а также учебные школы и таггатоны для аналитиков по биоизображениям.
Программное обеспечение
Существует несколько пакетов, которые делают методы информатики биоизображений доступными через графический пользовательский интерфейс, например ImageJ , FIJI , CellProfiler или Icy . Платформы визуализации и анализа, такие как Vaa3D , появились в последние годы и использовались как в крупномасштабных проектах, особенно в нейробиологии, так и в настольных приложениях.
Другие исследователи разрабатывают свои собственные методы, обычно на основе языка программирования с хорошей поддержкой компьютерного зрения, такого как Python , C ++ или MATLAB . Библиотека Mahotas для Python - один из популярных примеров. Тем не менее, существуют примеры разработанных исследователем методов на языках программирования с меньшей поддержкой компьютерного зрения, чем существует R (например, trackdem [14] ).
Смотрите также
- Наложение фокуса Техника объединения нескольких изображений с разным фокусным расстоянием в одно.
- Скрининг с высоким содержанием
- цифровая патология
- Медицинская визуализация
Внешние ссылки
- Vaa3D: высокопроизводительная визуализация и анализ многомерных изображений
- Биоформаты Механизм ввода-вывода файлов изображений, поддерживающий десятки форматов
Рекомендации
- ^ Пэн, H; Бейтман А; Валенсия А; Рен JD (2012). «Биоизображение информатики: новая категория в биоинформатике» . Биоинформатика . 28 (8): 1057. DOI : 10,1093 / биоинформатики / bts111 . PMC 3324521 . PMID 22399678 .
- ^ а б Мерфи, Роберт; Веллисте, М .; Поррека, Г. (2003). «Надежные числовые функции для описания и классификации паттернов субклеточного расположения на изображениях флуоресцентного микроскопа». Журнал обработки сигналов СБИС . 35 (3): 311–321. CiteSeerX 10.1.1.186.9521 . DOI : 10.1023 / B: vlsi.0000003028.71666.44 . S2CID 8134907 .
- ^ Натткемпер, Тим; Торстен Твеллманн; Хельге Риттер; Вальтер Шуберт (2003). «Человек против машины: оценка флуоресцентных микрофотографий». Компьютеры в биологии и медицине . 33 (1): 31–43. CiteSeerX 10.1.1.324.4664 . DOI : 10.1016 / S0010-4825 (02) 00060-4 . PMID 12485628 .
- ^ Пэн Х (сентябрь 2008 г.). «Биоизображение информатики: новое направление инженерной биологии» . Биоинформатика . 24 (17): 1827–36. DOI : 10.1093 / биоинформатики / btn346 . PMC 2519164 . PMID 18603566 .
- ^ «В поисках количественной микроскопии» . Природные методы . 9 (7): 627. 2012. DOI : 10.1038 / nmeth.2102 . PMID 22930824 .
- ^ Слава, Эстель; Джастин Ньюберг; Роберт Ф. Мерфи (2008). «Автоматическое сравнение паттернов субклеточного расположения белков между изображениями нормальных и злокачественных тканей». Биомедицинская визуализация: от нано к макро, 2008. ISBI 2008. 5-й международный симпозиум IEEE по .
- ^ Шариф, Абид; Джошуа Кангас; Луис Педро Коэльо; Шеннон Куинн; Роберт Ф. Мерфи (2010). «Автоматический анализ изображений для просмотра и анализа высокого содержания» . Журнал биомолекулярного скрининга . 15 (7): 726–734. DOI : 10.1177 / 1087057110370894 . PMID 20488979 .
- ^ Коэльо, Луис Педро; Абид Шариф; Роберт Ф. Мерфи (2009). «Ядерная сегментация в изображениях клеток микроскопа: сегментированный вручную набор данных и сравнение алгоритмов». Биомедицинская визуализация: от нано к макро, 2009. ISBI'09. Международный симпозиум IEEE по. IEEE . DOI : 10.1109 / ISBI.2009.5193098 . PMC 2901896 .
- ^ Лонг, Фухуэй; Peng, H .; Лю, X .; Kim, S .; Майерс, EW (сентябрь 2009 г.). «Цифровой трехмерный атлас C. elegans и его применение для анализа отдельных клеток» . Природные методы . 6 (9): 667–672. DOI : 10.1038 / nmeth.1366 . PMC 2882208 . PMID 19684595 .
- ^ Цюй, Лей; Long, F .; Лю, X .; Kim, S .; Майерс, EW; Пэн, Х. (2011). «Одновременное распознавание и сегментация клеток: применение в C. elegans» . Биоинформатика . 27 (20): 2895–2902. DOI : 10.1093 / биоинформатики / btr480 . PMC 3187651 . PMID 21849395 .
- ^ Дюфур, Александр; Василий Шинин; Шахрагим Таджбахш; Нэнси Гильен-Агион; JC. Оливо-Марин; Кристоф Циммер (2005). «Сегментирование и отслеживание флуоресцентных клеток в динамической трехмерной микроскопии со связанными активными поверхностями» (PDF) . Обработка изображений, Транзакции IEEE на 14, вып. 9 . С. 1396–1410. DOI : 10.1109 / TIP.2005.852790 . Архивировано из оригинального (PDF) на 2014-03-02..
- ^ Пэн, Ханьчуань; Chung, P .; Long, F .; Qu, L .; Jenett, A .; Семена, А .; Майерс, EW; Симпсон, JH (2011). "BrainAligner: 3D-атласы регистрации мозга дрозофилы" . Природные методы . 8 (6): 493–498. DOI : 10.1038 / nmeth.1602 . PMC 3104101 . PMID 21532582 .
- ^ «Ежегодное собрание биоизображений информатики» .
- ^ Бруйнинг, Марджолейн; Visser, Marco D .; Hallmann, Caspar A .; Йонгеянс, Элке; Голдинг, Ник (2018). «trackdem: автоматическое отслеживание частиц для получения подсчета населения и распределения размеров из видео в r» . Методы экологии и эволюции . 9 (4): 965–973. DOI : 10.1111 / 2041-210X.12975 . ISSN 2041-210X .