Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Базы данных Кембриджа Структурные ( ЦД ) является одновременно хранилищем и проверены и Куратор ресурс для трехмерных структурных данных молекул , как правило , содержащих по крайней мере углерода и водорода , содержащего широкий спектр органических , металлоорганических и металлоорганических молекул. Конкретные записи дополняют другие кристаллографические базы данных, такие как Банк данных по белкам (PDB), База данных неорганических кристаллических структур и Международный центр дифракционных данных . Данные, обычно получаемыеРентгеновская кристаллография, реже электронная дифракция или дифракция нейтронов и представленная кристаллографами и химиками со всего мира, находится в свободном доступе (как депонировано авторами) в Интернете через веб-сайт головной организации CSD (CCDC, Repository [1]) ). CSD курирует некоммерческая зарегистрированная компания под названием Cambridge Crystallographic Data Center , CCDC.

Внутри штаб-квартиры CCDC Кембридж, Великобритания

CSD - это широко используемое хранилище низкомолекулярных органических и металлоорганических кристаллических структур для ученых. Структуры, депонированные в Кембриджском центре структурных данных (CCDC), общедоступны для загрузки в момент публикации или с согласия депонента. Они также обогащены с научной точки зрения и включены в базу данных, используемую программным обеспечением, предлагаемым центром. Целевые подмножества CSD также находятся в свободном доступе для поддержки обучения и других мероприятий. [2]

История [ править ]

CCDC вырос из деятельности кристаллографии группы во главе с Ольга Кеннарда СОК FRS в департаменте органической, неорганической и теоретической химии Кембриджского университета . С 1965 года группа начала собирать опубликованные библиографические, химические данные и данные о кристаллической структуре для всех малых молекул, изученных с помощью дифракции рентгеновских лучей или нейтронов . В связи с быстрым развитием вычислительной техники , происходящим в то время, эта коллекция была закодирована в электронной форме и стала известна как Кембриджская структурная база данных (CSD).

CSD была одной из первых числовых научных баз данных, которая начала свою работу в любой точке мира, и получила академические гранты от Управления научной и технической информации Великобритании, а затем от Совета по науке и инженерным исследованиям Великобритании . Эти средства, вместе с субсидиями от национальных дочерних центров, позволили разработать CSD и связанное с ним программное обеспечение в 1970-х и 1980-х годах. Первые выпуски системы CSD в США, Италии и Японии произошли в начале 1970-х годов. К началу 1980-х годов система CSD распространялась более чем в 30 странах. По состоянию на 2014 год система CSD была распространена среди ученых в 70 странах.

В течение 1980-х годов интерес к системе CSD со стороны фармацевтических и агрохимических компаний значительно возрос. Это привело к созданию Кембриджского центра кристаллографических данных (CCDC) в качестве независимой компании в 1987 году с юридическим статусом некоммерческой благотворительной организации, а ее деятельность контролируется международным советом управляющих. CCDC переехал в специально построенное помещение на территории химического факультета университета в 1992 году.

Кеннард ушел с поста директора в 1997 году, и его сменили Дэвид Хартли (1997–2002) и Фрэнк Аллен (2002–2008). Колин Грум был назначен исполнительным директором с 1 октября 2008 года [3] по сентябрь 2017 года. [4] И совсем недавно Юрген Хартер был назначен генеральным директором в июне 2018 года [5].

Программные продукты CCDC разнообразны для использования кристаллографических данных в приложениях в науках о жизни и кристаллографии. Большая часть этой разработки программного обеспечения и маркетинга осуществляется CCDC Software Limited (основанной в 1998 году), дочерней компанией, находящейся в полной собственности, которая передает всю свою прибыль CCDC.

Хотя CCDC является самоуправляемой организацией, она поддерживает тесные связи с Кембриджским университетом и является университетским партнерским учреждением, которое имеет право готовить аспирантов для получения более высоких степеней (PhD, MPhil).

CCDC открыла американские приложения и поддерживала операции в США в октябре 2013 года [6] [7], первоначально в Рутгерсе, Государственном университете Нью-Джерси , где она находится в одном месте с RCSB Protein Data Bank.

Содержание [ править ]

В CSD добавлена ​​миллионная структура, идентификатор CSD: XOPCAJ

CSD обновляется примерно 50 000 новых структур каждый год [8], а также с улучшениями существующих записей. Записи (структуры) в репозитории публикуются в открытом доступе, как только соответствующая запись появляется в рецензируемой научной литературе. Между тем, данные также могут быть депонированы и опубликованы непосредственно через CSD без сопроводительной научной статьи, так как это известно как сообщение CSD .

Периодически публикуются общие статистические данные о размахе активов ЦДЦБ, например отчет за январь 2014 года. [9] По состоянию на январь 2019 года сводная статистика выглядит следующим образом: [10]

По состоянию на январь 2019 г. в топ-25 научных журналов по публикации структур в репозитории CSD входили: [11]

1. В Неорге зарегистрировано 73 070 структур . Chem.
2. 62 072 структуры описаны в Dalton & J. Chem. Soc., Dalton Trans.
3. 54 160 структур были зарегистрированы в Organometallics.
4. 48 967 структур описаны в J. Am. Chem. Soc.
5. В Acta Crystallogr было сообщено о 42 422 структурах . Разд. E
6. 32610 структуры были представлены в Chem. Евро. Дж.
7. В J. Organomet описано 29 790 структур . Chem.
8. В Angew было зарегистрировано 29 640 структур . Chem. Int. Эд.
9. В Неорге зарегистрировано 28 682 строения . Чим. Acta
10. 28351 структуры были представлены в Chem. Commun. И J. Chem. Soc.
11. В CSD Communications было зарегистрировано 27 328 структур.
12. В Acta Crystallogr было зарегистрировано 26 774 структуры . Разд. C
13. 26734 структуры были представлены в многогранника
14. 24 045 структур были зарегистрированы в евро. J. Inorg. Chem.
15. 23483 структуры были представлены в J. Org. Chem.
16. 22286 структуры были представлены в Cryst. Рост Des.
17. В CrystEngComm было сообщено о 22 011 структурах.
18. В Organic Letters было сообщено о 15 985 структурах.
19. В З. Анорге зарегистрировано 15 424 строения. Allg. Chem.
20. В Acta Crystallogr было сообщено о 14 864 структурах . Разд. B
21. 13 909 структур были зарегистрированы в Tetrahedron 8 597 структур были зарегистрированы как частное сообщение в ЦД
22. 12734 структуры описаны в J. Mol. Struct.
23. 11 234 структуры были описаны в Tetrahedron Lett.
24. О 9 150 строениях было сообщено в евро. J. Org. Chem.
25. В New Journal of Chemistry было сообщено о 8789 структурах.


На эти 25 журналов приходится 704 541 из 996 193 или 70,7% структур ЦД.

Эти данные показывают, что большинство структур определяется дифракцией рентгеновских лучей, при этом менее 1% структур определяется дифракцией нейтронов или порошковой дифракцией . Количество безошибочных координат было принято как процент структур, для которых трехмерные координаты присутствуют в CSD.

Важность файлов структурных факторов, упомянутых выше, заключается в том, что для структур CSD, определенных с помощью дифракции рентгеновских лучей, которые имеют файл структуры, кристаллограф может проверить интерпретацию наблюдаемых измерений.


Тенденция роста [ править ]

Исторически, количество структур в CSD росло примерно экспоненциально, преодолевая рубеж в 25000 структур в 1977 году, рубеж в 50000 структур в 1983 году, этап в 125000 структур в 1992 году, этап в 250000 структур в 2001 году, этап в 500000 структур в 2009, [12] [13] [14] и отметка в 1 миллион структур 8 июня 2019 года. [15] Одна миллионная структура, добавленная к CSD, - это кристаллическая структура 1- (7,9-диацетил-11-метил- 6H-азепино [1,2-a] индол-6-ил) пропан-2-он.

Тенденция роста структуры в центральном депозитарии с 1965 по 2018 год [11]

Примечание: данные за 1923-1964 годы собраны вместе в последней строке таблицы.

Формат файла [ править ]

3D-печатная модель бензойной кислоты, взятая из определения кристаллической структуры, созданная с использованием координат из Кембриджской структурной базы данных и с помощью программы CCDC Mercury . На верхней модели изображена одна молекула бензойной кислоты. Нижняя модель показывает димер с водородной связью.

Основным форматом файла для осаждения структуры CSD, принятым примерно в 1991 году, является формат «Файл кристаллографической информации» , CIF. [16]

Депонированные файлы CSD можно скачать в формате CIF. Проверенные и проверенные файлы CSD можно экспортировать в широкий спектр форматов, включая CIF, MOL, Mol2, PDB, SHELX и XMol, с помощью инструментов системы CSD.

CCDC использует две различные коды для различения между осажденным набором данными и Curated записью КУР. Например, одно конкретное « сообщение CSD » органической молекулы было депонировано в CCDC, и ему был присвоен номер депонирования «CCDC-991327». Это обеспечивает свободный публичный доступ к депонированным данным. Из депонированных данных извлекается выбранная информация для подготовки проверенной и тщательно подобранной записи CSD, которой был присвоен рефкод «MITGUT». Как часть процесса курирования, CCDC также применяет алгоритм DeCIFer, чтобы помочь редакторам назначать химический состав структурам, когда эти представления (например, типы облигаций, назначение зарядов и т. Д.) Отсутствуют в исходных представленных файлах CIF. [17] Проверенная и тщательно отобранная запись включена в дистрибутивы CSD System и WebCSD, причем доступность ограничена теми, кто вносит соответствующий вклад.

Просмотр данных [ редактировать ]

3D-модель структуры 1-метил-2,3,4,5-тетракис ((триметилсилил) этинил) -1H-пиррола. Идентификатор CSD: XURZAN

Каждый набор данных в CSD можно открыто просматривать и извлекать с помощью бесплатной службы структуры доступа . С помощью этой службы на основе веб-браузера пользователи могут просматривать набор данных в 2D и 3D, получать некоторую базовую информацию о структуре и загружать депонированный набор данных. Более продвинутые функции поиска и тщательно подобранная информация доступны через систему CSD на основе подписки .

Помимо использования системы CSD , файлы структуры можно просматривать с помощью одной из нескольких компьютерных программ с открытым исходным кодом, таких как Jmol . Некоторая другая свободной, но не с открытой исходным кодом программа включает MDL Chime , PyMOL , UC Химеру , Rasmol , WINGX, [18] CCDC предоставляет бесплатную версию своей визуализации программы Mercury .

Начиная с 2015 года Mercury от CCDC также предоставляет функциональные возможности для создания готового файла для 3D-печати из структур в CSD. [19]

См. Также [ править ]

  • Кристаллографическая база данных
  • Меркурий
  • Белковая структура

Ссылки [ править ]

  1. ^ «Форма запроса депозита CCDC CIF» . Кембриджский центр структурных данных . Проверено 16 сентября 2014 .
  2. ^ "Домашняя страница CCDC" . Кембриджский центр структурных данных . Проверено 16 сентября 2014 .
  3. Перейти ↑ Groom C, Allen F (июль 2009 г.). «Ухоженный CCDC: интервью с Колином Грумом, исполнительным директором Кембриджского центра кристаллографических данных, и Фрэнком Алленом, почетным научным сотрудником». Журнал компьютерного молекулярного дизайна . 23 (7): 391–4. Bibcode : 2009JCAMD..23..391W . DOI : 10.1007 / s10822-009-9272-5 . PMID 19421719 . 
  4. ^ «Объявление председателя от имени попечителей» . Кембриджский центр структурных данных . 11 сентября 2017 года . Проверено 15 мая 2019 .
  5. ^ «CCDC приветствует Юргена Хартера в качестве генерального директора» . Кембриджский центр структурных данных (CCDC) . 11 июня 2018 . Проверено 15 мая 2019 .
  6. ^ «CCDC открывает операции в США» . Кембриджский центр структурных данных (CCDC) . 30 октября 2013 . Проверено 15 мая 2019 .
  7. ^ «Кембриджский центр кристаллографических данных устанавливает операции в США в рамках нового партнерства с Центром исследований интегративной протеомики Рутгерса» . Управление исследований и экономического развития Рутгерса . Проверено 15 мая 2019 года .
  8. Bruno IJ, Groom CR (октябрь 2014 г.). «Кристаллографическая перспектива обмена данными и знаниями» . Журнал компьютерного молекулярного дизайна . 28 (10): 1015–22. Bibcode : 2014JCAMD..28.1015B . DOI : 10.1007 / s10822-014-9780-9 . PMC 4196029 . PMID 25091065 .  
  9. ^ «Записи CSD: сводная статистика» (PDF) . Кембриджский центр структурных данных. Архивировано из оригинального (PDF) 11 июня 2014 года . Проверено 16 сентября 2014 .
  10. ^ «Записи CSD: сводная статистика» (PDF) . Кембриджская структурная база данных . 1 января 2019 . Проверено 15 мая 2019 года .
  11. ^ a b «Статистика журнала CSD» (PDF) . Кембриджская структурная база данных . 1 января 2019 . Проверено 16 мая 2019 года .
  12. ^ Groom CR, Аллен FH (январь 2014). «Кембриджская структурная база данных в ретроспективе и перспективах». Angewandte Chemie . 53 (3): 662–71. DOI : 10.1002 / anie.201306438 . PMID 24382699 . 
  13. ^ «Рост Кембриджской структурной базы данных (CSD) с 1970 года» . CCDC . Проверено 16 сентября 2014 .
  14. ^ «Статистика CSD» . Кембриджский центр структурных данных (CCDC) . Проверено 17 мая 2019 .
  15. ^ Робинсон, Филипп; Холка, Нил; Пинк, Крис; Валслер, Бен. «Кембриджская база данных по конструкциям насчитывает один миллион структур» . Мир химии . Проверено 7 июня 2019 .
  16. Перейти ↑ Hall SR, Allen FH, Brown ID (1991). «Файл кристаллографической информации (CIF): новый стандартный архивный файл для кристаллографии» . Acta Crystallographica . A47 (6): 655–685. DOI : 10.1107 / S010876739101067X . Архивировано из оригинала на 2006-11-27 . Проверено 17 сентября 2014 .
  17. Bruno IJ, Groom CR (октябрь 2014 г.). «Кристаллографическая перспектива обмена данными и знаниями» . Журнал компьютерного молекулярного дизайна . 28 (10): 1015–22. Bibcode : 2014JCAMD..28.1015B . DOI : 10.1007 / s10822-014-9780-9 . PMC 4196029 . PMID 25091065 .  
  18. ^ Farrugia LJ (1 августа 1999). «Пакет WinGX для кристаллографии малых молекул монокристаллов». Журнал прикладной кристаллографии . 32 (4): 837–838. DOI : 10.1107 / S0021889899006020 .
  19. ^ "3D-печать: просто как 1, 2, 3!" . Кембриджский центр структурных данных (CCDC) . 19 августа 2015 года . Проверено 18 мая 2019 .

Внешние ссылки [ править ]

  • Кембриджский центр структурных данных (CCDC) - родительский сайт CSD