Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Алгоритм генерации SMILES для ципрофлоксацина : прерывание циклов, затем запись в виде ответвлений от основной магистрали

Упрощено молекулярно-система ввод линейного входа ( УСМЕТЕТСЯ ) представляет собой спецификацию в виде строки обозначения для описания структуры химических соединений с использованием короткого ASCII строк . Строки SMILES могут быть импортированы большинством редакторов молекул для преобразования обратно в двухмерные рисунки или трехмерные модели молекул.

Первоначальная спецификация SMILES была начата в 1980-х годах. С тех пор он был изменен и расширен. В 2007 году в химическом сообществе с открытым исходным кодом был разработан открытый стандарт под названием OpenSMILES. Другие линейные обозначения включают обозначение строки Висвессера (WLN), ROSDAL и обозначение строки SYBYL (SLN).

История [ править ]

Первоначальная спецификация SMILES была инициирована Дэвидом Вейнингером из лаборатории отдела экологии Среднего континента USEPA в Дулуте в 1980-х годах. [1] [2] [3] [4] За участие в ранней разработке были признаны «Гилман Вейт и Роуз Руссо (USEPA), а также Альберт Лео и Корвин Хэнш (Колледж Помона) за поддержку работы, а также Артур Вейнингер (Помона. ; Daylight CIS) и Джереми Скофилд (Cedar River Software, Рентон, Вашингтон) за помощь в программировании системы ». [5] Агентство по охране окружающей среды профинансировало первоначальный проект по разработке улыбок. [6] [7]

С тех пор он был изменен и расширен другими, в первую очередь Daylight Chemical Information Systems . В 2007 году химическое сообщество с открытым исходным кодом Blue Obelisk разработало открытый стандарт под названием «OpenSMILES» . Другие «линейные» обозначения включают обозначение линии Висвессера (WLN), ROSDAL и SLN (Tripos Inc).

В июле 2006 года IUPAC представил InChI в качестве стандарта для представления формул. Преимущество SMILES в том, что он немного более удобочитаем, чем InChI; он также имеет широкую базу программного обеспечения с обширной теоретической поддержкой (например, теорией графов ).

Терминология [ править ]

Термин SMILES относится к строковой нотации для кодирования молекулярных структур, и конкретные экземпляры должны строго называться строками SMILES. Однако термин SMILES также обычно используется для обозначения как одной строки SMILES, так и нескольких строк SMILES; точное значение обычно очевидно из контекста. Термины «канонический» и «изомерный» могут привести к некоторой путанице при применении к SMILES. Эти термины описывают различные атрибуты строк SMILES и не исключают друг друга.

Как правило, для молекулы может быть записано несколько равноправных строк SMILES. Так , например, CCO, OCCи C(O)Cвсе они определяют структуру этанола . Были разработаны алгоритмы для генерации одной и той же строки SMILES для данной молекулы; из множества возможных строк эти алгоритмы выбирают только одну из них. Эти УЛЫБКИ уникальны для каждой структуры, хотя и зависят от алгоритма канонизации , используемого для их генерации, и называются каноническими УЛЫБКАМИ. Эти алгоритмы сначала преобразуют УЛЫБКИ во внутреннее представление молекулярной структуры; Затем алгоритм исследует эту структуру и создает уникальную строку SMILES. Были разработаны различные алгоритмы генерации канонических улыбок, в том числе алгоритмыПереход на информационные системы химической , OpenEye Scientific Software , MEDIT , Chemical Computing Group , Molsoft ООО , и Кит развития химии . Обычное применение канонических SMILES - индексирование и обеспечение уникальности молекул в базе данных .

В исходной статье, описывающей алгоритм CANGEN [2] , утверждалось, что он генерирует уникальные строки SMILES для графов, представляющих молекулы, но этот алгоритм не работает в ряде простых случаев (например, кунеан , 1,2-дициклопропилэтан) и не может считаться правильным методом для каноническое представление графа. [8] В настоящее время не существует систематического сравнения коммерческого программного обеспечения для проверки наличия таких недостатков в этих пакетах.

Обозначение SMILES позволяет задавать конфигурацию в тетраэдрических центрах и геометрию двойной связи. Это структурные особенности, которые не могут быть определены одной связностью, и поэтому УЛЫБКИ, которые кодируют эту информацию, называются изомерными УЛЫБКАМИ. Примечательной особенностью этих правил является то, что они допускают строгое частичное определение хиральности. Термин изомерные SMILES также применяется к SMILES, в которых указаны изомеры .

Графическое определение [ править ]

С точки зрения вычислительной процедуры графа на основе УСМЕДЕТСЯ является строка , полученный путем печати символов узлов , с которыми сталкиваются в глубину первых обхода дерева в виде химического графа . Сначала химический граф обрезается, чтобы удалить атомы водорода, а циклы разбиваются, чтобы превратить его в остовное дерево . Если циклы были прерваны, добавляются числовые метки суффикса для обозначения подключенных узлов. Круглые скобки используются для обозначения точек ветвления на дереве.

Полученная форма SMILES зависит от выбора:

  • облигаций, выбранных для разрыва цикла,
  • начального атома, используемого для обхода в глубину, и
  • порядка, в котором перечислены ветви при обнаружении.

Определение УЛЫБКИ как строки контекстно-свободного языка [ править ]

С точки зрения теории формального языка SMILES - это слово. SMILES можно разобрать с помощью контекстно-независимого парсера. Использование этого представления было в предсказании биохимических свойств (включая токсичность и способность к биологическому разложению) на основе основного принципа химиоинформатики, заключающегося в том, что подобные молекулы обладают схожими свойствами. В прогностических моделях реализован подход к распознаванию синтаксических образов (который включал определение молекулярного расстояния) [9], а также более надежная схема, основанная на статистическом распознавании образов. [10]

Описание [ править ]

Атомы [ править ]

Атомы представлены стандартным сокращением химических элементов в квадратных скобках, например, [Au]для золота . Скобки могут быть опущены в общем случае атомов, которые:

  1. находятся в «органическом подмножестве» B , C , N , O , P , S , F , Cl , Br или I , и
  2. не имеют формального обвинения , и
  3. имеют количество присоединенных атомов водорода, подразумеваемое моделью валентности SMILES (обычно их нормальная валентность, но для N и P это 3 или 5, а для S это 2, 4 или 6), и
  4. нормальные изотопы , и
  5. не являются хиральными центрами.

Все остальные элементы должны быть заключены в скобки, а заряды и атомы водорода должны быть указаны явно. Например, УЛЫБКИ для воды могут быть записаны как Oили [OH2]. Водород также можно записать как отдельный атом; вода также может быть записана как [H]O[H].

Когда используются скобки, Hдобавляется символ, если атом в скобках связан с одним или несколькими атомами водорода, за которым следует количество атомов водорода, если оно больше 1, затем знак +для положительного заряда или -для отрицательного заряда. Например, [NH4+]для аммония ( NH+
4
). Если есть более одного заряда, это обычно записывается цифрой; однако, также можно повторить знак столько раз , сколько ион имеет заряды: один может написать либо [Ti+4]или [Ti++++]для титана (IV) Ti 4+ . Таким образом, гидроксид - анион ( ОН - ) представлен , в гидроксония катиона ( Н[OH-]
3
О+
) представляет собой, [OH3+]а катион кобальта (III) (Co 3+ ) представляет собой или .[Co+3][Co+++]

Облигации [ править ]

Облигация представлена ​​одним из символов . - = # $ : / \.

Связи между алифатическими атомами считаются одинарными, если не указано иное, и подразумеваются смежностью в строке SMILES. Хотя одинарные связи можно записать как -, обычно это опускается. Например, УЛЫБКИ для этанола могут быть записаны как C-C-O, CC-Oили C-CO, но обычно пишутся CCO.

Двойной, тройной и четверной облигации представлены символами =, #и , $соответственно , как показано на SMILES O=C=O( двуокиси углерода CO
2
), C#N( цианистый водород HCN) и [Ga+]$[As-]( арсенид галлия ).

Дополнительным типом связи является «не связка», обозначенная значком ., чтобы указать, что две части не связаны друг с другом. Например, водный раствор хлорида натрия можно записать так, [Na+].[Cl-]чтобы показать диссоциацию.

Ароматическая «полуторная» связь может быть обозначена :; см. § Ароматичность ниже.

Одинарные связи, смежные с двойными связями, могут быть представлены с использованием /или \для обозначения стереохимической конфигурации; см. § Стереохимию ниже.

Кольца [ править ]

Кольцевые структуры записываются путем разрыва каждого кольца в произвольной точке (хотя некоторые варианты приведут к более разборчивым улыбкам, чем другие), чтобы создать ациклическую структуру и добавить числовые метки замыкания кольца, чтобы показать связь между несмежными атомами.

Например, циклогексан и диоксан могут быть записаны как C1CCCCC1и O1CCOCC1соответственно. Для второго кольца метка будет 2. Например, декалин (декагидронафталин) может быть записан как C1CCCC2C1CCCC2.

SMILES не требует, чтобы номера звонков использовались в каком-либо конкретном порядке, и разрешает номер звонка ноль, хотя это редко используется. Кроме того, разрешено повторно использовать номера звонков после закрытия первого звонка, хотя обычно это затрудняет чтение формул. Например, бициклогексил обычно записывается как C1CCCCC1C2CCCCC2, но также может записываться как C0CCCCC0C0CCCCC0.

Несколько цифр после одного атома указывают на множественные связи, замыкающие кольцо. Например, альтернативное обозначение SMILES для декалина таково C1CCCC2CCCCC12, где последний углерод участвует в обеих замыкающих кольцо связях 1 и 2. Если требуются двузначные номера кольца, метке предшествует %, так C%12же как и одиночная замыкающая кольцо связь кольцо 12.

Одной или обеим цифрам может предшествовать тип связи, чтобы указать тип связи, замыкающей кольцо. Например, циклопропно обычно записываются C1=CC1, но если двойная связь выбрана в качестве кольца закрытия связи, она может быть записана в виде C=1CC1, C1CC=1или C=1CC=1. (Первая форма является предпочтительной.) C=1CC-1Является недопустимой, поскольку она явно определяет конфликтующие типы для связи, замыкающей кольцо.

Связи, замыкающие кольцо, не могут использоваться для обозначения множественных связей. Например, C1C1не является допустимой альтернатива C=Cдля этилена . Однако их можно использовать с не связями; C1.C2.C12это своеобразный, но легальный альтернативный способ записи пропана , чаще пишущий CCC.

Выбор точки разрыва кольца рядом с присоединенными группами может привести к упрощению формы УЛЫБКИ за счет исключения ветвей. Например, циклогексан-1,2-диол проще всего записать как OC1CCCCC1O; выбор другого места разрыва кольца приводит к разветвленной структуре, которая требует записи в круглые скобки.

Ароматичность [ править ]

Ароматические кольца, такие как бензол, могут быть записаны в одной из трех форм:

  1. В форме Кекуле с чередованием одинарных и двойных связей, например C1=CC=CC=C1,
  2. Использование символа ароматической связи :, например C1:C:C:C:C:C1, или
  3. Чаще всего, путем записи составной B, атомов C, N, O, P и S в нижнем регистре форм b, c, n, o, pи s, соответственно.

В последнем случае предполагается, что связи между двумя ароматическими атомами (если не показаны явно) являются ароматическими связями. Таким образом, бензол , пиридин и фуран могут быть представлены соответственно улыбками c1ccccc1, n1ccccc1и o1cccc1.

Ароматический азот, связанный с водородом, который содержится в пирроле, должен быть представлен как [nH]; таким образом, имидазол записывается в обозначениях SMILES как n1c[nH]cc1.

Когда ароматические атомы по отдельности соединены друг с другом, например, в бифениле , одинарные св зите должны быть показаны в явном виде: c1ccccc1-c2ccccc2. Это один из немногих случаев, когда -требуется символ одинарной облигации . (Фактически, большинство программ SMILES может правильно сделать вывод, что связь между двумя кольцами не может быть ароматической, и поэтому примет нестандартную форму c1ccccc1c2ccccc2.)

Алгоритмы Daylight и OpenEye для генерации канонических улыбок различаются обработкой ароматичности.

Визуализация 3-цианоанизола как COc(c1)cccc1C#N.

Ветвление [ править ]

В скобках указаны ответвления, как CCC(=O)Oдля пропионовой кислоты, так и FC(F)Fдля фтороформа . Первый атом в скобках и первый атом после заключенной в скобки группы связаны с одним и тем же атомом точки ветвления. Символ облигации должен находиться в круглых скобках; снаружи (например:) CCC=(O)Oнедействителен.

Замещенные кольца могут быть записаны с точкой разветвления в кольце, как показано УЛЫБКАМИ COc(c1)cccc1C#N( см. Изображение ) и COc(cc1)ccc1C#N( см. Изображение ), которые кодируют изомеры 3 и 4-цианоанизола. Написание SMILES вместо замененных колец может сделать их более удобочитаемыми.

Ветви можно писать в любом порядке. Например, bromochlorodifluoromethane может быть записана в виде FC(Br)(Cl)F, BrC(F)(F)Cl, C(F)(Cl)(F)Brили тому подобное. Как правило, форму SMILES легче всего читать, если первой идет более простая ветвь, а последняя часть без скобок является наиболее сложной. Единственные предостережения в отношении таких перестановок:

  • Если номера звонков используются повторно, они объединяются в пары в соответствии с их порядком появления в строке SMILES. Для сохранения правильного сопряжения могут потребоваться некоторые настройки.
  • Если стереохимия указана, необходимо внести корректировки; см. Стереохимию § Примечания ниже.

Единственная форма разветвления, которая не требует скобок, - это связи, замыкающие кольцо. Правильный выбор связей, замыкающих кольцо, может уменьшить количество требуемых скобок. Например, толуол обычно пишется как Cc1ccccc1или c1ccccc1C, избегая скобок, необходимых, если пишется как c1cc(C)ccc1или c1cc(ccc1)C.

Стереохимия [ править ]

транс -1,2-дифторэтилен

SMILES разрешает, но не требует спецификации стереоизомеров .

Конфигурация вокруг двойных связей указывается с помощью символов /и \для отображения направленных одинарных связей, смежных с двойной связью. Например, F/C=C/F( см изображения ) является одним представлением транса - 1,2-дифторэтилен , в которых атомы фтора находятся на противоположных сторонах двойной связи (как показаны на рисунке), в то время как F/C=C\F( см изображения ) является одним из возможного представления цис- 1,2-дифторэтилен, в котором фтор находится на одной стороне двойной связи.

Символы направления облигации всегда входят в группы не менее двух, первая из которых является произвольной. То есть F\C=C\Fто же самое, что и F/C=C/F. Когда присутствуют чередующиеся одинарные-двойные связи, группы больше двух, причем средние символы направления находятся рядом с двумя двойными связями. Например, записывается общепринятая форма (2,4) -гексадиена C/C=C/C=C/C.

Бета-каротин с выделенными одиннадцатью двойными связями.

В качестве более сложного примера, бета-каротин имеет очень длинную основу из чередующихся одинарных и двойных связей, которые можно записать CC1CCC/C(C)=C1/C=C/C(C)=C/C=C/C(C)=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C2=C(C)/CCCC2(C)C.

Конфигурация тетраэдрического углерода указывается с помощью @или @@. Рассмотрим четыре связи в том порядке, в котором они появляются, слева направо в форме УЛЫБКИ. Если смотреть на центральный углерод с точки зрения первой связи, остальные три расположены либо по часовой стрелке, либо против часовой стрелки. Эти случаи обозначены значками @@и @соответственно (поскольку сам @символ представляет собой спираль, направленную против часовой стрелки).

L- аланин

Например, рассмотрим аминокислоту аланин . Одна из его форм SMILES NC(C)C(=O)Oболее полно написана как N[CH](C)C(=O)O. L- аланин , более распространенный энантиомер , записывается как N[C@@H](C)C(=O)O( см. Изображение ). Если смотреть со стороны связи азот-углерод, по часовой стрелке появляются водородная ( H), метильная ( C) и карбоксилатная ( C(=O)O) группы. D- Аланин можно записать как N[C@H](C)C(=O)O( см. Изображение ).

Хотя порядок, в котором ветки указываются в SMILES, обычно не имеет значения, в данном случае он имеет значение; замена любых двух групп требует перестановки индикатора хиральности. Если ветви поменяны местами, так что аланин записывается как NC(C(=O)O)C, тогда конфигурация также меняется на противоположную; L -аланин записывается как N[C@H](C(=O)O)C( см. Изображение ). Другие способы написания включают C[C@H](N)C(=O)O, OC(=O)[C@@H](N)Cи OC(=O)[C@H](C)N.

Обычно первая из четырех связей появляется слева от атома углерода, но если УЛЫБКИ начинаются с хирального углерода, например C(C)(N)C(=O)O, тогда все четыре находятся справа, но появляются первой ( [CH]связь в этом case) используется в качестве ссылки для заказа следующих трех: L -аланин также может быть записан [C@@H](C)(N)C(=O)O.

Спецификация SMILES включает усовершенствования @символа для обозначения стереохимии вокруг более сложных хиральных центров, таких как треугольная бипирамидальная геометрия молекул .

Изотопы [ править ]

Изотопы указываются числом, равным целой изотопной массе, предшествующей атомному символу. Бензол , в котором один атом углерода-14 записывается как [14c]1ccccc1и дейтерохлороформ это [2H]C(Cl)(Cl)Cl.

Примеры [ править ]

Чтобы проиллюстрировать молекулу с более чем 9 колец, рассмотрит cephalostatin -1, [12] steroidic 13-кольчатых пиразин с эмпирической формулой С 54 Н 74 N 2 O 10 изолированно от Индийского океана полухордового Cephalodiscus gilchristi :

Начиная с самой левой метильной группы на рисунке:

CC(C)(O1)C[C@@H](O)[C@@]1(O2)[C@@H](C)[C@@H]3CC=C4[C@]3(C2)C(=O)C[C@H]5[C@H]4CC[C@@H](C6)[C@]5(C)Cc(n7)c6nc(C[C@@]89(C))c7C[C@@H]8CC[C@@H]%10[C@@H]9C[C@@H](O)[C@@]%11(C)C%10=C[C@H](O%12)[C@]%11(O)[C@H](C)[C@]%12(O%13)[C@H](O)C[C@@]%13(C)CO

Обратите внимание, что он %появляется перед индексом метки закрытия кольца над цифрой 9; см. § Кольца выше.

Другие примеры УЛЫБКИ [ править ]

Обозначение SMILES подробно описано в руководстве по теории SMILES, предоставленном Daylight Chemical Information Systems, и представлен ряд иллюстративных примеров. Утилита «Изображение» от Daylight предоставляет пользователям средства для проверки собственных примеров УЛЫБКИ и является ценным образовательным инструментом.

Расширения [ править ]

SMARTS - это линейное обозначение для спецификации структурных паттернов в молекулах. Хотя он использует многие из тех же символов, что и SMILES, он также позволяет указывать подстановочные символы и связи, которые могут использоваться для определения субструктурных запросов для поиска в химической базе данных . Распространенное заблуждение состоит в том, что субструктурный поиск на основе SMARTS включает сопоставление строк SMILES и SMARTS. Фактически, строки SMILES и SMARTS сначала преобразуются во внутренние представления графов, в которых выполняется поиск изоморфизма подграфов .

SMIRKS, надмножество «response SMILES» и подмножество «response SMARTS», представляет собой строковое обозначение для определения преобразований реакции. Общий синтаксис для расширений реакции REACTANT>AGENT>PRODUCT(без пробелов), где любое из полей можно либо оставить пустым, либо заполнить несколькими молекулами, разделенными точкой ( .), и другими описаниями в зависимости от базового языка. Атомы можно дополнительно идентифицировать с помощью номера (например [C:1]) для отображения, [13] например, в [CH2:1]=[CH:2][CH:3]=[CH:4][CH2:5][H:6]>>[H:6][CH2:1][CH:2]=[CH:3][CH:4]=[CH2:5]. [14]

Конверсия [ править ]

SMILES можно преобразовать обратно в двумерные представления с помощью алгоритмов генерации структурных диаграмм (SDG). [15] Это преобразование не всегда однозначно. Преобразование в трехмерное представление достигается методами минимизации энергии. Существует множество загружаемых и доступных в Интернете утилит для преобразования.

См. Также [ править ]

  • SMILES произвольная целевая спецификация (SMARTS), расширение SMILES для спецификации субструктурных запросов
  • SYBYL Line Notation , другая строчная запись
  • Международный химический идентификатор (InChI), альтернатива ИЮПАК SMILES
  • Molecular Query Language , язык запросов, допускающий также числовые свойства, например физико-химические значения или расстояния.
  • Комплект для разработки химии , программное обеспечение для 2D-компоновки и преобразования
  • OpenBabel , JOELib , OELib (преобразование)

Ссылки [ править ]

  1. ^ Вейнингер, Дэвид (февраль 1988). «SMILES, химический язык и информационная система. 1. Введение в методологию и правила кодирования». Журнал химической информации и компьютерных наук . 28 (1): 31–6. DOI : 10.1021 / ci00057a005 .
  2. ^ а б Вейнингер, Дэвид; Вейнингер, Артур; Вейнингер, Джозеф Л. (май 1989 г.). «УЛЫБКИ. 2. Алгоритм генерации уникальной нотации УЛЫБКИ». Журнал химической информации и моделирования . 29 (2): 97–101. DOI : 10.1021 / ci00062a008 .
  3. ^ Weininger, Дэвид (август 1990). «УЛЫБКИ. 3. ДЕПИКТ. Графическое изображение химических структур». Журнал химической информации и моделирования . 30 (3): 237–43. DOI : 10.1021 / ci00067a005 .
  4. ^ Свенсон, Ричард Pommier (2004). "Введение информатики в комбинаторную химию" (PDF) . В Rayward, W. [Warden] Boyd; Боуден, Мэри Эллен (ред.). История и наследие научных и технологических информационных систем: Материалы конференции 2002 года Американского общества информационных наук и технологий и Фонда химического наследия . Медфорд, Нью-Джерси: Информация сегодня . п. 205. ISBN  9781573872294.
  5. ^ Вейнингер, Dave (1998). «Благодарности на странице смайлов и т . Д. Daylight Tutorial» . Проверено 24 июня 2013 года .
  6. ^ Андерсон, E .; Veith, GD; Вейнингер, Д. (1987). УЛЫБКИ: Линейные обозначения и компьютеризированный интерпретатор химических структур (PDF) . Дулут, Миннесота: Агентство по охране окружающей среды США , Лаборатория экологических исследований, Дулут. Отчет № EPA / 600 / M-87/021.
  7. ^ "УЛЫБКИ Учебник: Что такое УЛЫБКИ?" . Агентство по охране окружающей среды США . Проверено 23 сентября 2012 года .
  8. ^ Hutchison D, Kanade T, Kittler J, Klienberg JM , Mattern F, Mitchell JC, Naor M , Nierstrasz O, Rangan CP , Steffen B, Sudan M , Terzopoulos D, Tygar D, Vardi MY , Weikum G, Raschid L , Neglur G, Гроссман Р.Л., Лю Б. (2005). «Назначение уникальных ключей химическим соединениям для интеграции данных: некоторые интересные примеры счетчиков» . В Ludäscher B (ред.). Интеграция данных в науках о жизни . Конспект лекций по информатике. 3615 . Берлин: Springer. С. 145–157. DOI : 10.1007 / 11530084_13 . ISBN 978-3-540-27967-9. Проверено 12 февраля 2013 года .
  9. ^ Сидорова, Дж. Анисимова М., «Распознавание образов в химическом применении на основе НЛП», Письма о распознавании образов, 45 (2014) 11-16.
  10. ^ Сидорова, Дж., Гарсия, Дж., «Переход от синтаксических методов к статистическим: классификация с автоматически сегментированными признаками из последовательностей», Распознавание образов, 48 (11), 3749-3756
  11. ^ Байерс, JA; Birgersson, G; Лёфквист, Дж; Аппельгрен, М; Бергстрём, Г. (март 1990 г.). «Выделение синергистов феромонов короеда, Pityogenes chalcographus , от сложных запахов насекомых и растений путем фракционирования и биотеста с субтрактивной комбинацией» (PDF) . Журнал химической экологии . 16 (3): 861–76. DOI : 10.1007 / BF01016496 . PMID 24263601 . S2CID 226090 .   
  12. ^ "CID 183413" . PubChem . Проверено 12 мая 2012 года .
  13. ^ "Учебник СМИРКС" . Дневной свет . Проверено 29 октября 2018 года .
  14. ^ "Реакция УЛЫБКИ и УЛЫБКИ" . Проверено 29 октября 2018 года .
  15. ^ Helson, HE (1999). «Построение структурной схемы». In Lipkowitz, KB; Бойд, Д. Б. (ред.). Rev. Comput. Chem . Обзоры по вычислительной химии. 13 . Нью-Йорк: Wiley-VCH. С. 313–398. DOI : 10.1002 / 9780470125908.ch6 . ISBN 9780470125908.