Расширение имени файла | .sln |
---|---|
Тип формата | формат химического файла |
SYBYL линия обозначение или СЛНЫ это спецификация для однозначного описания структуры химических молекул с использованием короткого ASCII строк . SLN отличается от SMILES несколькими существенными отличиями. SLN может указывать молекулы, молекулярные запросы и реакции в однострочном формате, тогда как SMILES обрабатывает их с помощью языковых расширений. SLN поддерживает относительную стереохимию , он может отличать смеси энантиомеров от чистых молекул с чистой, но неразрешенной стереохимией. В SMILES ароматичность считается свойством как атомов, так и связей, тогда как в SLN это свойство связей.
Описание [ править ]
Как и SMILES, SLN - это линейный язык, описывающий молекулы. Это обеспечивает много общего с SMILES, несмотря на многие отличия SLN от SMILES, и в результате это описание будет сильно сравнивать SLN с SMILES и его расширениями.
Атрибуты [ править ]
Атрибуты, строки в квадратных скобках с дополнительными данными, например [key1=value1, key2...]
, являются основной функцией SLN. Атрибуты могут применяться к атомам и связям. Атрибуты, не определенные официально, доступны пользователям для частных расширений.
При поиске молекул fcharge>-0.125
вместо обычного знака равенства можно использовать операторы сравнения, такие как . !
Предшествующий ключ / значение группы инвертирует результат сравнения.
Целые молекулы или реакции тоже могут иметь атрибуты. Квадратные скобки заменяются парой <>
знаков.
Атомы [ править ]
Все, что начинается с заглавной буквы, идентифицирует атом в SLN. Водороды не добавляются автоматически, но одинарные связи с водородом могут быть сокращены для органических соединений, в результате чего CH4
вместо того , чтобы C(H)(H)(H)H
для метана . Автор утверждает, что явные водороды допускают более надежный синтаксический анализ.
Атрибуты , определенные для атомов , включают I = для массового числа изотопов, заряда = для формального заряда, fcharge для частичного заряда, s = для стереохимии и спина = для радикалов ( ы inglet , д oublet , т riplet ). Формальный заряд charge=2
может быть сокращен как +2
, и наоборот для отрицательных зарядов; -
и +
дополнительно признается как заряд -1 или +1. *
это сокращение дляspin=d
. Стереохимия атомов в основном тетраэдрическая, среди прочих доступны R / S и D / L; он может быть явным (E) или относительным (R), или указывать смесь (M) стереоизомеров у этого атома. Н НПУ / Я nverted обозначения, что эквивалентно @@
и @
в улыбках, обеспечивается. Для поиска предусмотрено множество дополнительных атрибутов.
Помимо элементарных атомов SLN поддерживает спецификацию атомов подстановки: Any (соответствует любому атому) и Hev (соответствует любому тяжелому атому). Он также имеет расширенный синтаксис Маркуша для определения комбинаторных библиотек и запросов RGROUP. SLN имеет несколько типов атомов запроса для сопоставления групп атомов. У каждого типа есть имя группы, за которым следует необязательное положительное целое число.
Группа | Описание |
---|---|
р | Используется для соответствия боковой цепи. Согласованные атомы не должны иметь связи с ядром |
Икс | Используется для соответствия боковым цепям и кольцам. Атомы, соответствующие группе X, могут соответствовать боковым цепям и кольцам |
Rx | Соответствует боковым цепям и кольцам, закрытие кольца должно соответствовать второй группе Rx |
« 0
» Массовое число обозначает обычный изотоп, так что N[I=0]
равняется N[I=14]
соответствие 14 N и N[!I=0]
соответствие любого другого изотопа.
Облигации [ править ]
СЛН использует в основном то же обозначение, что связующие улыбки, с -
, =
, #
и :
для одно-, двух-, трех- и ароматических связей. .
используется для связей нулевого порядка, аналогично реакции SMILES, хотя a +
является предпочтительным для отдельных молекул.
Большинство одинарные связи неявно, так что CH3CH3
( ) может быть использован вместо ( ) для этана . Явные одинарные связи полезны для трехцентровых связей.CH3-CH3
s=
Атрибут определен для двойных связей, чтобы передать информацию в стереохимии E / Z или с вне / т трансвлияния обозначения. N / I доступен и означает, что «основная» цепь является транс- или цис-друг к другу.
Кольца [ править ]
SLN записывает кольца по более явному шаблону, чем SMILES, с бензолом, указанным как C[1]H:CH:CH:CH:CH:CH:@1
. Атом помечается как якорь на кольце с одним числовым атрибутом, и @1
затем его можно использовать для указания этого (в нашем случае «номер один») атома для обратной связи.
Ветвление [ править ]
Ветви SLN идентичны ветвям SMILES, их указывают круглые скобки. Пропионовая кислота является CH3CH2C(=O)OH
( ).
Реакции [ править ]
SLN поддерживает реакции с ->
соединением реагентов и продуктов. Отображение атомов возможно с использованием атрибутов. Атрибут реакционного центра (rc) может быть добавлен к связям, а атрибут хирального преобразования (cc) - к атомам.[#num]
Разное. [ редактировать ]
Несколько строк можно объединить в синтаксическую строку, написав \
(обратную косую черту) в конце каждой строки. Это позволяет разбить длинную строку на несколько строк, например, в реакции с каждой молекулой на отдельной строке.
См. Также [ править ]
- Упрощенная спецификация ввода строки молекулярного ввода (обозначение SMILES)
- Smiles произвольная спецификация цели (нотация SMARTS)
Ссылки [ править ]
- Эш, Шейла; Cline, Malcolm A .; Гомер, Р. Вебстер; Херст, Тэд; Смит, Грегори Б. (1997). «SYBYL Line Notation (SLN): универсальный язык для представления химической структуры». J. Chem. Инф. Comput. Sci. 37 : 71–79. DOI : 10.1021 / ci960109j .
- Гомер, Р. Вебстер; Суонсон, Джон; Джилек, Роберт Дж .; Херст, Тэд; Кларк, Роберт Д. (2008). «Линейная нотация SYBYL (SLN): единая нотация для представления химических структур, запросов, реакций и виртуальных библиотек». J. Chem. Инф. Comput. Sci. 48 (12): 2294–2307. DOI : 10.1021 / ci7004687 .