Обозначение строки SYBYL - SYBYL line notation

обозначение сибиллической линии
Расширение имени файла
.sln
Тип форматаформат химического файла

В Обозначение строки SYBYL или же SLN это спецификация для однозначного описания структуры химический молекулы используя короткие ASCII струны. SLN отличается от Улыбки несколькими важными способами. SLN может указывать молекулы, молекулярные запросы и реакции в однострочном формате, тогда как SMILES обрабатывает их с помощью языковых расширений. SLN поддерживает относительная стереохимия, он может различать смеси энантиомеры из чистых молекул с чистой, но неразрешенной стереохимией. В УЛЫБКАХ ароматичность считается свойством как атомов, так и связей, тогда как в SLN это свойство связей.

Описание

Как и SMILES, SLN - это линейный язык, описывающий молекулы. Это обеспечивает много общего с SMILES, несмотря на многие отличия SLN от SMILES, и в результате в этом описании SLN будет сильно сравниваться с SMILES и его расширениями.

Атрибуты

Атрибуты, строки в квадратных скобках с дополнительными данными, например [ключ1 = значение1, ключ2 ...], является ключевой особенностью SLN. Атрибуты могут применяться к атомам и связям. Атрибуты, не определенные официально, доступны пользователям для частных расширений.

При поиске молекул операторы сравнения, такие как fcharge> -0,125 может использоваться вместо обычного знака равенства. А ! предшествующая группе ключ / значение инвертирует результат сравнения.

Целые молекулы или реакции тоже могут иметь атрибуты. Квадратные скобки заменяются парой <> приметы.

Атомы

Все, что начинается с заглавной буквы, идентифицирует атом в SLN. Водороды не добавляются автоматически, но одинарные связи с водородом могут быть сокращены для органических соединений, что приводит к CH4 вместо C (H) (H) (H) H за метан. Автор утверждает, что явные атомы водорода допускают более надежный синтаксический анализ.

Атрибуты, определенные для атомов, включают Я = для массового числа изотопа, заряд = за официальную плату, заряд за частичную оплату, s = для стереохимии и spin = для радикалов (sинглет, dдублет, трифленый ). Формальное обвинение заряд = 2 может быть сокращено как +2, и наоборот для отрицательных зарядов; - и + дополнительно признается как -1 или +1 заряд. * это сокращение для spin = d. Стереохимия атомов в основном тетраэдрическая, среди прочего доступны R / S и D / L; он может быть явным (E) или относительным (R), или указывать смесь (M) стереоизомеров у этого атома. А Nобычный /яинвертированная запись, эквивалентная @@ и @ в УЛЫБКАХ, предоставляется. Для поиска предусмотрено множество дополнительных атрибутов.

В дополнение к элементарным атомам SLN поддерживает спецификацию атомов подстановки: Any (соответствует любому атому) и Hev (соответствует любому тяжелому атому). Он также имеет обширный Синтаксис Маркуша для задания комбинаторных библиотек и запросов RGROUP. SLN имеет несколько типов атома запроса для сопоставления групп атомов. У каждого типа есть имя группы, за которым следует необязательное положительное целое число.

ГруппаОписание
рИспользуется для соответствия боковой цепи. Соответствующие атомы не должны иметь связи с ядром
ИксИспользуется для соответствия боковым цепям и кольцам. Атомы, соответствующие группе X, могут соответствовать боковым цепям и кольцам
RxСоответствует боковым цепям и кольцам, закрытие кольца должно соответствовать второй группе Rx

"0"массовое число обозначает обычный изотоп, поэтому N [I = 0] равно N [I = 14] соответствие 14N и N [! I = 0] соответствует любому другому изотопу.

Облигации

SLN использует в основном те же обозначения связывания, что и SMILES, с -, =, #, и : для одинарных, двойных, тройных и ароматических связей. . используется для связей нулевого порядка, аналогично реакции SMILES, хотя + является предпочтительным для отдельных молекул.

Большинство одинарных связей неявны, поэтому CH3CH3() можно использовать вместо CH3-CH3() за этан. Явные одинарные связи полезны для трехцентровых связей.

В s = атрибут определен для двойных связей, чтобы передать информацию о стереохимии в E / Z или cявляется/тобозначение ранса. N / I доступен и означает, что «основная» цепь является транс- или цис-друг к другу.

Кольца

SLN записывает кольца более явным образом, чем SMILES, с бензолом, указанным как C [1] H: CH: CH: CH: CH: CH: @ 1. Атом помечается как якорь на кольце с одним числовым атрибутом, и @1 затем можно использовать для указания этого (в нашем случае «номер один») атома для обратного связывания.

Разветвление

Ветви SLN идентичны ветвям SMILES, их указывают круглые скобки. Пропионовая кислота является СН3СН2С (= O) ОН().

Реакции

SLN поддерживает реакции с -> соединение реагентов и продуктов. Атомное отображение возможно с использованием [#число] атрибуты. Атрибут реакционного центра (rc) может быть добавлен к связям, а атрибут хирального преобразования (cc) - к атомам.

Разное.

Несколько строк можно объединить в синтаксическую строку, написав (обратная косая черта) в конце каждой строки. Это позволяет разбить длинную строку на несколько строк, например, в реакции с каждой молекулой на отдельной строке.

Смотрите также

Рекомендации

  • Эш, Шейла; Cline, Malcolm A .; Гомер, Р. Вебстер; Херст, Тэд; Смит, Грегори Б. (1997). «SYBYL Line Notation (SLN): универсальный язык для представления химической структуры». J. Chem. Инф. Comput. Sci. 37: 71–79. Дои:10.1021 / ci960109j.
  • Гомер, Р. Вебстер; Суонсон, Джон; Джилек, Роберт Дж .; Херст, Тэд; Кларк, Роберт Д. (2008). «SYBYL Line Notation (SLN): Единое обозначение для представления химических структур, запросов, реакций и виртуальных библиотек». J. Chem. Инф. Comput. Sci. 48: 2294–2307. Дои:10.1021 / ci7004687.