Simplified Molecular Input Line Entry Specification
aus Wikipedia, der freien Enzyklopädie
Simplified Molecular Input Line Entry Specification (SMILES) ist ein chemischer Strukturcode, bei dem die Struktur beliebiger Moleküle stark vereinfacht als Zeichenkette wiedergegeben werden. Mehrere Molekül-Editoren können SIMLES-Strings importieren und so 2-dimensionale und 3-dimensionale Modelle erzeugen.
Die ursprüngliche SMILES Spezifikation wurde von Arthur Weininger und David Weininger in den späten 1980ern entwickelt. Insbesondere die Daylight Chemical Information Systems Inc. betrieb in den folgenden Jahren die Weiterentwicklung und Modifikation der Spezifikation. Im Jahr 2007 wurde schliesslich ein offener Standard namens OpenSMILES von Blue Obelisk, einer chemisch orientierten Open-Source-Community, entwickelt.
Inhaltsverzeichnis |
[Bearbeiten] Beispiele
SMILES Notation | Strukturformel | Trivialname |
---|---|---|
C | CH4 | Methan |
CC | CH3-CH3 | Ethan |
CCC | CH3-CH2-CH3 | Propan |
Clc(c(Cl)c(Cl)c1C(=O)O)c(Cl)c1Cl | C7HCl5O2 | Pentachlorbenzoesäure |
[Bearbeiten] Konventionen
[Bearbeiten] Atome
Ein Chemisches Element wird durch sein Elementsymbol, das in eckigen Klammern eingefaßt ist dargestellt (z. B. [Au]
für Gold). Das Isotop des Elements kann dadurch spezifizert werden in dem die Massenzahl dem Elementsymbol vorangestellt wird (z. B. [2H]
für Deuterium oder [235U]
für spaltbares Uran), ohne diese Angabe wird das natürliche Isotopengemisch angenommen.
Ionen, also elektrisch geladene Atome, werden in der SMILES-Notation durch Angabe der Ladung in den eckigen Klammern beschrieben (z.B. [Cl-]
für das Chlorid-Ion oder [Cu+2]
für das Kupfer-(II)-Ion).
Direkt an das Atom gebundener Wasserstoff kann ebenfalls in der Klammernotation mit angegeben werden, dazu wird hinter dem Elementsymbol ein H
gefolgt von der Anzahl der gebundenen Wasserstoff-Atome angegeben (für ein einzelnes Wasserstoff-Atom ist die Angabe der Anzahl nicht verpflichtend). So können einfache Moleküle wie zum Beispiel Chlorwasserstoff ([ClH]
) oder Methan ([CH4]
) beschrieben werden.
Um die Notation zu vereinfachen, können die eckigen Klammern bei Elementen der sogenannten „organischen Teilmenge“ weggelassen werden. Wenn die Klammern weggelassen werden, dann werden die freien Valenzen des Atoms auf die niedrigste Standardvalenz nach der abgebildeten Tabelle mit Wasserstoffatomen aufgefüllt. So reicht zum Beispiel für die Eingabe von Wasser ein O
, und für Methan ein C
.
Element | Standardvalenz(en) |
---|---|
B | 3 |
C | 3 |
N | 3,5 |
O | 2 |
P | 3,5 |
S | 2,4,6 |
N | 3,5 |
F, Cl, Br, I | 1 |
[Bearbeiten] Bindungen
Um anzuzeigen, daß zwei Atome durch eine chemische Bindung verbunden sind, wird eines der folgenden Symbole zwischen die Atome gesetzt.
Bindung | Symbol | optional |
---|---|---|
Einfachbindung | - | ja |
Doppelbindung | = | nein |
Dreifachbindung | # | nein |
Aromatische Bindungen | : | ja |
Bindungen in aromatischen Systemen können statt durch abwechselnde Doppel- und Einfachbindungen durch ein Doppelpunkt symbolisiert werden.
Um die Schreibweise noch weiter zu vereinfachen, dürfen die Symbole für Einfachbindungen und aromatische Bindungen weggelassen werden.
[Bearbeiten] Verzweigungen
Atome mit drei oder mehr Bindungen sind Ausgangspunkt von Verzweigungen. Dabei wird nach dem entsprechenden Atom erst die Seitenkette in runden Klammern gesetzt, bevor die weiteren Bindungen folgen. Die Klammerebenen und damit die Verzweigungen können beliebig tief verschachtelt werden.
Beispiele:
Strukturformel | SMILES-String | Name |
---|---|---|
CC(=O)O |
Essigsäure | |
CC(C)(C)O |
tert-Butanol | |
C(C(CO[N+](=O)[O-])O[N+](=O)[O-])O[N+](=O)[O-] |
Glycerinnitrat |
[Bearbeiten] Erweiterung
SMARTS ist eine Erweiterung von SMILES, die das Suchen nach molekularen Substrukturen ermöglicht. Hierzu wurde SMILES, um Wildcards oder spezifische Bindungen (z. B. aromatische) anzugeben, modifiziert. Es gilt, dass jeder gültige SMILES-Ausdruck ebenfalls als SMARTS verwendet werden darf. Diese Regel gilt andersherum nicht. SMARTS werden vor allem für Suchanwendungen bei chemischen Datenbanken verwendet.
[Bearbeiten] Siehe auch
[Bearbeiten] Weblinks
- http://daylight.com/smiles/ SMILES-Website
- Konvertierer von SMILES in Strukturformeln
- http://www.syrres.com/esc/docsmile.htm Beschreibung der Sprache
- E-BABEL wechselwirkende Umwandlung der Moleküle auf dem Netz mit OpenBabel
- „SMARTS - SMILES Extension“ Einführung in SMARTS
- OpenSMILES Spezifikation
[Bearbeiten] Computerprogramme
- [1] Suchen nach molekularen Substrukturen
- http://www.molinspiration.com/jme/index.html JME SMILES Editor