Unsere Seite auf

Nachrichten und Pressemeldungen aus Labor und Analytik

12.08.2010

Chemische Strukturformeln für Suchmaschinen sichtbar machen


Chemie-Fachgesellschaften, Wissenschaftsverlage und FIZ CHEMIE engagieren sich mit einem internationalen Trust für die Verbreitung und Weiterentwicklung einer standardisierten Kennung für chemische Strukturen im Internet / Identifikations-Zeichenkette 'InChI' ermöglicht Suchmaschinen die sichere quellenübergreifende Identifizierung von Substanzen / Werkzeuge zum Erzeugen der InChI-Codes sind im Internet kostenlos bereitgestellt.

FIZ CHEMIE hat für den internationalen InChI Trust das Büro und die Betreuung der Webseite übernommen. Der InChI Trust wurde im Juli 2009 als Interessensgemeinschaft für die Verbreitung und Weiterentwicklung des International Chemical Identifier (InChI) gegründet. Die Zusammensetzung des Vorstandes liest sich wie ein Auszug aus dem Who-is-Who der internationalen Informationsbranche: ihm gehören Vertreter der britischen Fachgesellschaft Royal Society of Chemistry (RSC), der Nature Publishing Group (Macmillan Publishers / Verlagsgruppe Georg von Holtzbrinck), der internationalen Wissenschaftsverlage Elsevier, Wiley und Taylor & Francis sowie des Medienkonzerns Thomson Reuters, der IUPAC (International Union of Pure and Applied Chemistry) und des FIZ CHEMIE an.

"Durch unsere aktive Mitarbeit im InChI Trust können wir unsere hohe Fachkompetenz in Fragen der Organisation, Dokumentation und unverfälschten Wiedergabe elektronisch publizierter wissenschaftlicher Informationen in den Dienst einer weltweiten Standardisierung der Kennzeichnung chemischer Strukturformeln im Internet stellen", erklärt Professor Dr. René Deplanque, Geschäftsführer des FIZ CHEMIE, die Motivation zur Verantwortungsübernahme. Standardisierung anhand eines Systems, das sich nicht im Besitz eines einzelnen Unternehmens oder eines geschlossenen Interessentenkreises befinde, sei, so Deplanque weiter, dringend notwendig, um wissenschaftliche Erkenntnisse auch in Zukunft für jeden, der sich dafür interessiert, verfügbar zu machen. "Bisher konnte jeder, der genug Geld oder Zugang zu Bibliotheken hatte, gedruckte Standardwerke der Chemie kaufen und darin nachschlagen, was wann zu welcher Substanz publiziert wurde und seine eigenen Forschungen darauf aufbauen. Mit der rasanten Verbreitung von Veröffentlichungen im Internet geht die gedruckte Dokumentation massiv zurück oder wird ganz eingestellt. Dafür muss ein Ersatz geschaffen werden", erklärt Deplanque. Dies sei durch eine internationale Zusammenarbeit der großen Informationsverarbeiter am besten zu leisten, weil dadurch die Kompetenz gebündelt und gleichzeitig das Entstehen von Monopolen oder Oligopolen in der Informationsversorgung der Wissenschaft verhindert würden.

Ursprünglich wurde das InChI-System vom Chemie-Fachverband IUPAC als gemeinfreies einheitliches Datenrepräsentationsformat für chemische Strukturen in den Datenbanken der amerikanischen Behörde NIST (National Institute of Standards and Technology) entwickelt. Forciert von den Mitgliedern des InChI Trust soll es nun Schritt für Schritt auf wissenschaftliche Publikationen im Internet übertragen werden. 2005 wurde die erste Version des Kennzeichnungssystems veröffentlicht. 2008 folgte eine weitere Version, die durch den Einsatz der sogenannten Hashfunktion kürzere Zeichenketten als Zielmengen generiert, die sogenannten InChIKeys.

Sie bauen auf dem ursprünglichen Algorithmus auf, so dass die Interoperabilität zwischen Datenbanken und anderen InChI-Quellen, z.B. Zeitschriftenartikeln, erhalten bleibt.

Aus softwaretechnischer Sicht ist ein InChI eine Zeichenkette aus Buchstaben, Zahlen und Zeichen, der InChIKey eine reine Textkette, die von Suchmaschinen sehr gut weiterverarbeitet werden kann. Eingegeben in Google sehen sowohl InChI, als auch der kürzere InChIKey allerdings aus wie eine alchimistische Geheimbotschaft und tippen lässt sich die Zeichenkette auch nur sehr schwer fehlerfrei. Das ist aber auch nicht notwendig, denn InChIs lässt man sich von Werkzeugen erzeugen, die im Internet zur kostenlosen Benutzung bereitgestellt sind, z.B. auf der Webseite der RSC. Man gibt entweder eine Struktur, einen Substanznamen oder eine Formel ein und das Werkzeug generiert den gewünschten InChI. Die Zeichenkette wird aus dem Browser herauskopiert und in das Suchfeld der Suchmaschine übertragen. Die Suchmaschine findet damit in den unterschiedlichsten Informationsquellen im Internet die korrespondierenden InChI-Codes, zum Beispiel Hinweise auf Veröffentlichungen in der Datenbank PubChem. Das Resolver-Werkzeug stellt den gefundenen Code wieder als Struktur dar.

Quelle: idw/Fachinformationszentrum Chemie




—> alle Nachrichten dieser Firma

Abonnieren:

Empfehlen: