Technischer Aufbau von InGrid®
Verwendete Open Source Software für InGrid®
Einsatzmöglichkeiten von InGrid®
im Umweltbereich in Deutschland
als allgemeines Verwaltungsportal
Die Technologie des Umweltportal Deutschland PortalU® (www.PortalU.de), InGrid®, basiert auf einer modular aufgebauten Software zur zentralen Bereitstellung von Informationen aus dem Internet sowie aus Datenbanksystemen. Der Name InGrid steht hierbei für Information Grid – Informationsnetz. In einem InGrid®-Portal können sowohl Webseiten als auch Daten und Metadaten eingebunden werden (Abb. 1). InGrid® wurde für den Betrieb des Umweltportal Deutschland PortalU® entwickelt und ist vielseitig einsetzbar.
Wichtigste Komponenten von InGrid®
Abbildung 1: Schematische Darstellung eines InGrid®-Portals
Funktionen von InGrid®
InGrid® basiert auf dem iPlug-Konzept, das im Bereich der Suchmaschinen bereits seit längerem erfolgreich eingesetzt wird. Bei diesem Konzept werden Arbeitsaufgaben in Teilaufgaben unterteilt und parallel bearbeitet. Dadurch ergibt sich ein erweiterbares, flexibles und damit auch skalierbares System, mit dem eine hohe Rankingqualität und eine hohe Geschwindigkeit gewährleistet werden kann. InGrid® besteht aus unterschiedlichen Modulen (vgl. Abb. 2). Die wichtigsten sind der Informationsbroker (iBus), die Schnittstellen zu den Datenquellen (iPlugs), Schnittstellen zur Portaloberfläche und offene Schnittstellen zur Weitergabe von Informationen an andere Systeme, die Portaloberfläche sowie der InGrid®Catalog.

Abbildung 2: Modularer Aufbau von InGrid®
Der iBus (information bus) bildet in einem InGrid®-Portal das zentrale Element. Er fungiert als Verteilungsstation zwischen Datenquellen und Suchanfragen. So nimmt der iBus eine Suchanfrage von der Portaloberfläche oder einer anderen übergeordneten Schnittstelle entgegen, bereitet die Anfrage auf und gibt sie über iPlugs an die angeschlossenen Datenquellen weiter. Die Anfrageergebnisse der einzelnen Datenquellen werden vom iBus eingesammelt und als Ergebnislisten an das anfragende System zurückgegeben.
Ein iPlug (information plug) ist eine Schnittstelle, die das Gesamtsystem mit einzelnen Datenquellen verbindet. Die iPlugs werden hierbei in den iBus eingehängt. Das System ist flexibel erweiterbar, d.h. neue iPlugs können nachträglich entwickelt und angeschlossen werden, ohne dass das bestehende System geändert werden muss. Die iPlugs können entweder, soweit dies die Gegebenheiten der Infrastruktur zulassen, dezentral direkt beim Datenanbieter oder zentral am iBus eingerichtete werden. Somit kann alternativ zu einer weitgehend zentralen Installation, ein performanteres voll verteiltes System erzeugt werden. Jede Datenquelle erhält ein eigenes iPlug, so dass die Datenhalter volle Kontrolle über die von Ihnen für ein InGrid®-Portal bereitgestellten Informationen behalten. Die wichtigsten iPlugs werden im Folgenden vorgestellt:
DSC-iPlug: Über das Datasource-Client-iPlug können Datenbanken mit beliebiger Datenstruktur angeschlossen werden. Als Datenbanktypen werden MySQL, Oracle, MS-SQL-Server, PostgreSQL und Tamino unterstützt. Mit dem Datasource Client wird u.a. ein Index erstellt, der für die Sortierung der Ergebnislisten (suchanfragenspezifisches Ranking) und für ein performantes Antwortverhalten erforderlich ist. Das DSC-iPlug wird in der Regel beim Datenhalter installiert und verbindet sich mit dem iBus über tcp-sockets.
SE-iPlug: Die Suchmaschine (Search-Engine-iPlug) besteht aus einer Such- und einer Indexierungskomponente. Die Suchkomponente hat die Aufgabe zu einer Suchanfrage die zugehörigen Treffer zu liefern. Dazu wird der von der Indexierungskomponente erstellte Index analysiert. Teil der Indexierungskomponente ist außerdem ein leistungsfähiger Web-Crawler. Die indexierten Dokumente werden über den Semantic Network Service (SNS) des Umweltbundesamts zusätzlich mit Metadaten für Thema, Raum und Zeit angereichert. Die Pflege der zu indexierenden Inhalte kann durch Informationsanbieter rollenbasiert dezentral über das Internet vorgenommen werden. Hierfür ist das SE-iPlug mit einer Benutzeroberfläche ausgestattet, über die der Volltextindex sowie Themen-, Messwert- und Serviceseiten gepflegt werden können.
SNS-iPlug: Das SNS-iPlug ist eine spezielle Schnittstelle zum Semantic Network Service (www.semantic-network.de) des Umweltbundesamtes. Über das iPlug werden die für das Portal notwendigen SNS-Informationen für die Umweltchronik, die räumliche und die semantische Suche abgefragt.
CSW-iPlug: Das CSW-iPlug stellt eine OGC-konforme CSW-2.0-Schnittstelle (DE-Profil, zukünftig CSW AP ISO 1.0) zur Verfügung. Über das CSW-iPlug können insbesondere geographische Metadatensysteme an ein InGrid®-Portal angeschlossen werden.
IGC-iPlug: Über das InGrid®Catalog-iPlug werden InGrid®-Kataloge eingebunden. Das iPlug stellt die im IGC gepflegten Metadaten zur Verfügung.
MSE-iPlug: Der Meta-Search-Engine-iPlug ist eine spezielle Schnittstelle zur Abfrage anderer Suchmaschinen. Der MSE-iPlug wertet hierbei wie eine Metasuchmaschine html-Seiten aus und gibt die Informationen an den iBus weiter. In PortalU® wird dieses iPlug zur Einbindung von forschungsportal.net verwendet.
Für Datenquellen, die über das DSC-, SE- oder IGC-iPlug angeschlossen sind, werden Indexdokumente erstellt, um die Suchergebnisse mit suchanfragebezogener Gewichtung in der Ergebnisliste zu sortieren. Alle sortierten Ergebnisse werden in der Hauptergebnisliste auf der Portaloberfläche angezeigt. Die Ergebnisse, die aus aufgrund von Schnittstelleneigenschaften nicht zu indexierenden Datenquellen stammen, erscheinen in der Nebenergebnisliste.
Für die Kommunikation eines InGrid®-Portals mit externen Informationssystemen stehen Schnittstellen zur Verfügung, die auf offenen Standards beruhen und HTTP- sowie XML/SOAP-Technologien für den Datenaustausch nutzen. Die wichtigsten Schnittstellen sind hierbei die OpenSearch-Schnittstelle und die CSW-Schnittstelle.
OpenSearch-Schnittstelle: Über diese XML-basierte Schnittstelle kann ein InGrid®-Portal über einfache http-GET-Requests abgefragt werden. Die Suchergebnisse werden in einem standardisierten XML-Format ausgegeben. Es können sowohl Trefferlisten als auch Detailergebnisse recherchiert werden. OpenSearch wurde durch die Firma Amazon.com im Rahmen der Suchmaschinenentwicklung A9 definiert und wird mittlerweile in verschiedensten Projekten verwendet. PortalU® wird z.B. über diese Schnittstelle von der deutschen Meta-Suchmaschine MetaGer (http://www.metager.de/) abgefragt. Die Schnittstelle kann zudem für parametrisierte Suchanfragen an ein InGrid®-Portal genutzt werden. Die Ergebnisse einer solchen Anfrage können z.B. in einem eigenen Portal mit individuellem Layout dargestellt werden.
SW-Schnittstelle: Die OGC-konforme CSW-Schnittstelle basiert, analog zum CSW-iPlug, im Wesentlichen auf den ISO-Standards 19115, 19119 und 19139. Die Schnittstelle ist für den Austausch von geografischen Metadaten konzipiert. Über sie können externe Systeme auf geografische Metadaten eines InGrid®-Portals zugreifen. Die Schnittstelle spielt im Rahmen der Geodateninfrastruktur Deutschland (GDI-DE) sowie von INSPIRE eine zentrale Rolle.
Die Portaloberfläche stellt die für den Nutzer sichtbare Oberfläche des Internetportals dar. Sie bietet eine einfache und eine erweiterte Suche, Themen-, Messwert- und Serviceseiten, RSS-Feeds, eine Umweltchronik, einen integrierten OGC-konformen Kartenklienten und administrative Komponenten. In der erweiterten Suche können Suchfilter gesetzt werden, die weit über die einfache logische Verknüpfungen („UND“, „ODER“ und „UND NICHT“) hinausgehen. Über den semantischen Suchfilter kann gezielt nach Begriffen aus dem UMTHES, einem umfangreichen Umweltthesaurus des Umweltbundesamtes, gesucht werden. Über den räumlichen Filter kann der Suchraum eingeschränkt werden. Hierbei können sowohl geografische Begriffe wie z.B. Berlin oder Harz als auch Koordinaten, die anhand einer Karte ausgewählt werden können, als räumliche Filter verwendet werden. Über den zeitlichen Filter kann die Suche zudem auf einen Zeitraum oder Zeitpunkt eingeschränkt werden. Die Rubrik Themenseiten bietet Informationen zu einzelnen Themen, die als besonders relevant eingestuft wurden. Die Themenliste schließt hierbei alle Themen ein, die von der Richtlinie 2003/4/EG als Umweltinformationen definiert werden. Bei den Messwerten werden Luft, Wasser, Strahlung und Andere unterschieden. Über die Auswahl einer dieser Kategorien werden anbieterübergreifend die entsprechenden Messwertseiten angezeigt. Unter der Rubrik Services sind Pressemitteilungen, Publikationen und Informationen zu Veranstaltungen der Anbieter zu finden. Zudem können auf der Startseite eines InGrid®-Portals RSS-Feeds verschiedener Anbieter angezeigt werden. Die Feeds werden anbieterübergreifend nach Aktualität sortiert angezeigt. Zudem werden täglich umweltrelevante Ereignisse der Vergangenheit angeboten. Die Daten dafür werden vom SNS geliefert. Eine Recherche dieser Umweltereignisse ist zudem über die Rubrik Umweltchronik möglich. Über den Kartenklienten können Karten anzeigt werden. Er arbeitet sowohl mit dem in InGrid® integrierten Kartenserver, als auch mit externen, OGC-konformen Kartenservern zusammen und ermöglicht so die Zusammenstellung und integrative Analyse von Kartenquellen unterschiedlicher Anbieter. Neben diesen Hauptfunktionalitäten der Portaloberflächen bietet ein InGrid®-Portal allen Nutzern unter der Rubrik „Mein PortalU“ die Möglichkeit, sich einen personalisierten Zugang einzurichten und das Portal damit auf seine Bedürfnisse anzupassen (Ansicht und Inhalte der Startseite, Suchpräferenzen, Speichern komplexer Suchen, etc.). Informationsanbietern bietet diese Rubrik einen Zugang zum Administrationsbereich, in dem die URL-Pflege der Informationsangebote (Webseiten für die Suche sowie Themen-, Messwert- und Serviceseiten) vorgenommen wird.
Bei der Umsetzung von InGrid® wurden als Basis ausschließlich Open Source Technologien verwendet. Die Nutzung und Weitergabe der Software an Partner der Verwaltungsvereinbarung ist damit ohne weitere Lizenzkosten möglich.
Portal Oberfläche => Jetspeed (Apache Lizenz, Apache Software Foundation)
Suchmaschine => Nutch (Apache Lizenz, ASF) &
Lucene (Apache Lizenz, ASF)
Mapserver => UMN-Map-Server (eigene Open Source Lizenz)
Kartenklient => MapBender (GPL Lizenz)
Indexierung von Datenbanken => Lucene (Apache Lizenz, ASF)
Unterstützte Datenbanken => MySQL (GPL Lizenz), PostgreSQL (BSD Lizenz)
(Proprietär: Oracle, Microsoft SQL-Server, Tamino)
In Deutschland wurde das Umweltportal Deutschland PortalU® als zentraler Zugang zu Umweltinformationen von Bund und Ländern für Bürger und Fachanwender aufgebaut. Hierfür wurde die Software InGrid® entwickelt, die so konzipiert ist, dass sie auch auf anderen Ebenen und in unterschiedlichen Einsatzszenarien genutzt werden kann.
InGrid® kann für den Aufbau regionaler- bzw. Landesumweltportale sowie kommunaler Umweltportale verwendet werden. Einfache Änderungen der Portaloberfläche können durch Anpassung von Stylesheets und den Austausch von Bilddateien vorgenommen werden. Weitergehende Anforderungen können durch die Entwicklung eigener Ansichtsprofile realisiert werden.
InGrid® unterstützt den OGC-Standard CSW 2.0 für geografische Metadaten. Über den eingebauten Kartenklienten können OGC-konforme Kartendienste dargestellt und kombiniert werden. So können die über die Metadatensuche gefundenen Kartendienste direkt angezeigt und analysiert werden. Mit dem InGrid®Editor verfügt die InGrid®-Architektur über eine leistungsfähige, ISO 19115 / 19119- und INSPIRE-konforme Metadatenerfassungs- und -pflegekomponente. Damit erfüllt InGrid® alle Kriterien zum Einsatz als GDI-DE- oder INSPIRE-Geoportal.
Über InGrid® lässt sich zudem ein allgemeines Verwaltungsportal aufbauen. Im Unterschied zu PortalU® ist dabei der thematische Fokus nicht auf den Bereich Umwelt eingeschränkt, sondern deckt alle verwaltungsrelevanten Themenbereiche ab. Folgende Anpassungen wären hierfür notwendig:
Grundsätzlich ist nur ein geringer Aufwand notwendig, um InGrid® als Software für ein allgemeines Verwaltungsportal zu nutzen.
Beim Einsatz von InGrid® als Umweltportal außerhalb Deutschlands sind folgende Anpassungen notwendig:
Technisch gesehen unterscheidet sich der Einsatz von InGrid® auf europäischer Ebene nur geringfügig von dem auf nationaler Ebene. Die Software ist grundsätzlich so organisiert, dass auch Hierarchiestufen oberhalb der nationalen Ebene abgedeckt werden können. Die PortalU®-Auswahl nach Bund/Ländern kann durch die Auswahl der europäischen Staaten ersetzt werden.