WORG-Glossar                   Homepage Prof. U. Schulz
Aktuelle Meldungen Lerneinheiten Übungen Das Wichtigste in Kürze Leistungsnachweis /Schein Weitere WORG-Sites
Lerneinheit 4: Abstracts


Lerneinheit 5: Metadaten

Was sind Metadaten

Metadaten bedeutet 'Daten über Daten'. Wenn Informationsexperten von Metadaten sprechen, meinen sie Informationen über Internet-Ressourcen, die durch Suchmaschinen ausgewertet werden können. Darunter zählen alle Angaben, die wir aus der herkömmlichen Dokumentbeschreibung kennen und einige weitere Angaben, die in einem vernetzten elektronischen 'Ablagesystem' Sinn machen, z.B. Datum, Version, URL, Verlinkung zu anderen Ressourcen etc. Die Daten können Textdokumente aber auch z.B. Grafiken, Sound und andere Objekte beschreiben.

Metadaten sollen die Präzision bei der Suche nach Internet-Ressourcen verbessern und die Auswahl von qualitätskontrollierten Ressourcen durch adäquate Beschreibungen erleichtern. Sie sollen den bekannten Mängeln (automatische Indexierung, fehlende Qualitätskontrolle) der gängigen Suchmaschinen entgegen wirken.

Sehen Sie sich als Beispiel den Source-Code der Homepage unseres Fachbereichs (in Ihrem Browser unter Ansicht/Anzeigen -> Quelltext) oder hier.

Weltweit sind aus

  • unterschiedlichen Initiativen
  • unterschiedlichen Traditionen
  • unterschiedlichen Fachdisziplinen
  • für unterschiedliche zu beschreibende Objekte

verschiedene Metadatenformate entstanden.

Das im Bereich Bibliothek und Dokumentation am weitesten verbreitete ist das der Dublin Core Initiative, das Dublin Core Metadata Element Set. Ein weiterer Quasi-Standard wird vom W3C (World Wide Web Consortium) vorgegeben.

Metadaten stehen im Headbereich von HTML-Dateien oder in gesonderten Dateien, die mit der beschriebenen Internet-Ressource verknüpft sind. Dieses Tool erzeugt automatischen Metadaten im Dublin Core Format für eine beliebige Website, die Sie weiter editieren können. Unter dem URL http://www.lub.lu.se/cgi-bin/nmdc.pl finden Sie ein Tool, in dem Sie selber Metadaten zu einer Website erzeugen können.

Worüber informieren Metadaten?

Metadaten entstehen hauptsächlich in drei Kontexten:

  • Forschung und Lehre
  • e-commerce
  • Öffentliche Verwaltung

Daraus ergeben sich die Daten, die für Anbieter und Nutzer bzw. Kunden wichtig sind. Das sind neben den üblichen formalerschließenden Daten (ähnlich RAK oder AACR) u.a. folgende:

  • Herkunft, Geschichte der Ressource
  • geistige Urheberschaft, Integrität, Authentizität der Ressource
  • Beziehung zu anderen Ressourcen
  • Urheberrechtliche Information, Zugänglichkeit, Nutzungskonditionen, ggfl. Kosten
  • Art der Ressource (z.B. Dateityp) und notwendige Tools, um sie zu nutzen (z.B. Plugins, Reader)
  • Zielgruppe, Restriktionen für Kinder, Empfehlungen, Bewertungen von Ressourcen

Wer braucht Metadaten?

... jeder, der in einem Kontext arbeitet, in dem eine präzise Suche nach qualitätskontrollierten Internet-Ressourcen wichtig ist. Jeder Benutzer einer Suchmaschine bräuchte eigentlich Metadaten, aber wenige Internet-Ressourcen wurden von ihren Autoren mit Metadaten versehen, und wenige Suchmaschinen werten html-tags für Metadaten aus.

Konsequent angewendet werden Metadaten bisher in verschiedenen 'Closed Communities' der Bereiche Wissenschaft, Archive, Museen öffentliche Verwaltung. Ein Beispiel aus dem Bereich der wissenschaftlichen Information ist:

SSG-FI Sondersammelgebietsfachinformation der SUB Göttingen

Akteure in der Medatenwelt sind

  • Informatiker und Programmierer, die Web-Standards vorschlagen und Suchmaschinen entwickeln, insbesondere das W3C
  • Wissenschaftler verschiedener Disziplinen - bisher überwiegend im Bereich der Naturwissenschaften und Mathematik
  • Bibliothekare, Archivare, Museumsfachleute, Regierungsstellen die den Zugang zu elektronischen Ressourcen organisieren und sicherstellen
  • Kommerzielle Unternehmen, die das Internet für Marketing- und Vertriebszwecke nutzen.
Wer macht Metadaten?

Wer soll nun die Milliarden von Internet-Ressourcen erschließen? Es gibt zwei grundsätzlich verschiedene Gruppen, die dafür in Frage kommen:

  1. Die allgemeine Internet-Gemeinschaft
  2. Jeder in der Internet-Gemeinschaft kann seine Ressourcen mit Metadaten versehen, um sie leichter auffindbar zu machen und zu Auswahlzwecken präziser zu beschreiben. Hierbei sind drei Probleme bekannt:

    • zunächst geringe Akzeptanz: Kaum jemand nutzte die Möglichkeit der Erschließung mit Metadaten.
    • nachdem bekannt wurde, wie Suchmaschinen Metadaten für das Ranking von Websites verwendeten: Missbrauch von Metadaten
    • Uneinheitlichkeit: beliebige Syntax (z.B. Vorname - Nachname), unkontrolliertes Vokabular (z.B. Beliebigkeit und Mehrsprachigkeit bei der Keyword-Eingabe)

    Der Missbrauch von Metadaten (Spam) vor allem in dem Feld 'keywords' hat inzwischen dazu geführt, dass heute so gut wie keine allgemeine Suchmaschine inhaltserschließende Metadaten auswertet.

  3. Closed Communities
  4. Hier muss zwischen zwei Möglichkeiten unterschieden werden:

    • Die Autoren versehen ihre Dokumente selbst mit Metadaten. Hierfür werden ihnen Tools und Hilfestellungen zur Verfügung gestellt, z.B. My Meta Maker for Theses.
    • Ausgebildete Informationsfachleute versehen die Internetressourcen mit Metadaten, z.B. Bibliothekare und Dokumentare.

    Sammlungen qualitätskontrollierter Internet-Ressourcen, die mit Metadaten versehen sind, verwenden eigene Suchmaschinen, die die Metadaten auswerten und für gezielte Recherchen zur Verfügung stellen.



HAW Hamburg
Fachbereich BuI

06. Juni 2005 (updated)

Prof. Ulrike Spree