SoSe 2003 - Medok 2 - Spree - Arbeitsaufgaben

Aufgabe 16: Qualität einer Dokumentation

Lernziel:

  • Sie können die Formeln zur Berechnung der Qualität einer Recherche an komplexeren Beispielen anwenden

  •  

  1. RS ist ein furchtbar mäkeliger Nutzer Ihres Fernseharchivs. Der Einführung der Datenbank steht RS skeptisch gegenüber. Während man früher in der Handkartei stets schnell relevante Filmausschnitte gefunden habe, bekomme man heute diese ellenlangen Computerausdrucke und müsse sich durch Berge von Ballast hindurchkämpfen bis man endlich brauchbare Filmausschnitte finde. Diese Bemerkung wollen Sie als ArchivleiterIn nicht auf sich sitzen lassen. Sie errechnen die Relevanzrate/Trefferquote der letzten 5 Recherchen von RS.
    06.06.00: aus einer Liste 15 Treffern hat RS 10 Dokumente bestellt
    07.06.00: aus einer Liste 10 Treffern hat RS 9 Dokumente bestellt
    10.06.00: aus einer Liste 45 Treffern hat RS 20 Dokumente bestellt
    12.06.00: aus einer Liste 5 Treffern hat RS 4 Dokumente bestellt
    07.06.00: aus einer Liste 15 Treffern hat RS 13 Dokumente bestellt
    Wie hoch liegt die durchschnittliche Trefferquote? Was meinen Sie, hat RS mit seiner Kritik Recht? Wie beurteilen Sie die erzielte Trefferquote?
  2. Das Komplement zur Relevanzrate heißt Ballastrate oder noise. Wie errechnen Sie die Ballastrate im obigen Beispiel?
  3. Sie selber haben den Verdacht, dass die Vollzähligkeitsrate besser sein könnte, da die neue Kollegin Frau S. schlampig indexiert. Überlegen Sie, was Frau S. wohl alles falsch machen kann, wenn es von ihr heißt, dass sie "schlampig indexiere"?
  4. In Ihrem Fernseharchiv sind bisher 10 000 DE (Dokumentationseinheiten: Spielfilme, Stundenfeatures, kurze Beiträge aus Nachrichtensendungen und Musiksendungen zu den unterschiedlichsten Themen gespeichert. Der Bestand geht bis 1980 zurück.) gespeichert. Welche Möglichkeiten gibt es, die Vollzähligkeitsrate der Recherchen zu überprüfen?
  5. Erklären Sie, wieso zur Beschreibung der Güte eines Rechercheergebnisse weder die Relevanz- noch die Vollzähligkeitsrate ausreicht? Wieso hängen Relevanz- und Vollzähligkeitsrate voneinander ab?
  6. Vollzähligkeitsrate/Recall: Bei einer Recherche a) werden 23 DE selektiert, davon waren 15 relevant. Sie vermuten, dass 10 relevante DE nicht gefunden wurden. Berechnen Sie
    Relevanz von Recherche a)
    Vollzähligkeitsrate von Recherche a)
  7. Bei einer zweiten Recherche b) wurde eine Relevanzrate von 0.21 ermittelt bei einem Recall von 0.85. Welche Recherche hat insgesamt eine höhere Qualität?
  8. Beim freien Indexieren hat die Indexiererin ein Dokument versehentlich mit dem Schlagwort "Weltausstellung 2000" indexiert, obwohl vereinbart war die offizielle Bezeichnung "Expo 2000" zu verwenden. Verändert sich durch diesen Fehler die Precision- oder Recallrate bei folgenden Suchanfragen:
    Expo 2000
    Expo 2000 OR Weltausstellung 2000
    Expo 2000 UND Weltausstellung 2000

  9.   Viel Spaß
    Ulrike Spree