Hypertextuelle Umgestaltung

Die 20 Texte des HyTex-Demonstrationsprotoyps werden mit folgenden Mitteln hypertextuell umgestaltet:

Modularisierung: Zerlegung in kleinere Texteinheiten

Linking: Verknüpfungen der Module

Linkfilter

Tilgung: Löschungen

Erzeugen eines Inhaltsverzeichnisses


Alle Umgestaltungen werden automatisch durch XSLT-Skripte vorgenommen. Als Ausgangsbasis dienen dabei die unifizierten Annotationen der Texte: Alle Texte wurden zuvor auf drei Annotationsebenen ausgezeichnet (logische Textstruktur, Definitionen und Termverwendungsinstanzen, kohäsive Elemente, siehe Das Fachtextkorpus und seine Aufbereitung) und anschließend in einem Unifikationsprozess zusammengeführt.

Modularisierung

Für die Zerlegung der Texte in Module wird die logische Textstruktur ausgewertet. Für die meisten Textsorten bedeutet dies: "ein Paragraph wird ein Modul". Es gibt jedoch noch andere modulerzeugende Strukturen, z.B. Listen, Anhänge, Fußnoten u.a., deren Binnenstrukturierung in Paragraphen bei der Modulerzeugung ignoriert wird. Abbildungen werden an den vorangehenden Paragraphen angehängt. Bei der Textsorte Frequently Asked Questions (FAQ) wird jede Einheit von Frage / Antwort zu einem Modul.

Die Modularisierung wird über Regeln gesteuert, die in der im Projekt entwickelten Hypertextualisierungssprache HTTL formuliert sind. Durch änderung einer Regel kann die Segmentierung verändert werden - zum Beispiel können statt Paragraphen Kapitel oder Unterkapitel als modulbildende Einheiten gewählt werden (sinnvoll bei längeren Mongraphien).

Zusätzlich haben die Nutzer über einen Link Zugriff auf den Text in seiner linearen Form.

Linking

Die verschiedenen Versionen des HyTex-Prototyps unterscheiden sich u.a. in den vorkommenden Linktypen. Wir beschreiben an dieser Stelle alle Linktypen. Sie werden auf der Basis verschiedener Annotationsebenen generiert:

  • HELLBLAU: Term-Link
    Diese Links markieren Fachtermini und führen zu Definitionen des Terminus im aktuellen Text. Sie werden aus der Annotationsebene "Definitionen und Termverwendungsinstanzen" erzeugt. Wenn es mehrere Definitionen in demselben Text gibt, werden sie nach Relevanz geordnet (Ranking). Durch Popup-Fenster wird in diesem Fall ein 1:n-Link simuliert.
  • DUNKELBLAU: Glossar-Link
    Diese Links markieren ebenfalls Fachtermini und führen ins TermNet. In den Texten werden sie innerhalb der Definition des Fachbegriffs selbst verwendet, oder wenn es keine Definition des Terminus im aktuellen Text gibt. Sie werden ebenfalls aus der Ebene "Definitionen und Termverwendungsinstanzen" erzeugt. Innerhalb des TermNet selbst führen sie zu anderen Termini im TermNet.
  • ORANGE: Struktur-Link
    Struktur-Links innerhalb eines Dokuments wurden auf der Basis der logischen Textstruktur erzeugt. Beispiel: Link vom Inhaltsverzeichnis zu einem Kapitelanfang. Die Struktur-Links in der links angeordneten Navigationsleiste führen zu anderen Teilen der HyTex-Demo.
  • GRüN: Inhalts-Link
    Im Gegensatz zu den Struktur-Links wurden diese dokumentinternen Links explizit oder implizit vom Autor des Textes gesetzt. Dazu zählen
    • Explizit vom Autor gesetzte Links (erzeugt aus der Textstrukturebene)
    • Links zu Fußnoten (Textstrukturebene)
    • Links zum Literaturverzeichnis (Textstrukturebene)
    • Aufgrund kohäsiver Mittel (Kohäsionsebene) erzeugte Links:
      • Antezedens: Das Antezedens zu diesem Ausdruck wird in einem Popup-Fenster angezeigt.
      • Sichtfelderweiterung: Ein zusätzliches Modul wird eingeblendet.
      • Hyperlink: Sprung zu einer anderen Stelle im Dokument.
  • ROT: Externer Link
    Diese Links führen aus der HyTex-Demo heraus. Wenn sie innerhalb der Texte vorkommen, wurden sie vom Autor des Textes gesetzt und übernommen.

Linkfilter

Um zu verhindern, dass die Texte mit Links überfrachtet werden ("overlinking"), werden einige Arten von Links ganz herausgefiltert, andere werden "unsichtbar" gemacht. Zudem gibt es Priorisierungsregeln, die gewährleisten, dass nie mehrere Links an der derselben Stelle erzeugt werden.

Ausgefilterte Links

Die folgenden Arten von Links werden entfernt:

  • Links in überschriften
  • Verweise auf ein einzelnes Antezedens in demselben Modul (Verweise auf mehrere Antezedentien bleiben in jedem Fall erhalten)
  • Konnektiv-Links, die auf dasselbe Modul verweisen
  • Links, die in ein Textstück eingebettet sind, welches seinerseits einen Link erzeugt.
  • Vom Autor gesetzte dokumentinterne Links, die keinen Zielanker haben ("broken links").

Unsichtbare Links

Einige Links erscheinen schwarz und sind damit für den Benutzer zunächst "unsichtbar". Wenn man mit der Maus darüberfährt, werden sie eingefärbt und lassen sich anklicken.

  • Der erste Term-Link innerhalb eines Moduls wird hellblau dargestellt. Nachfolgende Term-Links dieses Terminus in demselben Modul werden "unsichtbar" gemacht.
  • Der erste Glossar-Link innerhalb eines Moduls wird dunkelblau dargestellt, nachfolgende Glossar-Links desselben Terminus in demselben Modul werden "unsichtbar" gemacht.

Linkpriorisierung

Wenn aufgrund der beschriebenen Regeln mehrere Links an derselben Stelle erzeugt würden, greifen Priorisierungsregeln. Dies geschieht z.B., wenn ein Autor einen Link gesetzt hat, der von einem Terminus zu einer anderen Textstelle führt. Wenn dieser Terminus gleichzeitig im TermNet vorhanden ist, müsste eigentlich an derselben Stelle noch ein Link zum TermNet erzeugt werden. In solchen Fällen werden die Links mit folgenden Prioritäten erzeugt:

  • Vom Autor gesetzte Links werden höher bewertet als automatisch erzeugte.
  • Koref-Links (= Links, die zu einem phorischen Element das jeweilige Antezedens einblenden): Wenn es zwei (oder mehr) semantische Relationen gibt, die von dem phorischen Element ausgehen, dann wird diejenige Relation ausgewählt, die die höchste Priorität hat (dafür gibt es eine festgelegte Reihenfolge).
  • In allen anderen Fällen gilt: Die in den unifizierten Texten am weitesten außen liegende Struktur hat Priorität. Bei den gewählten Einstellungen bei der Unifikation führt dies dazu, dass die Textstrukturebene Vorrang vor der Definitions-Ebene und diese Vorrang vor der Kohäsions-Ebene hat.

Tilgung

Wörter und Wendungen am Anfang eines Moduls, die vornehmlich stylistischen Charakter haben (z.B. "nun", "also", "dann"), wurden auf der Kohäsionsebene gekennzeichnet. Sie werden in der modularisierten Version des Textes gelöscht.

Inhaltsverzeichnis

Auf der Basis der Textstruktur-Auszeichnung (Einteilung in Abschnitte und Unterabschnitte) wird für jeden Text ein "aufklappbares" Inhaltsverzeichnis erzeugt. Bei der Textsorte FAQ wird das Verzeichnis auf der Basis der Fragen erzeugt.

Zurück zu den allgemeinen Erläuterungen