Kurzbeschreibung des Projekts HyTexDie zentrale Idee von Hypertext besteht darin, Informationen in Modulen (auch als "Knoten" bzw. "informationelle Einheiten" bezeichnet) zu präsentieren, die durch computerverwaltete Verweise, die Hyperlinks, verknüpft sind. Mit Hilfe sog. Navigationswerkzeuge können die Nutzer das Netzwerk aus Modulen und Links auf selbst gewählten Pfaden traversieren. Als "Hypertextualisierung" bezeichnen wir die Aufgabe, sequenziell organisierte Dokumente für die Publikation in einem Hypertextsystem, z.B. dem World Wide Web, aufzubereiten. Für diese Aufgabe braucht man Konversionstools auf der technischen Seite. Auf der konzeptionellen Seite benötigt man Prinzipien und Strategien
Das Projekt beschäftigt sich schwerpunktmäßig mit der konzeptionellen Seite. Dabei geht es neue Wege, indem es textgrammatische Forschungsergebnisse, die an "linear" organisierten Texten gewonnen wurden, für die (teil)automatische Hypertextualisierung nutzbar macht. Ein Schlüssel hierzu ist das Konzept der "Kohärenz". Unser Ansatz: Wir annotieren Kohärenzstrukturen in sequenziell organisierten Dokumenten und nutzen das textgrammatische Markup für die automatische Zerlegung und Re-Konnexion durch Hyperlinks. Dabei möchten wir herausfinden, welche Kohärenzmittel relevant für die Hypertextualisierung sind und nach welchen Strategien die Zerlegung und Re-Konnexion erfolgen kann. Als Testbett wird ein Fachtextkorpus (zur Texttechnologie) aufgebaut, textgrammatisch annotiert und um eine "Ontologie" zu den wichtigsten Konzepten der Fachtextdomäne ergänzt. Texttechnologische Grundlage ist die Extensible Markup Language (XML), speziell die |