HyTex Phase IModellarchitektur und Hypertextualisierungsstrategien Das Fachtextkorpus und seine Aufbereitung Demonstrationsprototyp HyTex.1 TermNet - Modellierung terminologischen Wissens und seine Verarbeitung Die Ergebnisse der ersten Phase sind im Arbeits- und Ergebnisbericht - Projekt B1 (PDF 184 KB) nachzulesen. Praktische Ergebnisse der ersten Phase sind:
Wenn Sie an diesen Ergebnissen interessiert sind, kontaktieren Sie uns! Modellarchitektur und HypertextualisierungsstrategienAls theoretische und methodische Basis für die automatische Hypertextualisierung wurde in der ersten Phase eine Modellarchitektur entwickelt, bei der Informationen aus drei Ebenen für die Segmentierung und das Linking nach Kohärenzkriterien genutzt werden (vgl. Darstellung ):
Die Entwicklung der Hypertextualisierungsstrategien konzentriert sich auf folgende Bereiche:
Makrostrategie terminologiesensitives Linking (Punkt 2.2): Ein wesentliches Kohärenzbildungsproblem bei der selektiven Fachtextrezeption ergibt sich dadurch, dass ein Rezipient in Bezug auf die Verwendung von Termini nicht entscheiden kann, welche spezifische Konzeptualisierung diesen von seiten des Autors zugrunde gelegt wurde. Im Bereich "Terminologiesensitives Linking" entwickeln wir eine pragmatisch fundierte Methode, die es erlaubt, Verwendungsinstanzen von Fachtermini mit Linkangeboten zu versehen, die den Rezipienten zu genau derjenigen Definition im Vortext führen, deren Kenntnis für eine korrekte Semantisierung des betreffenden Terminus in seinem aktuellen Kontext notwendig ist. => mehr...
Das Fachtextkorpus und seine Aufbereitung Das gesamte Fachtextkorpus umfasst Dokumente verschiedener Textsorten und hat einen Umfang von ca. 25.000 Normseiten. Für die Auszeichnung der logischen Dokumentstruktur des Korpus wurde in Kooperation mit dem Gießener Teilprojekt => mehr...
Demonstrationsprototyp HyTex.1Die Entwicklung eines Demonstrationsprotoyps, anhand dessen die verschiedenen Hypertextualisierungsstrategien getestet werden können, ist weitgehend abgeschlossen. Dazu wurde das Kernkorpus gemäß der logischen Textstruktur und bezüglich der Definitionen und Termverwendungsinstanzen annotiert, die Annotation bezüglich Koreferenzphänomenen und Konnektiven ist noch nicht ganz abgeschlossen. Die Hypertextualisierungsstrategien (Segmentierung und Linking) wurden umgesetzt. TermNet - Modellierung terminologischen Wissens und seine Verarbeitung Wir haben ein Terminologienetz (TermNet) aufgebaut, das zentrale Konzepte und Termini der Fachtextdomäne erfasst. Wir haben uns dabei an die in Eine Statistik gibt Auskunft über die verschiedenen modellierten Einheiten (TermSets, Lexeme, verschiedene Arten von Relationen). => mehr...
Technische UmsetzungDie technische Umsetzung erfolgt auf der Basis von XML-Technologien. Die verschiedenen Annotationsebenen werden in einem Unifikationsprozess zusammengeführt und anschließend mittels der Programmiersprache XSLT in ein webbasiertes Präsentationsformat überführt. Dabei wird auch das TermNet ausgewertet. Perspektivisch soll diese Transformation nicht direkt in XSLT programmiert werden, sondern in einer von uns entwickelten Programmiersprache zur Generierung von Hypertextsichten, der Hypertext Transformation Language (HTTL). => mehr zur technischen Umsetzung allgemein... ( English ) |