HyTex Phase IIEvaluation der bisher implementierten Hypertextualisierungsstrategien Entwicklung thematisch motivierter Strategien zur Hypertextualisierung Ausbau der terminologischen und lexikalischen Ressourcen Automatisierung von Vorverarbeitungsprozessen für automatische Hypertextualisierungsstratgien Seit August 2005 befindet sich das HyTex-Projekt in der zweiten Phase. Schwerpunkte der zweiten Förderphase sind neben der Evaluation der bisher implementierten Hypertextualisierungsstrategien besonders die Entwicklung thematisch motivierter Strategien zur Hypertextualisierung und der weitere Ausbau unserer terminologischen bzw. lexikalischen Ressourcen. Evaluation der bisher implementierten Hypertextualisierungsstrategien Mit Hilfe einer Benutzerstudie wollen wir untersuchen, ob der in Phase I entwickelte Entwicklung thematisch motivierter Strategien zur HypertextualisierungHier untersuchen wir, wie man Verfahren des Lexical Chainings auf deutsche Fachtexte übertragen kann. Im Moment implementieren wir daher einen Lexical Chainer, der - gegenüber klassischen Ansätzen für das Englische - um einige (Vor-)Verarbeitungsschritte erweitert ist und auf verschiedene semantische Ressourcen zugreifen wird. Besonders interessiert uns die Frage, u. a. durch welche Erweiterungen wir einen Übergang zwischen lexikalischem und thematischem Chaining erreichen können. Die Ergebnisse einer Annotationsvorstudie zum Lexical Chaining sind in der Veröffentlichung Web-based Annotation of Anaphoric Relations and Lexical Chains (Projektpublikation mit unseren Kooperationspartnern in Bielefeld; PDF 163 KB) beschrieben. Ausbau der terminologischen und lexikalischen Ressourcen Die Automatisierung von Vorverarbeitungsprozessen für automatische HypertextualisierungsstratgienEinige interessante Ergebnisse haben wir bereits in unserer Pilotstudie zur automatischen Annotation definitorischer Textsegmente erhalten. Basierend auf diesen Ergebnissen wollen wir untersuchen, wie die hierdurch gewonnenen Suchmuster für die (voll-)automatische Annotation von definitorischen Textsegmenten verwendet werden können. Daneben planen wir, diese Ergebnisse als Grundlage für die automatische Rekonstruktion und Annotation thematischer Strukturen zu verwenden. ( English ) |