Offizielle Kursbeschreibung
Dieses Übungsseminar bietet eine Einführung in die Erstellung eines Goldstandard-Datensatzes, einschließlich der Vorverarbeitung von Daten, der manuellen und automatischen Annotation von Text für Merkmale wie Wortart und Lemma, der Bewertung von Datenformaten wie TSV und XML/TEI sowie der Überprüfung und Korrektur von Annotationen. In diesem Kurs werden wir medizinische Texte aus dem mittelalterlichen Europa, die in romanischen Sprachen (Alt- und Mittelfranzösisch/Anglo-Normannisch/Altokzitanisch) verfasst sind, mit dem Annotationstool INCEpTION annotieren. Wir werden uns auch mit der Annotation von Texten mit SpaCy befassen.

Vorkenntnisse in diesen Sprachen sind nicht erforderlich. Kenntnisse des modernen Französisch sind hilfreich, aber ebenfalls nicht erforderlich. Ressourcen wie Wörterbücher, Grammatikbücher (auf Englisch), Lemma-Listen und Übersetzungen der Texte werden auf Moodle zur Verfügung gestellt.

Der Kurs wird in Zusammenarbeit mit dem Projekt „Knowledge Networks in Medieval Romance Speaking Europe” (ALMA) organisiert, das an der Heidelberger Akademie der Wissenschaften und der Universität Heidelberg angesiedelt ist. Weitere Informationen zum Projekt finden Sie hier: https://www.hadw-bw.de/en/research/research-center/knowledge-networks-medieval-romance-speaking-europe-alma

Um diesen Kurs zu bestehen, müssen Sie die Annotationsaufgaben während des Semesters sowie eine Abschlussarbeit absolvieren. Weitere Details werden in der ersten Sitzung bekannt gegeben.

Online-Angebote
moodle

Semester: SoSe 2026
Jupyterhub API Server: https://tu-jupyter-t.ca.hrz.tu-darmstadt.de