Zusammenführung von unsicherheitsbehafteten archäologischen und philologischen Fachdatenbeständen mittels Graphdatenbanken Das Französisch-Deutsche Kooperationsprojekt "TEXTELSEM: Texts, Tells and Semantics" führt die philologischen und archäologischen Quellen aus Obermesopotamien im 2. Jahrtausend v.Chr. zusammen und versucht, offene Fragen zur historischen Geographie des Gebietes zwischen Euphrat und Tigris in der mittleren und späten Bronzezeit zu klären. Grundlage dafür ist die Identifikation von archäologischen Fundorten und topographischen Gegebenheiten mit in den Texten genannten Toponymen. Diese Integration von drei sehr unterschiedlichen Quellenbeständen und Wissensdomänen (Archäologie, Geographie, Philologie) im Rahmen einer internationalen Forschungskooperation stellt besondere Anforderungen an die digitale Informationsverarbeitung. In dem seit 2011 im Rahmen einer Förderung von DFG/ANR betriebenen Projekt, an dem neben der Hochschule Mainz auch die Universitäten Berlin, München und Dijon sowie das Collège de France Proche-Orient beteiligt sind, ist die Erfassung der Informationen weitestgehend abgeschlossen und erste Ergebnisse liegen vor. Im Rahmen des Vortrags werden zunächst die spezifischen Herausforderungen des Projekts dargestellt, die von der Gewinnung neuer bis zur Migration vorhandener Datenbestände in zwei Graphdatenbanken reicht. In diesen sind die spezifischen Wissensdomänen modelliert und stehen somit der übergeordneten Auswertung zur Verfügung. Ein besonderes Interesse liegt dabei auf der Repräsentation von Unsicherheit und Vagheit in den Daten. Unsicherheit beschreibt eine nicht ausreichend gesicherte Information, während Vagheit eine unpräzise Information beschreibt. Wenn beispielsweise aus den Aufzeichnungen zu einer vor 100 Jahren durchgeführten archäologischen Ausgrabung nicht mehr sicher die exakte geographische Position, an der gegraben wurde, rekonstruiert werden kann, macht es dennoch Sinn eine grobe Verortung in die Datenbank einzutragen. Zusätzlich könnte man eine Wahrscheinlichkeit angeben, die dann auf zweierlei Arten verstanden werden kann: Als unsichere Aussage bedeutet es, dass es in einem von fünf Fällen korrekt lokalisiert ist und in 4 Fällen nicht. Als vage Aussage wird hingegen die Distanz zur eingetragenen Position beschrieben, es ist also eine unpräzise Lokalisierung gemeint. Der Umgang mit solchen Informationen zur Inferenz und Integritätsprüfung in Graphdatenbanken ist noch weitgehend unerforscht. Der Vortrag gibt einen Ausblick auf die Modellierungs- und Abfragemöglichkeiten von unsicheren und vagen Daten und das Potential, das entsprechende Weiterentwicklungen von Graphdatenbanken bieten würden.