Kooperative Dokumentanalyse in einem interdisziplinären Forschungskolleg. H

19
Kooperative Dokumentanalyse in einem interdisziplinären Forschungskolleg Andreas Becks 1,2 , Ralf Klamma 1 1 Lehrstuhl für Informatik V, RWTH Aachen Ahornstr. 55, D-52056 Aachen Tel.: +49 241 80-21500, Fax.: +49 241 8888-321 www: http://www-i5.informatik.rwth-aachen.de/lehrstuhl/starter.html email: {becks|klamma}@informatik.rwth-aachen.de 2 GMD-FIT, Schloss Birlinghoven, 53754 Sankt Augustin Zusammenfassung. Kooperative Terminologiearbeit ist von entscheidender Bedeutung für das Voranschreiten und die Qualität von Projektarbeit. Insbeson- dere gilt dies für interdisziplinäre Großforschungsprojekte wie dem For- schungskolleg FK/SFB 427 „Medien und kulturelle Kommunikation“. Kooperative Terminologiearbeit ist ein aus mehreren Phasen bestehender Prozess. In den frühen Phasen der Terminologiearbeit kommt der kooperativen Analyse von Dokumentsammlungen eine besondere Rolle zu, um für die Begriffsarbeit relevante Terme zu identifizieren und für die weitere Arbeit zu problematisieren. In dieser Arbeit stellen wir einen methodischen Ansatz zur frühen Phase der Terminologiearbeit mittels Dokumentlandkarten vor und evaluieren ihn. Dieser Ansatz bettet sich natürlich in die Methodik der iterativen, kooperativen Terminologiearbeit ein. Durch die Visualisierung und Interaktion bezieht er alle Beteiligten trotz unterschiedlicher Erfahrungs- hintergründe in die kooperative Analyse ein. Neben der Evaluierung der Methodik kann somit die terminologische Arbeit im Forschungskolleg entschei- dend vorangetrieben werden. 1 Einleitung Kreative Forschungs- und Entwicklungsprozesse in den Geistes- und Kulturwissen- schaften werden zunehmend durch Kooperation und Interdisziplinarität bestimmt, was die wachsende Anzahl geisteswissenschaftlicher Großforschungseinrichtungen belegt. Für die Informatik ist die Aufgabe entstanden, diese Prozesse durch Informa- tionssysteme effektiv zu unterstützen. Daher ist die informationssystem-orientierte Analyse von Kommunikations-, Koordinations- und Kooperationsabläufen sowie der Wissensorganisation in diesen kreativen Prozessen ein wesentlicher Bestandteil zur Definition von Anforderungen und Lösungen. Das interdisziplinäre Forschungskolleg SFB/FK 427 „Medien und kulturelle Kommunikation“ widmet sich in Teilen dieser Aufgabe und ist durch seine Struktur selbst Gegenstand der Untersuchung. Die Arbeit im Kolleg ist entscheidend durch Interdisziplinarität und Kooperation bestimmt. Der Lehrstuhl für Informatik V hat H.-P. Schnurr, S. Staab, R. Studer, G. Stumme. Y. Sure (Hrsg.): Beiträge der 1. Konferenz “Professionelles Wissensmanagement - Erfahrungen und Visionen”, Baden-Baden, 14.-16. März 2001, S.289-307

Transcript of Kooperative Dokumentanalyse in einem interdisziplinären Forschungskolleg. H

Kooperative Dokumentanalyse in einem interdisziplinären Forschungskolleg

Andreas Becks1,2, Ralf Klamma1

1 Lehrstuhl für Informatik V, RWTH Aachen Ahornstr. 55, D-52056 Aachen

Tel.: +49 241 80-21500, Fax.: +49 241 8888-321 www: http://www-i5.informatik.rwth-aachen.de/lehrstuhl/starter.html emai l : { becks| k l amma} @i nf or mat i k . r wt h- aachen. de

2 GMD-FIT, Schloss Birlinghoven, 53754 Sankt Augustin

Zusammenfassung. Kooperative Terminologiearbeit ist von entscheidender Bedeutung für das Voranschreiten und die Qualität von Projektarbeit. Insbeson-dere gilt dies für interdisziplinäre Großforschungsprojekte wie dem For-schungskolleg FK/SFB 427 „Medien und kulturelle Kommunikation“ . Kooperative Terminologiearbeit ist ein aus mehreren Phasen bestehender Prozess. In den frühen Phasen der Terminologiearbeit kommt der kooperativen Analyse von Dokumentsammlungen eine besondere Rolle zu, um für die Begriffsarbeit relevante Terme zu identifizieren und für die weitere Arbeit zu problematisieren. In dieser Arbeit stellen wir einen methodischen Ansatz zur frühen Phase der Terminologiearbeit mittels Dokumentlandkarten vor und evaluieren ihn. Dieser Ansatz bettet sich natürlich in die Methodik der iterativen, kooperativen Terminologiearbeit ein. Durch die Visualisierung und Interaktion bezieht er alle Beteiligten trotz unterschiedlicher Erfahrungs-hintergründe in die kooperative Analyse ein. Neben der Evaluierung der Methodik kann somit die terminologische Arbeit im Forschungskolleg entschei-dend vorangetrieben werden.

1 Einleitung

Kreative Forschungs- und Entwicklungsprozesse in den Geistes- und Kulturwissen-schaften werden zunehmend durch Kooperation und Interdisziplinarität bestimmt, was die wachsende Anzahl geisteswissenschaftlicher Großforschungseinrichtungen belegt. Für die Informatik ist die Aufgabe entstanden, diese Prozesse durch Informa-tionssysteme effektiv zu unterstützen. Daher ist die informationssystem-orientierte Analyse von Kommunikations-, Koordinations- und Kooperationsabläufen sowie der Wissensorganisation in diesen kreativen Prozessen ein wesentlicher Bestandteil zur Definition von Anforderungen und Lösungen.

Das interdisziplinäre Forschungskolleg SFB/FK 427 „Medien und kulturelle Kommunikation“ widmet sich in Teilen dieser Aufgabe und ist durch seine Struktur selbst Gegenstand der Untersuchung. Die Arbeit im Kolleg ist entscheidend durch Interdisziplinarität und Kooperation bestimmt. Der Lehrstuhl für Informatik V hat

H.-P. Schnurr, S. Staab, R. Studer, G. Stumme. Y. Sure (Hrsg.): Beiträge der 1. Konferenz “Professionelles Wissensmanagement - Erfahrungen und Visionen” , Baden-Baden,

14.-16. März 2001, S.289-307

innerhalb des Kollegs die Aufgabe übernommen, sowohl die Analyse kooperativer, interdisziplinärer Prozesse als auch die Einführung kooperativer Informationssysteme auf Grundlage der Analyseergebnisse durchzuführen. In diesem Beitrag steht die kooperative Analyse von Dokumenten als Teil einer allgemeinen, methodischen Vor-gehensweise im Mittelpunkt. Die kooperative Dokumentanalyse hat das Ziel, auf-grund eines vorhandenen Korpus von kolleg-spezifischen Texten der beteiligten Wis-senschaftler terminologische Kulturen innerhalb des Kollegs zu identifizieren und über die Extraktion einer gemeinsamen, basalen Terminologie die Grundlage für eine systematische Terminologiearbeit innerhalb des Kollegs zu schaffen.

Der Rest des Beitrags ist wie folgt gegliedert. Im nächsten Abschnitt wird der Kon-text des Beitrags verdeutlicht und die kooperative Dokumentanalyse in die methodi-sche Vorgehensweise der Analyse kreativer Prozesse eingebettet. Im dritten Abschnitt stellen wir ein Informationssystem vor, das uns als Basis für die Unterstützung der kooperativen Dokumentenanalyse dient. Abschnitt 4 präsentiert die Methodik der kooperativen Dokumentanalyse selbst bevor die im Rahmen des interdisziplinären Forschungskollegs erzielten Ergebnisse vorgestellt und bewertet werden.

2 Kooperative Informationssysteme in den Kulturwissenschaften

Die Rolle der Informatik im Forschungskolleg ist es, vorhandene Informationsflüsse in kulturwissenschaftlichen Projekten medienspezifisch zu untersuchen und Informa-tionssysteme bereitzustellen, die zukünftige, kooperative Arbeit in den Kulturwissen-schaften besser unterstützen. Zu diesem Zweck wird mit dem Meta-Informationssystem MAVIS [20] ein Selbstbeschreibungsinstrument geschaffen, das Betreibern kulturwissenschaftlicher Projekte ermöglicht, Muster der Kooperation und der Wissensorganisation zu beschreiben und mit anderen existierenden Mustern zu vergleichen [24]. Die Möglichkeit, methodische Erfahrungen mit kooperativen Infor-mationssystemen, die in ingenieurwissenschaftlichen Projekten erfolgreich eingesetzt wurden [30, 22, 25], anzuwenden, bietet das kulturwissenschaftliche Forschungskol-leg SFB/FK 427 „Medien und kulturelle Kommunikation“, dessen zentrale Anliegen im folgenden skizziert werden.

2.1 Kulturwissenschaftlicher Forschungskolleg SFB/FK 427 „ Medien und kulturelle Kommunikation“

Der Wandel der Buchkultur im Kontext eines allgemeinen Medienwechsels ist der zentrale Ausgangspunkt des Kulturwissenschaftlichen Forschungskollegs 427 "Me-dien und kulturelle Kommunikation", das am 1. Januar 1999 an der Universität Köln seine Arbeit aufnahm. Als weitere Hochschulen sind die RWTH Aachen sowie die Universität Bonn an diesem ersten Projektverbund beteiligt.

Im Forschungskolleg arbeiten Vertreter der Fächer Sprach- und Literaturwissen-schaft, Kunstgeschichte, Psychologie, Neurolinguistik, Ethnologie und Informatik eng zusammen. Insgesamt umfasst das Kolleg vierzehn Teilprojekte. Sie alle eint das Interesse an drei Fragestellungen:

1. Wie wirken sich in Vergangenheit, Gegenwart und Zukunft mediale Differenzen auf die weltweite Kultur aus?

2. Wie hat sich im Medienwechsel die kulturelle Kommunikation in der Gesamtbe-völkerung und im Kulturbetrieb verändert, wie wird und sollte es weitergehen?

3. Wie ist die Medienforschung an ihren Gegenstand herangegangen, was kann sie in der Zukunft besser machen?

Insbesondere werden die Entwicklung und Nutzung von kooperativen Informati-onssystemen, z.B. das BSCW-System [9] der GMD, als neue Arten der Kommunika-tion unter Wissenschaftlern untersucht. Das Forschungskolleg, an dem etwa 30 Wis-senschaftler der drei Universitäten beteiligt sind, bietet erstmals die Möglichkeit, die Auswirkungen der Medien im großen Zusammenhang fachübergreifend und konzent-riert analysieren zu können.

2.2 Medienanalyse im Forschungskolleg

Die medienspezifische Untersuchung der Informationsflüsse setzt zunächst voraus, dass der Einsatz von Medien verstanden wird. Dazu wurde eine Analyse in fünf Schritten durchgeführt:

Die informatische Grobanalyse kulturwissenschaftlicher Kooperationsprozesse und Wissensorganisation aufgrund von Literaturanalysen erbrachte eine Vielzahl von Kooperationsprozessen, z.B. kooperative Schreib- und Leseprozesse, Editionsarbeit, Ausstellungskonzeptionierung, so dass kollegspezifisch zunächst die kooperative Terminologieentwicklung als Untersuchungsgegenstand ausgewählt wurde. An der kooperativen Terminologiearbeit lassen sich sowohl der traditionelle Einsatz von Medien als auch die Auswirkungen medialer Umbrüche sehr gut studieren. Sie ist zudem für die Stabilisierung und Entwicklung der interdisziplinären und kooperativen Arbeitsweisen im Kolleg von Bedeutung.

In einer konzeptuellen Detailanalyse der Informationsflüsse und Mediennutzung wurde zunächst mit im Kolleg vertretenden „großen“ Teilprojekten (jeweils vier bis fünf Forscher und zusätzliche Hilfskräfte) Gruppenworkshops durchgeführt, in denen die in [30, 22] beschriebene arbeitsplatzorientierte Informationsflußanalyse durchge-führt wurde. Dabei erstellte jedes Teilprojekt eine „ Innen- und Außensicht“ der In-formationsflüsse ihrer Teilprojekte, so dass zügig die im Laufe des ersten Kollegjah-res entstandenen Informationskanäle, die benutzten Medien und die Qualität der In-formationsflüsse bestimmt werden konnten. Das Ergebnis der abschließenden Diskus-sion war, das viele Informationsflüsse auf zu informeller Ebene ablaufen und von der Anwesenheit einzelner abhingen. Es wurde beschlossen, diese Informationsflüsse im Bereich der Terminologiearbeit durch die Einführung von Informationssystemen, die für die Aufrechterhaltung und Persistenz der Informationsflüsse genutzt werden soll-ten, zu unterstützen. Die bei den Workshops vertretenden Projekten entsandten Ver-treter in eingerichtete Arbeitsgruppe „Terminologie“.

Im dritten Schritt wurden vom Lehrstuhl für Informatik V verschiedene Systeme zur kooperativen Terminologiearbeit vorgestellt und in der Arbeitsgruppe gemeinsam diskutiert. Ziel dabei war die iterative Entwicklung und Erprobung einer angepassten Unterstützungsumgebung. Dabei wurde schnell deutlich, dass dedizierte Systeme zur Terminologiearbeit erst dann eingesetzt werden können, wenn terminologische Kultu-

ren innerhalb des Kollegs identifiziert werden können und aus der Analyse der vor-handenen elektronischen Dokumente (Aufsätze, Tagungsankündigungen, Protokolle von Kolloquien und Seminaren) ein Satz relevanter Terme extrahiert wird, die als „Brückenterme“ die kooperative Terminologiearbeit einleiten. Zur Unterstützung dieses Arbeitsschrittes wurde der Einsatz sogenannter „Dokumentenlandkarten“ vor-geschlagen und eingehend untersucht. Durch eine mitlaufende Auswirkungsanalyse wird die hier vorgeschlagene Methodik evaluiert und verfeinert.

Der Rest des Beitrags konzentriert sich auf diesen Aspekt. Wir stellen nun zu-nächst das Konzept der Dokumentenlandkarten vor und beschreiben anschließend eine darauf aufbauend entwickelte Methode der kooperativen Dokumentenanalyse.

3 Dokumentenlandkar ten

Dokumentenlandkarten veranschaulichen inhaltliche Ähnlichkeitsbeziehungen zwi-schen Textdokumenten und Dokumentengruppen intuitiv durch eine grafische Dar-stellung. In der Literatur sind verschiedene Metaphern und Granularitäten der Darstel-lung vorgeschlagen worden, z.B. zwei- oder dreidimensionale Punktwolken [12, 35] und 3D-Landschaften [14] zur Visualisierung von Dokumentenähnlichkeiten oder Kategorienkarten [13] zur Präsentation der Gruppenstruktur des Textkorpus.

Das allen Ansätzen gemeinsame Prinzip ist, dass die Ähnlichkeit von Dokumenten oder Dokumentengruppen durch räumliche Distanz ausgedrückt wird: Je ähnlicher zwei Texte oder Kategorien sind, desto näher liegen ihre Darstellungen auf der Karte zusammen. Auf diese Weise ist es möglich, die Themendichte oder Themenverwandt-schaft eines Textkorpus zu studieren. Die Granularität der Texte, also die Frage, ob ein Text ein Sinnabschnitt eines größeren Dokuments, ein ganzes Kapitel oder ein komplettes Dokument umfasst, hängt letztlich von der Natur der Texte und der Auf-gabenstellung ab.

Der Einsatz von Dokumentenlandkarten ist sinnvoll, wenn ein explorativer Zugang zu Textsammlungen notwendig ist, also nicht zielgerichtet nach sehr abgegrenzten Informationen gesucht wird und Fragestellungen a priori nicht präzise genug formu-liert werden können, um anfrageorientierte Retrievalsysteme einzusetzen. Typische explorative Fragestellungen sind etwa, in welchem inhaltlichen Kontext einzelne Dokumente stehen und wie stark verschiedene Dokumentengruppen miteinander in Verbindung stehen.

Wir haben speziell für die explorative Analyse von thematisch spezialisierten Text-sammlungen eine Methode entwickelt und im prototypischen System DocMINER (Document Maps for Information Elicitation and Retrieval) realisiert, die sich u.a. durch die Kombination zweier Eigenschaften von anderen Ansätzen unterscheidet (eine Übersicht über Methodik und System findet sich in [6,7]): Für die Visualisie-rung wurde ein Verfahren gewählt, das die Topologie des Dokumentenraums, also die inhaltlichen Verwandtschaftsbeziehungen, sehr leistungsfähig auf eine zweidimensio-nale Karte abbildet [33]. Wesentlich für die Arbeit mit thematisch hochspezialisierten Texten ist, dass die Methodik des Dokumentenvergleichs austauschbar ist. So können bei Bedarf statistische aber auch spezialisierte wissensbasierte Verfahren [8] einge-setzt werden.

3.1 Das interaktive Dokumentenlandkar tensystem DocMINER

In der von DocMINER verwendeten Visualisierungsmetapher stellen benachbarte Dokumente, dargestellt durch grafische Symbole, Texte mit verwandtem Inhalte dar. Je stärker sich die Texte thematisch unterscheiden, desto weiter liegen sie auch auf der Karte entfernt. Dieser Eindruck wird zusätzlich – ähnlich einer Höhenkarte – durch eine Farbverteilung gestärkt: Gruppen verwandter Dokumente liegen in ge-meinsamen, hellen „Tälern“ und werden durch dunkle, unterschiedlich hohe „Berge“ getrennt. Je dunkler die Hintergrundfarbe, desto stärker liegen die Gruppen inhaltlich auseinander (Abb. 1).

Eine Dokumentenlandkarte ist als visuelle Darstellung zunächst passiv. Eine Reihe von Interaktionsmöglichkeiten hilft dabei, eine gegebene Textsammlung schrittweise zu erkunden und Informationen über die Sammlung auf unterschiedlichem Granulari-tätsgrad zu erhalten. Zunächst können Dokumente durch Klicken auf die Dokumen-tensymbole geöffnet werden. Jedes Dokumentensymbol kann durch den Titel des Dokuments beschriftet werden. Für die Dokumentenpunkte können verschiedene

Abb. 1. Benutzerschnittstelle des interaktiven Dokumentenlandkartensystems. Die Ergebnisdo-kumente zur Anfrage „Fernsehen“ sind in der Karte durch helle, konzentrische Rechtecke hervorgehoben. Die Dokumente des ausgewählten Feldes rechts unten sind mit Schlagworten beschriftet. Die Registerkarte rechts zeigt die charakteristischen Begriffe der gesamten gewähl-ten Gruppe. Unter der Karte: Legende der verwendeten Dokumentensymbole.

grafische Symbole festgelegt werden. Auf diese Weise ist es möglich, vorgegebene Kategorien oder auch während der Arbeit gebildete Klassen optisch hervorzuheben und ihre Zusammenhänge gezielt zu studieren. Auch eine Schlagwortsuche in der Textsammlung ist möglich, wobei das Ergebnis der Suche nicht nur eine Liste der gefundenen Texte ist. Vielmehr werden die entsprechenden Punkte auf der Karte hervorgehoben, so dass auch der Zusammenhang des Ergebnisses mit der Karten-struktur untersucht werden kann (Abb. 1).

Im Rahmen der Dokumentenanalyse im Forschungskolleg ist noch eine weitere Funktion wichtig: Um den Inhalt einer beliebigen Dokumentengruppe zu „charakteri-sieren“, kann die Verteilung der statistisch relevanten Schlagwörter für ausgewählte Gruppen berechnet und angezeigt werden. Dabei wird unterschieden zwischen (a) Begriffen, die in der Gruppe besonders häufig vertreten sind, (b) Termen, die in allen gewählten Dokumenten vorkommen, (c) Termen, die eine gewählte Gruppe gut cha-rakterisieren, d.h. Begriffe, welche die Gruppe vom Rest der Sammlung differenzie-ren. Diese Maße werden weiter unten detaillierter besprochen.

3.2 Er fahrungen in technischen Disziplinen

Anhand mehrerer Fallstudien in technischen Anwendungsdisziplinen haben wir unse-ren Dokumentenlandkartenansatz für verschiedene Aufgaben der Analyse von Text-sammlungen studiert: Im Rahmen des von der EU geförderten Projekts CAPE OPEN, in dem Schnittstellen für chemische Prozeßsimulatoren standardisiert wurden, ist unser Landkartensystem zur Untersuchung von kollaborativ erstellten Use Cases (Anwendungsbeschreibungen der Simulatoren für die Anforderungsanalyse) einge-setzt worden [5]. Das Augenmerk lag hierbei auf der Frage, wie einzelne Anwen-dungsszenarien zusammenhängen und wie beschriebene Module miteinander inter-agieren. Eine andere Fallstudie beschäftigte sich mit der Qualitätsprüfung technischer Produktinformationen [3]. Die zugrundeliegende Frage war dabei, ob die inhaltliche Kapitelstruktur komplexer Benutzerhandbücher konsistent aufbereitet war. Schließ-lich spielt im Kontext technischer Dokumentation auch die Verdichtung von Informa-tionen und die Schaffung von einheitlichen Informationsquellen (Single Sources) eine wichtige Rolle. Hier können Dokumentenlandkarten das Management von umfangrei-chen Sammlungen technischer Texte visuell unterstützen [4].

In den skizzierten technischen Disziplinen hat sich der Einsatz von Dokumenten-landkarten als fruchtbar herausgestellt. Als Mehrwert ist insbesondere das einfache Zurechtfinden in komplexen Textsammlungen und die Möglichkeit zu nennen, schnell einen intuitiven Überblick über die Struktur des Korpus zu erlangen und Ein-sichten in thematische Zusammenhänge explorativ zu gewinnen.

4 Kooperative Dokumentanalyse mit Dokumentenlandkar ten

4.1 Sinn und Zweck kooperativer Dokumentanalysen

Kooperative Dokumentanalyse ist ein wichtiger Bausstein der Terminologiearbeit. Wesentlich für die sinnvolle Definition einer Terminologie ist es, dass die Beteiligten ein gemeinsames Verständnis der jeweils zu definierenden Begriffe entwickeln. In der Projektarbeit ist das sogenannte Vokabularproblem (die Wahrscheinlichkeit, dass zwei Personen den gleichen Term benutzen, liegt unter 20 % [19]), ein echte Barriere interdisziplinärer Arbeit. Deswegen ist die Problematisierung der Termnutzung inner-halb der kulturwissenschaftlichen Teildisziplinen für die Möglichkeit interdis-ziplinären Arbeitens unumgänglich. Bei fehlender Problematisierung werden bei der Lektüre oder in der Diskussion vertraute Terme aus der eigenen Disziplin heraus falsch interpretiert, oder der Bedeutungstransfer unüblicher Termnutzung wird er-schwert.

Kooperatives Arbeiten ist somit in der Terminologiearbeit, insbesondere in der normenden Terminologiearbeit (vgl. DIN 820 [16] und DIN 2339/1 [15]), ein ent-scheidender Erfolgsfaktor. Kognitionspsychologische [31, 29], philosophisch-logische [11] und linguistische [18, 34] Ansätze konzentrieren sich auf Fragen der Repräsentation von Terminologien. Die informatische Unterstützung dieser Ansätze ist weit entwickelt, z.B. in WordNet [28], Ontolingua [17] und ConcepTerm [10], vernachlässigen aber weitestgehend kooperative Aspekte. Weiterhin lässt sich konsta-tieren, dass informatische Ansätze sich bislang auf späte Phasen der Terminologiear-beit konzentrieren [2] oder adäquate Infrastrukturen zum Informations- und Doku-mentenaustausch und virtuellen Treffen zur Verfügung stellen, wie dies beispielswei-se mit dem BSCW-System [9] realisiert wird. Solche Systeme tragen zum Gruppen-bewußtsein (Awareness) bei, indem ein „kooperativer Internetschreibtisch“ die Transparenz der Ereignisse in der Gruppe erhöht. Der Terminologie-Server „concept“ [1,2] unterstützt drei Aspekte der kooperativen Terminologiearbeit: Erstens wird der Prozeß selber, wie er von der DIN 2339/1 [15] bzw. ISO 10241 [21] vorgeschlagen wird, begleitet, zweitens ermöglicht das System die Definition und automatische Überprüfung von projekt- oder anforderungsgetriebenen Qualitätsmerkmalen inner-halb von Terminologien. Ebenso enthält „concept“ eine Kooperationskomponente, die – ähnlich dem BSCW-System – terminologische Entwicklungen, z.B. Hinzufügen eines Synonyms, der Gruppe nach einstellbaren Interessenprofilen mitteilt.

In dem durch diese Werkzeuge aufgespannten Spektrum ist allerdings noch Raum für weitere Unterstützung: In frühen Phasen der Terminologiearbeit liegt weder die Struktur des zu erstellenden Begriffssystems noch eine ausreichend große Menge von abgestimmten Begriffsbeschreibungen fest. Zudem ergibt sich in dem hier beschrie-benen interdisziplinären Kontext die Schwierigkeit, dass die beteiligten Fachwissen-schaftler nicht im gleichen Maße mit formalen informatischen Methoden vertraut sind. Daher bietet sich eine explorative und iterative Herangehensweise an die späte-re, formale Definition der Terminologie an, um die Eintrittsschwelle in die Termino-logiearbeit zu senken.

Aus methodischer Sicht muß die aktuelle und möglicherweise zu Verständnisprob-lemen führende Termnutzung zwischen den Disziplinen problematisiert werden. Dazu ist die kooperative Dokumentanalyse ein geeignetes Mittel, da sie auf persistenten Dokumenten beruht und daher eine statistische Auswertung der aktuellen Termnut-zung ermöglicht. Eine grafische Aufbereitung des Datenmaterials – wie sie durch Dokumentenlandkarten realisiert wird – ermöglicht den explorativen und iterativen Zugang zu dem statistisch aufbereiteten Material. Ein solcher Ansatz verspricht daher, die Diskussion zwischen den Disziplinen zu fördern.

4.2 Die Rolle der Dokumentenlandkar ten

Aufbauend auf die aus den technischen Anwendungsfeldern gewonnenen Erfahrun-gen ist es das Ziel, im Kontext der Terminologiearbeit in interdisziplinären und ko-operativen kulturwissenschaftlichen Projekten eine Methodik für den Einsatz von Dokumentenlandkarten zu entwickeln. Im Vordergrund steht dabei die Notwendig-keit, den beteiligten Fachwissenschaftlern Einblick in die Verwendung wichtiger Begriffe in den jeweiligen Bereichen zu geben und zu verstehen, in welchen anderen Kontexten solche Begriffe außerdem eine Rolle spielen. Gesucht wird somit eine Möglichkeit, explorativ und kooperativ die Begriffsstrukturen zu erkunden.

Da die im Kolleg erstellten Dokumente (Publikationen, Anträge, Protokolle, Ver-anstaltungsunterlagen) die jeweils verwendete Begriffswelt fixieren, stellen sie die Grundlage der kooperativen Dokumentenanalyse und der Terminologiearbeit dar. Aufgrund der Heterogenität der Teilprojekte und der interdisziplinären Natur des Gesamtprojektes ist eine erste und zugleich grundlegende Frage dabei, welche Teil-projekte begriffliche Überschneidungen haben und welche eher „ isoliert“ sind. Zudem muß die Verwendung identifizierter relevanter Terminologien in allen Teilbereichen diskutiert und verstanden werden.

Das Dokumentenlandkartensystem DocMINER ist geeignet, Zusammenhänge zwi-schen Texten auf einer solchen feingranularen Ebene darzustellen. Zudem bieten seine interaktiven Funktionen die Möglichkeit, Textzusammenhänge schrittweise zu erkunden. Damit bietet eine Landkarte von Kollegdokumenten potentiell eine ge-meinsame Basis für die Erkundung der derzeit eingesetzten Terminologie und kann als „Diskussionsmotor“ fungieren. Allerdings muß der anwendungsspezifische Ein-satz eines solchen Systems zuvor methodisch festgelegt werden, um eine fruchtbare Verwendung für die kooperative Terminologiearbeit zu gewährleisten. Ausgehend von dem skizzierten Anforderungsprofil und den Erfahrungen aus den technischen Fallstudien haben wir daher die folgende Methodik der kooperativen Dokumenten-analyse mit Dokumentenlandkarten entwickelt und im Rahmen einer vorbereitenden Kollegsitzung verfeinert.

Angestrebt wird die grafische Darstellung der Strukturierung der Fachbeiträge nach den verwendeten Begriffen. Zunächst ist die Frage zu beantworten, auf welcher Granularitätsstufe die Analyse der Texte stattfinden soll. Da die Dokumente in der Regel nicht als monolithische Abhandlungen zu verstehen sind, sondern sich in the-matische Teilbereiche gliedern, sind sie in einzelne „Sinnabschnitte“ zerlegt worden. Diese Aufteilung ist, nach einer gemeinsamen Diskussion des Vorgehens, den jewei-ligen Autoren überlassen worden. Weitere Details hierzu finden sich im Abschnitt

4.3. Die so entstandenen Dokumente sollen auf ihre terminologische Ähnlichkeit hin untersucht werden. Die hierzu verwendet Methode wird im Abschnitt 4.4 skizziert.

Ist nun eine geeignete Dokumentenlandkarte gegeben, so muß ein gemeinsames Vorgehen zur Analyse bereitgestellt werden. Aufgrund der kooperativen Natur der Terminologiearbeit haben wir und zu einer moderierten Analyse im Rahmen von Kollegworkshops entschieden. An den Sitzungen nehmen jeweils ca. 15 Projektmit-glieder teil. Das Dokumentenlandkartensystem wird vom Moderator bedient und ist per Beamerprojektion allen Teilnehmern sichtbar. Das Analysevorgehen gliedert sich im wesentlichen in 3 Phasen:

1. Analyse der visuellen Darstellung: Da es zunächst darum geht zu untersuchen, welche Teilprojekte terminologisch kohärent sind und welche prinzipiellen Beg-riffswelten es gibt, werden die auf der Karte sichtbaren Hauptgruppen bestimmt und deren Zusammenhänge diskutiert. Schon auf dieser Ebene kann untersucht werden, ob möglicherweise „Brückendokumente“ vorhanden sind, die verschiede-ne Gruppen miteinander verbinden und deshalb auf der Karte in Grenzbereichen zwischen Textgruppen liegen.

2. Finden von relevanten Begriffen für Gruppen: Für die identifizierten Gruppen und Teilgebiete werden statistisch signifikante Terme bestimmt (die Methode ist in Ab-schnitt 4.5 vorgestellt). Aus den so erstellten Termlisten werden diejenigen Begrif-fe ausgewählt, die tatsächlich fachlich von Bedeutung sind und einen potentiellen Baustein der terminologischen Kultur des Kollegs liefern. Die Bedeutung und Verwendung der spezifizierten Begriffe kann von den jeweiligen Autoren erklärt und gemeinsam diskutiert werden.

3. Cross-Check: Wo tauchen diese Begriffe noch auf und wo sind sie besonders häu-fig vertreten? Diese Frage kann recht einfach durch eine Schlagwortsuche beant-wortet werden. Die visuelle Darstellung des Anfrageergebnisses hilft den Beteilig-ten, die Häufigkeit und die Kontexte des Begriffs schnell zu erfassen. Damit kann die gezielte Diskussion über weitere Begriffsverwendungen geleitet werden.

Obgleich diese Schritte nicht als strenges Phasenmodell zu verstehen sind fördern sie doch den strukturierten Umgang mit dem Werkzeug in den ansonsten durch le-bendige Diskussion gekennzeichneten Sitzungen.

4.3 Akquisition und Vorbereitung der Dokumente

Die zur Datenanalyse verwendeten Dokumente wurden von den Autoren nach deren Einschätzung in Sinneinheiten zergliedert. Dabei wurden Fußnoten, die nur bibliogra-fische Hinweise enthielten, komplett entfernt, weil diese nicht die aktuelle Termnut-zung widerspiegelt, sondern lediglich dem Quellennachweis dient. Das gleiche gilt für die Literaturverzeichnisse. Fremdsprachliche Zitate und Abbildungen wurden eben-falls entfernt. Schließlich wurden die Teildokumente kanonisch benannt, so dass sie später leichter in ihrem jeweiligen Kontext identifiziert werden können. Diese Benen-nung enthielt neben einem deskriptiven Titel auch eine Teilprojekt- und Dokumenten-sequenzcodierung. Auf diese Weise sind 128 Einzeldokumente mit einer durch-schnittlichen Länge von 758 Wörtern entstanden.

Die Autoren legten die vorbereiteten Teildokumente in dafür vorgesehene Ordner des BSCW-Systems, die von allen Mitarbeitern eingesehen werden konnten. Die Entscheidung, dieses Gruppenwerkzeug zu nutzen, ermöglichte den nachvollziehba-ren Austausch von Dokumenten innerhalb der Gruppe und förderte zudem die konsi-stente Aufbereitung des zu analysierenden Materials. Der Austausch- und Aufberei-tungsprozeß selber nahm insgesamt 15 Arbeitstage in Anspruch. Die beschriebene Vorbereitungsmethodik wurde zuvor diskutiert und anschließend schriftlich auf dem BSCW-Server fixiert.

4.4 Durchführung der Kar tengener ierung

Die eingesetzte Dokumentenlandkarte soll als Basis für die kooperative Diskussion von verwendeten Begriffen dienen. Daher ist es wichtig, dass die dargestellten Do-kumentenähnlichkeiten hier auf der reinen Begriffsverwendung beruhen. Folgerichtig wurde deshalb mit dem Vektorraummodell [32] ein schlagwortorientiertes Verfahren zum Dokumentenvergleich gewählt. Zur Indexierung der Dokumente wurden zu-nächst Stoppworte entfernt, wobei eine domänenspezifisch erweiterte Liste mit Funk-tionswörtern eingesetzt wurde, und die verbliebenen Terme mit einem Stemming-Algorithmus auf ihre Wortstämme reduziert. Die so gewonnenen Indexierungsterme (im Schnitt 280 pro Dokument) wurden mit dem tf×idf-Maß (Termhäufigkeit × inver-se Dokumentenhäufigkeit) gewichtet. Ein Thesaurus ist bewußt nicht verwendet wor-den, da ein solcher ja im Rahmen der Terminologiearbeit selber entstehen soll und die Kartengenerierung nicht durch „ terminologische Voreingenommenheiten“ beieinflußt werden sollte. Schließlich sind die normalisierten Dokumentenbeschreibungsvektoren mit dem Cosinus-Maß miteinander verglichen worden.

Die daraus resultierenden Dokumentenähnlichkeiten sind durch eine lineare Trans-formation in (nicht-metrische) Distanzwerte überführt worden, welche schließlich als Basis für die Kartenberechnung gedient haben (Details zur Methode der Kartenbe-rechnung finden sich in [6]). Um die weiteren Schritte kurz zu umreißen: Aufgrund der errechneten Distanzwerte ist zunächst mit einem Verfahren des Mehrdimensiona-len Skalierens ein 100-dimensionaler Vektorraum konstruiert worden, in dem Vertre-ter für jedes Dokument distanzerhaltend abgebildet sind (die durchschnittliche Ab-weichung der Distanz der Dokumente im konstruierten Dokumentenraum zu den errechneten Distanzen liegt hier bei unter 7%). Schließlich wurde eine selbstorgani-sierende Merkmalskarte [27] mit den Vektoren des konstruierten Dokumentenraums trainiert und die im Netz enthaltene topologische Information durch ein Visualisie-rungsverfahren extrahiert [33]. Die auf diese Weise entstandene Karte ist in Abbil-dung 1 dargestellt.

Die verwendeten Dokumentensymbole auf der Karte zeigen jeweils, zu welchem Teilprojekt des interdisziplinären Forschungskollegs das jeweilige Dokument gehört. Dies dient zum einen der leichteren Navigation auf der Karte, aber auch als Grundla-ge für die Diskussion der begrifflichen Zusammenhänge zwischen thematischen Teil-bereichen.

4.5 Termprofile zur Charakter isierung von Dokumentengruppen

Während der kooperativen Dokumentenanalyse spielt die Möglichkeit eine wichtige Rolle, zu visuell ausgewählten Dokumentengruppen verschiedene Termprofile zu berechnen, die Aufschluß über die jeweils verwendeten Begriffe in einer Dokumen-tengruppe geben können. Bei diesen Termprofilen handelt es sich um sehr einfache Maße, die im folgenden näher beschrieben werden. Dabei wird jedes Dokument – im Sinne des Vektorraummodells [32] – als gewichtete Liste von Indexierungstermen aufgefasst. Sei T = { t1,...tn} die Menge der verwendeten Indexierungsterme und d = (d1,...,dn) der Beschreibungsvektor eines Dokuments. Die di sind dabei die reellwerti-gen Gewichte des Terms ti ∈ T. Sei D die Menge aller Dokumente der Sammlung und Γ ⊆ D eine Dokumentengruppe. Dann ist das Summenprofil der Gruppe Γ, pS (Γ), definiert als

pS (Γ) =def

�Γ∈i id

d .

Die k Terme ti1,...,tik mit den höchsten Gewichten aus pS (Γ) bezeichnen wir als sig-nifikante Terme. Dieses Termprofil zeigt also an, welche Begriffe besonders stark in der Gruppe vertreten sind.

Das Verhältnisprofil der Gruppe Γ, pR (Γ), ist definiert durch

pR (Γ) =def ( )

)(

)( 2

Dp

p

S

S Γ.

Die k Terme ti1,...,tik mit den höchsten Gewichten aus pR (Γ) bezeichnen wir als charakteristische Terme. Begriffe aus diesem Termprofil sind in der gewählten Grup-pe stärker gewichtet als im Rest der Kollektion. Allerdings können „Ausreißer“, also Begriffe, die in einem Dokument besonders wichtig sind und auch nur dort vorkom-men, dieses Maß dominieren. Dieser Effekt kann bereinigt werden, indem jede Term-komponente aus pR (Γ) noch mit dem Anteil der Dokumente in Γ multipliziert wird, in denen der korrespondierende Term vorkommt.

4.6 Die Bedeutung von Termprofilen und Brückentermen

Für die kooperative Dokumentenanalyse als Teilprozeß bei der Terminologiearbeit bieten die Termprofile eine einfache Möglichkeit, einen Einstiegspunkt in die Beg-riffsdiskussion zu finden. So können auf Grund der Begriffsverwendung verwandte Dokumentengruppen untersucht und die signifikanten oder charakteristischen Terme betrachtet werden. Da in der Regel kein Termprofil eine Gruppe scharf abgrenzt, können manche Begriffe auch in anderen Bereichen eine Rolle spielen. Z.B. ist der Begriff „Fernsehen“ zentral für das Teilprojekt C5 (Irmela Schneider): „Mediendis-kurse in ihrer Relevanz für das kulturelle Selbstverständnis der Bundesrepublik Deutschland“, aber dieser Term hat auch in Forschungsprojekten eine Bedeutung, die sich inhaltlich mit medialen Differenzen und apparativen Technikstrukturen ausei-nandersetzen. Für die Diskussion können solche Brückenterme durch einfache Suche visualisiert werden.

5 Ergebnisse und deren kooperative Diskussion

Die Vorstellung der Analyseergebnisse und die Diskussion mit den beteiligten Wis-senschaftlern wurden als zweistündige Workshops organisiert. Zunächst wurde der Kontext der Terminologiearbeit wiederhergestellt, das oben beschriebene Verfahren und das verwendete Werkzeug DocMINER mit den verwendeten Maßen sowie der Aufbau der Textkollektion eingeführt. Der zentrale Teil der Workshops war die ko-operative Diskussion der Korpusstruktur, wie sie durch die Dokumentenlandkarten (Abbildung 2) vermittelt wurde. Um in die Diskussion einzuführen, wurden die Termprofile einzelner Textgruppen näher erläutert.

Als erstes Ergebnis konnte festgehalten werden, dass Dokumente, die in Teildo-kumente zergliedert wurden, auf der Karte in gleichen bzw. eng benachbarten Gebiete zusammenhängend wieder erschienen. Beim Gesamtantrag (Einführung), an dessen Fertigstellung alle Teilprojekte in unterschiedlichen Maßen beteiligt waren, der von einer fünfköpfigen Schlussredaktion betreut wurde und der die Gesamtheit des For-schungskollegs widerspiegeln soll, ist trotz eines zusammenhängenden Gebietes auf der Landkarte auch Abgrenzungen zwischen den einzelnen Passagen zu erkennen, was auf die Vielfalt der zu behandelnden Fragestellungen und die Besonderheiten der einzelnen Fachdisziplinen hindeutet. Das Gruppenprofil dieses Teilgebietes betont generische Begriffe wie „Kommunikation“, „Schnittstelle“, „Medium“, „Medientheo-rie“, „Technik“ sehr stark.

Eine zweite interessante Beobachtung ist, dass ein Projekt, das in einer späten Pha-se der Antragserstellung zum Kolleg gestoßen ist, sich an der Einführung orientiert hat, was die Karte belegt (siehe Abbildung 2): Das mit „①“ beschriftete Dokument aus Projekt B1 und der Text „②“ aus der Einführung des Gesamtantrags (Mitte der Karte) liegen recht dicht nebeneinander. Wichtige gemeinsame Begriffe sind „Ver-netzung“, „ Informatik“ und „Kommunikation“. Der Grund ist, dass das Projekt B1 (Informationssysteme) erst während der Phase der Antragsstellung hinzukam und daher Vorversionen der Antrags-Einführung zur Verfügung hatte bzw. im Antrag mit eigenen Textbeiträgen vertreten war. Zudem gab es einen Vernetzungsprozess, in dem mögliche Kooperationen zwischen Einzelprojekten in den Einzelanträgen schriftlich fixiert wurden. Die Bedeutung für die Terminologiearbeit ist, dass sich die informati-sche Terminologie trotz des späten Einstiegs im Gesamtantrag findet.

Das Teilprojekt C5 (Fernsehen, Gebiet „A“ auf der Karte) weist terminologisch nur wenige Gemeinsamkeiten mit den anderen Bereichen auf. Charakteristische Terme sind „Mediendiskurs“, „Rundfunk“, „Fernsehen“ oder „Konsument“. Dies ist ein Beispiel für die sehr eigenständige Begriffswelt der heutigen Massenmedien. Interes-sant ist in diesem Zusammenhang, zu fragen, wie die sehr speziellen Begriffe in den wenigen anderen Texten, die sie verwenden, verstanden werden. So wird etwa der Begriff „Fernsehen“ zwar im wesentlichen in C5 verwendet, er spielt aber im Kontext der „Schnittstellenbildung durch apparative Technikstrukturen“ in Teilprojekt A3 eine Rolle (siehe auch Anfrageergebnis in Abbildung 1). Die Diskussion zeigte, das der Begriff in C5 eher im Sinne eines Mediendiskurses verwendet wird, in A3 hingegen als Medium selber. Auf diese Weise ist mit der Dokumentenlandkarte bereits ein wesentlicher Brückenterm identifiziert worden, der in der späteren Terminologiedefi-nition problematisiert werden muss.

Die Analyse verdeutlichte auch, dass Texte, die teilweise von einem Autor bearbei-tet wurden, trotzdem terminologisch in verschiedene Gruppen fielen. Markant war ein Wissenschaftler, der sowohl die Schlussredaktion des Antrags gestaltete als auch mit wissenschaftlichen Beiträgen in der Kollektion vertreten waren (Teilprojekt A3, Ge-biet „B“ in Abbildung 2). Beide Textgruppen haben eigene charakteristische Grup-penprofile, derart, dass im Antragstext generellere Termini wie „Schnittstelle“ und „Medium“ verwendet wurden, in seinen wissenschaftlichen Beiträgen hingegen mit konkreten Instanzen wie „Schreibtisch“ und „Internet“ gearbeitet wurde. Da auf einen Thesaurus bewusst verzichtet wurde, brachte die Diskussion die hinter der terminolo-gischen Auswahl liegenden Entscheidungen zu Tage.

Ein weiterer im Rahmen des Forschungskollegs wichtiger Begriff ist der Term „Hypertext“ . Dieser Begriff ist prominent in einer Reihe von Texten, die von ver-schiedenen Autoren produziert wurden (siehe Anfrageergebnis in Abbildung 2). Eine gemeinsame Konferenz zu diesem Thema wurde vom Kolleg veranstaltet. Trotzdem taucht der Begriff im Gesamtantrag nur kursorisch auf. Die Schlussredaktion ent-schloss sich damals, ihn durch den aus ihrer Sicht umfassenderen Begriff „Hyperme-dialität“ zu ersetzen, auch weil der Dreiklang „Medialität – Intermedialität – Hyper-medialität“ , die Themensetzung des Projektbereichs A – deutlicher machte.

Der letzte bisher durchgeführte Workshop verdeutlichte, neben detaillierten termi-nologischen Diskussionen, die strategische Bedeutung der Dokumentlandkarten für

①②

A

B

Abb. 2. Dokumentenlandkarte der Kollegdokumente und Legende der Symbole. Im Text refe-renzierte Dokumente und Gebiete sind gekennzeichnet. Die hellen, konzentrischen Rechtecke deuten Dokumente an, die zur Anfrage „Hypertext“ passen.

die interdisziplinäre Arbeit im Kolleg sowie für die im Jahre 2001 zu erfolgende Neu-beantragung des Kollegs. Einer der Direktoren des Kollegs stellte fest, dass die Do-kumentlandkarte die Rolle des zentralen Selbstbeobachtungsinstruments des Kollegs einnimmt. Der wissenschaftliche Geschäftsführer schlug unter allgemeiner Zustim-mung vor, einen „historischen Terminologieatlas“ des Kollegs zu entwickeln, der die Entwicklung der Termverwendung im Kolleg dokumentiert. In der Folge hat sich der Umfang der in der Kollektion vertretenden Dokumente innerhalb weniger Wochen mehr als verdoppelt. Die Kollektion umfasst nunmehr den kompletten Finanzierungs-antrag des Kollegs sowie wesentliche Publikation von Kollegmitgliedern. Diese Kol-lektion, die auch die eingereichte Version des vorliegenden Papiers umfasst, ist in Abbildung 3 dargestellt.

6 Bewertung

Wir haben unseren methodischen Ansatz ebenfalls im Rahmen der Kollegworkshops kooperativ bewerten lassen. Zur Einführung in die Evaluierungsphase haben wir drei mögliche, aber nicht verbindliche Fragestellungen für die Diskussion aufgelistet:

1. Dienen Dokumentlandkarten zur Orientierung in Textsammlungen? 2. Ist DocMINER geeignet zur Unterstützung kulturwissenschaftlichen Arbeitens? 3. Dienen Termanalysen zum Verständnis von Textgruppierungen, Häufungen und

Brückentermen? Die ersten beiden Fragestellungen wurden nach kurzer Diskussion positiv beant-

wortet. Dabei hat sich herausgestellt, dass die visuelle Darstellung durch die Doku-mentenlandkarte wesentlich zum Verständnis und zur Transparenz der statistischen Analyse von Dokumentsammlungen beigetragen hat. Die anwesenden Linguisten und Germanisten hatten keine Schwierigkeiten, die Analyse als Hilfsmittel geisteswissen-schaftlichen Arbeitens zu akzeptieren und anzuwenden. Insbesondere wurde die Vi-sualisierungsmetapher der Dokumentenlandkarte schnell verstanden und aufgegriffen. Beteiligte Literaturwissenschaftler haben richtigerweise angemerkt, dass Texte nicht nur durch die Verwendung von Termen charakterisiert werden, sondern auch genre-spezifisch ausdifferenziert sind und durch eine eigenständige Performanz charakteri-siert sind. Dies war aber auch nicht das Ziel der Analyse, was von allen Seiten akzep-tiert wurde. Die iterative und kooperative Vorgehensweise mit Hilfe der Dokument-landkarte wurde methodisch in dieser Phase der Terminologiearbeit angenommen, da allen bewusst war, das die explorative Vorgehensweise in dieser Phase der Termino-logiearbeit Vorteile gegenüber reinem Abfragen der Termverwendung hatte. Die interaktive Arbeit mit DocMINER wurde in den Workshops erläutert und stieß auf großes Interesse. Dies war an den vielen Wünschen zu erkennen, die an DocMINER herangetragen wurden und von denen wir drei aufgreifen werden. Erstens wird die Erstellung von Stoppwortlisten ebenfalls kooperativ erfolgen, zweitens wird das „Stemming“ deutscher Worte verbessert und drittens werden wir einen Thesaurus für die Kollektion erstellen, so dass die Beziehungen zwischen generellen und spezifi-schen Termen geklärt werden kann.

Abb. 3. Erweiterte Dokumentenlandkarte mit 280 (Teil-)Dokumenten des Forschungskol-legs. Die einzelnen Abschnitte der eingereichten Version des vorliegenden Papiers finden sich als Feld im süd-östlichen Teil der Karte (hellgraue Rauten, siehe Legende).

Eine Kernthese unserer Forschungsarbeit war, dass die statistische Auswertung der aktuellen Termnutzung einen Einstieg in die Begriffsdiskussion bietet. Die durchge-führten Workshops haben dies auch bestätigt: Die über die Termprofile vorgeschlage-nen Begriffe sind problemlos aufgegriffen und untersucht worden. Die Vielzahl der Terme, die während der Workshops aufgegriffen und diskutiert wurde, führte zum Hauptergebnis der Workshops. Entscheidend für den Prozess der Terminologiearbeit war die Herausarbeitung des Begriffs „ terminologische Kultur“. Obgleich den betei-ligten Disziplinen bewusst ist, dass geistes- oder kulturwissenschaftliches Arbeiten häufig in sogenannten Denk- und Schreibschulen geordnet wird, die aus Forschungs- und Lehrtraditionen entstehen, machte erst die Visualisierung der trennenden Grup-pierungen bewusst, welchen Einfluss dies auf die auf Interdisziplinarität und Koope-ration ausgelegte Arbeit im Kolleg hat. Die Problematisierung dieser Sachverhalte verstärkte nach einhelliger Meinung aller Beteiligten die Suche nach gemeinsam tragfähigen Begrifflichkeiten, die letzten Endes in ein lebendiges Glossar des Kollegs münden sollen. Eine Anstrengung, der sich alle verpflichtet fühlen.

7 Zusammenfassung und Ausblick

Kooperative Terminologiearbeit ist aufgrund des Vokabularproblems für jegliche Projektarbeit von entscheidender Bedeutung für das Voranschreiten und die Qualität. Insbesondere gilt dies für interdisziplinäre Großforschungsprojekte wie dem For-schungskolleg FK/SFB 427 „Medien und kulturelle Kommunikation“. Kooperative Terminologiearbeit ist ein mehrphasiger Prozess. In den frühen Phasen der Termino-logiearbeit kommt der kooperativen Analyse bestehender Dokumente eine besondere Rolle zu, um für die Begriffsarbeit relevante Terme zu identifizieren und für die wei-tere Arbeit zu problematisieren, beispielsweise wenn sie in einzelnen Disziplinen mit divergenten Bedeutungsinhalten verknüpft sind. In dieser Arbeit haben wir einen methodischen Ansatz zur frühen Phase der Terminologiearbeit mittels Dokument-landkarten vorgestellt und evaluiert. Dieser Ansatz bettet sich natürlich in die Metho-dik der iterativen, kooperativen Terminologiearbeit ein und hat den Vorteil, durch die Visualisierung und Interaktion alle Beteiligten trotz unterschiedlicher Erfahrungshin-tergründe in die kooperative Analyse einzubeziehen. Neben der Evaluierung der Me-thodik konnte somit die terminologische Arbeit im Forschungskolleg entscheidend vorangetrieben werden.

Die vorhandenen Dokumentlandkarten bilden eine der Grundlagen für die Neube-antragung des Forschungskolleg, die im Jahr 2001 erfolgt. Innerhalb des Kollegs als theoriefähig erkannte Terminologie, z.B. der Begriff „Transkriptivität“ für intra- und intermediale Umschreibungseffekte und „Adressierung“ als Kernelement von Kom-munikationskulturen, wird aufgrund der erfolgten terminologischen Diskussion als Brücke zwischen dem Rahmenantrag und der Beantragung der Einzelprojekte einge-setzt. Dadurch soll die begriffliche Isolation dieser Teildokumente aufgehoben wer-den. Diese Entwicklungen werden in einem „historischen Terminologieatlas“ doku-mentiert, d.h. eine Serie von Dokumentenlandkarten wird als zusätzliches Mittel der Entwicklungsdokumentation verwendet.

Danksagungen Die Autoren möchten allen Mitglieder der Arbeitsgruppe „Terminologie“ des SFB/FK 427 „Medien und kulturelle Kommunikation“ für die rege Mitarbeit und fruchtbaren Diskussionen danken. Teile dieser Arbeit wurden von DFG-Graduiertenkolleg „ In-formatik und Technik“ unterstützt. Weiterhin möchten wir Cirsten Maas danken, die den größten Teil der eingeflossenen Texte für die Bearbeitung mit DocMINER aufbe-reitet hat.

Literaturverzeichnis

1. B.v.Buol, S.Kethers, M.Jeusfeld, M. Jarke: A Terminology Server for Coop-erative Terminology Work. 2nd IFCIS Conference on Cooperative Informa-tion Systems CoopIS'97, Kiawah Island, South Carolina, 1997

2. B.v.Buol: Qualitätsgestützte, kooperative Terminologiearbeit. Dissertation, RWTH Aachen, 1999.

3. Becks, A., Host, M.: Qualitätsprüfung mit Dokumentenlandkarten. Tagungs-band tekom-Frühjahrstagung – Gesellschaft für technische Kommunikation e.V., Stuttgart, 1999

4. Becks, A., Host, M.: Visuell gestütztes Wissensmanagement mit Dokumen-tenlandkarten. Wissensmanagement – Magazin für Führungskräfte 4/00, Juli 2000

5. Becks, A., Köller, J.: Automatically Structuring Textual Requirement Sce-narios. In Proc. of the 14th IEEE Int. Conf. on Automated Software Engi-neering, Cocoa Beach, Florida, USA, 1999

6. Becks, A., Sklorz, S., Jarke, M.: A Modular Approach for Exploring the Se-mantic Structure of Technical Document Collections. Proceedings of AVI 2000, Int. Working Conference on Advanced Visual Interfaces, Palermo, 2000

7. Becks, A., Sklorz, S., Jarke, M.: Exploring the Semantic Structure of Tech-nical Document Collections: A Cooperative Systems Approach. In Etzion, O., Scheuermann, P. (Eds.): Cooperative Information Systems, Proceedings of the 7th Int. Conference on Cooperative Information Systems, LNCS 1901, Eilat, Israel, 2000

8. Becks, A., Sklorz, S., Tresp, C.: Semantic Structuring and Visual Querying of Document Abstracts in Digital Libraries. In Proc. of the Second European Conference on Research and Advanced Technology for Digital Libraries (LNCS 1513), Crete, Greece, 1998

9. Bentley, R., Appelt, W., Busbach, U., Hinrichs, E., Kerr, D., Sikkel, K., Trevor, J., Wötzel, G.: „Basic support for cooperative work on the World Wide Web“, in: International Journal of Human-Computer Studies 46, 6 (1997), S. 827-846.

10. Bonjour, M., Falquet, G.: Concept Bases: A Support to Information Systems Integration. In: Brinkkemper, S., Wassermann, T., Wijers, G. (Hg.): Proceed-ings of the 6th Conference on Advanced Information Systems Engineering

(CAiSE’94), Utrecht, 6.-10.6.1994, Nummer 811 in Lecture Notes on Com-puter Science, Springer Verlag, 1994.

11. Brachmann, R.J., Schmolze, J.G.: An overview of the KL-ONE knowledge representation system. Cognitive Science, 9(2):171-216, 1985.

12. Chalmers, M., Chitson, P.: Bead: Explorations in Information Visualization. In Proc. of the 15th Annual International ACM SIGIR Conference on Re-search and Development in Information Retrieval, Copenhagen, 1992

13. Chen, H., Schuffels, Ch., Orwig, R.: Internet Categorization and Search: A Self-Organizing Approach. Journal of Visual Communication and Image Representation, Vol. 7, No. 1, 1996

14. Davidson, G. S., Hendrickson, B., Johnson, D. K., Meyers, Ch. E., Wylie, B. N.: Knowledge Mining With VxInside: Discovery Through Interaction. Journal of Intelligent Information Systems, Vol. 11, No. 3, 1998

15. DIN 2339/1: Ausarbeitung und Gestaltung von Veröffentlichungen mit ter-minologischen Strukturen. Teil 1: Stufen der Terminologiearbeit. Deutsches Institut für Normung, Beuth Verlag, Berlin, 1986.

16. DIN 820: Blatt 1: Normungsarbeit: Grundsätze. Deutsches Institut für Nor-mung, Beuth Verlag, Berlin, 1977.

17. Farquhar, A., Fikes, R., Rice, J.: The Ontolingua Server: a Tool for Collabo-rative Ontology Construction. In: Proc. Of the Knowledge Acquisition Workshop, Banff, Canada, 1996.

18. Fillmore, C.: The Case for Case, In: Bach, E., Harms, R. (Hg.): Universals in Linguistic Theory, Holt, New York, 1968, S. 1-88.

19. Furnas, G.W., Landauer, T.K., Gomez, L.M., Dumais, S.T.: The Vocabulary Problem in Human-System Communication. Communications of the ACM, 30(11):964-971, 1987.

20. http://www-i5.informatik.rwth-aachen.de/lehrstuhl/projects/FKMedien/ 21. ISO 10241: International standard – International terminology standards –

Preperation and layout (1st ed.). International Organization for Standardiza-tion, Geneva, 1992.

22. Jarke, M., Kethers, S.: Regionale Kooperationskompetenz: Probleme und Modellierungstechniken. Wirtschaftsinformatik, 41(4):316-325, 1999.

23. Kethers, S., Buol, B.v.: „ Internetbasierte Terminologiearbeit in der Medi-zin“, in: Proceedings EMISA-Fachgruppentreffen Informationsserver für das Internet (Aachen 1996), Bonn: Gesellschaft für Informatik 1996.

24. Klamma, R., Jarke, R.: Knowledge Management Cultures: A Comparison of Engineering and Cultural Science projects. ECSCW-Workshop XMWS'99, Beyond Knowledge Management: Managing Expertise, 13.9.99, Kopenha-gen, Denmark, 1999.

25. Klamma, R., Peters, P., Jarke, M.: Vernetztes Verbesserungsmanagement. Wirtschaftsinformatik, 42(1):15-26, 2000.

26. Klamma, R., Schlaphof, S.: Rapid Knowledge Deployment in an Organiza-tional-Memory-Based Workflow Environment. Proceedings of the 8th Euro-pean Conference on Information Systems (ECIS 2000), Vienna, Austria, 2000, pp. 364-371.

27. Kohonen, T.: Self-Organizing Maps. Springer, Berlin, 2nd Edition, 1995

28. Miller, G.A.: WordNet: A Lexical Database for English. Communications of the ACM, 38(11):39-41, 1995.

29. Minsky, M.: A Framework for Representing Knowledge. In. P.H. Winston (Hg.): The Psychology of Computer Vision, McGraw-Hill, New York, 1975, S. 211-277.

30. Nissen, H.W., Jeusfeld, M.A., Jarke, M., Zemanek, G., Huber, H.: „Manag-ing multiple requirements perspectives with meta models“, in: IEEE Soft-ware, März 1996, S. 37-48.

31. Quillian, M.R.: Semantic memory. In: Minsky, M. (Hg.): Semantic informa-tion processing, MIT Press, Cambridge, MA, 1968, S. 227-270.

32. Salton, G. (Ed.): The SMART Retrieval System – Experiments in Automatic Document Processing. Prentice Hall, New Jersey, 1971

33. Sklorz, S. Becks, A. Jarke, M.: MIDAS – ein Multistrategiesystem zum explorativen Data Mining. 2. Workshop Data Mining und Data Warehousing als Grundlage moderner entscheidungsunterstützender Systeme (DMDW'99), LWA'99 Sammelband, Univ. Magdeburg, 1999

34. Sowa, S.F.: Conceptual Structures: Information Processing in Mind and Ma-chine. Addison-Wesley, Reading, MA, 1984.

35. Wise, J.A., Thomas, J.J., Pennock, K., Lantrip, D., Pottier, M., Schur, A., Crow, V.: Visualizing the non-visual: Spatial analysis and interaction with information from text documents. In Proc. of IEEE Information Visualiza-tion 95 (InfoViz’95), 1995