Computerlinguistik: Pionierin des Suchens und Findens
Die Computerlinguistin Karen Spärck Jones erfand das mathematische Prinzip, nach dem heute Suchmaschinen funktionieren – ganz ohne Internet. Und sie zeigte, dass man nicht unbedingt Mathematik studiert haben musste, um in der frühen Informatik Spuren zu hinterlassen, ja, nicht einmal Zugriff auf einen Computer benötigte, um Programmieren zu lernen.
Karen Spärck Jones wurde am 26. August 1935 in der englischen Industriestadt Huddersfield geboren. Ihr Vater arbeitete an einem der dortigen Technik-Colleges als Dozent für Chemie, ihre norwegische Mutter ab 1940 für die Exilregierung des Landes. Karen ging auf ein Mädchengymnasium.
Dem damaligen britischen Schulwesen entsprechend musste sie sich zwischen dem künstlerischen und dem naturwissenschaftlichen Zweig entscheiden. "Ich entschied mich für Naturwissenschaften, aber auch die geisteswissenschaftlichen Fächer waren sehr interessant", erzählte sie 2001 in einem ausführlichen Interview mit Janet Abbard für das History Center des Berufsverbandes IEEE(öffnet im neuen Fenster) (Institute of Electrical and Electronic Engineers). In Mathematik war sie allerdings ziemlich schlecht, "das lag hauptsächlich aber daran, dass der Unterricht nicht gut war – insgesamt bedauere ich das noch heute".
Als Frau in Cambridge
Mit zwölf Jahren verkündete sie, dass sie an der renommierten Universität von Cambridge studieren wollte. Ihr Gymnasium bereitete die Schülerinnen zwar nicht auf die Aufnahmeprüfungen für Oxford und Cambridge vor, aber Karen schaffte es trotzdem. Speziell ihren Vater habe das sehr gefreut, erzählte sie später, obwohl er enttäuscht gewesen sei, dass die Tochter sich von Anfang an auf das Studium der Geschichtswissenschaften festgelegt habe – diesmal nicht Naturwissenschaften.
Girton College war im Jahr 1953 nur eines von zwei Cambridger Frauen-Colleges, rückblickend sagte Spärck Jones, dass die Ausbildung dort durchaus Vorteile gehabt habe: "Man nahm das Studium sehr ernst, das Privileg, in Cambridge zu sein, wollte man nicht verpfuschen." Entsprechend verlief ihr Geschichtsstudium sehr erfolgreich, inklusive eines zusätzlichen einjährigen Studiums der Ethik(öffnet im neuen Fenster) am Fachbereich Philosophie.
Ungewollt Lehrerin
Danach arbeitete Karen Spärck Jones notgedrungen kurzzeitig als Lehrerin(öffnet im neuen Fenster). Eine Studienleiterin vermittelte ihr einen Job an einer Mädchenschule – rückblickend hielt Spärck Jones das Procedere für "unverantwortlich – jemanden ohne eine entsprechende Ausbildung zum Unterrichten an eine Schule zu schicken, nur weil sie von der richtigen Universität kam, das war nicht in Ordnung".
"Damals gab es für Frauen nicht viel Auswahl", betonte sie im Interview mit IEEE. Sie beneide junge Frauen, denen viele Möglichkeiten offenstünden, sagte sie. "Als ich auf Jobsuche war, konnte man entweder Lehrerin werden oder, wenn man ohne technische Ausbildung lieber in der Industrie arbeiten wollte, Sekretärin oder Fachkraft im Personalwesen werden."Arbeitsplätze im Management gab es für Frauen nicht, "mir war die Vorstellung, als Frau eine leitende Position innezuhaben, völlig fremd."
Zwar hielt sich Spärck Jones nicht für eine gute Lehrerin, doch sie musste nach dem Tod des Vaters ihre Mutter unterstützen.
Bereits im ersten Semester ihres Studiums in Cambridge lernte Karen Spärck Jones über gemeinsame Freunde den Mathematikstudenten Roger Needham kennen – eine Bekanntschaft, die ihr berufliches und privates Leben prägen sollte.
Selfmade-Programmierin und erste Erfolge
Needham, den sie 1958 heiratete, arbeitete nebenbei mit einer kleinen Forschergruppe zusammen, die sich außerhalb der Universität organisiert hatte, auch weil Cambridge keine assoziierten Forschungsprojekte mochte.
Die Gruppe war die Cambridge Language Research Unit (CLRU), die kurz zuvor von der Philosophie- und Sprachforscherin Margaret Masterman mitgegründet worden war. Über Needham kam auch Spärck Jones mit Masterman und deren Ehemann, dem Philosophen Richard Braithwaite, in Kontakt – eine Verbindung, die für ihre spätere Laufbahn prägend wurde.
1956 feierte die CLRU erste Erfolge. Sie erhielt Fördergelder der US-amerikanischen National Science Foundation (NSF), was den Aufbau eines kleinen Forschungsteams ermöglichte. Zwei Jahre später fragte Masterman ihre frühere Studentin ganz direkt: "Warum kommst du nicht und arbeitest für mich?"
1958 war für Karen Spärck Jones ohnehin ein Wendepunkt: Sie veröffentlichte gemeinsam mit Roger Needham, Masterman und Braithwaite ihre erste wissenschaftliche Arbeit, The analogy between mechanical translation and library retrieval(öffnet im neuen Fenster).
Kein direkter Zugriff auf einen Computer
Auch wenn sie nie ein Informatikstudium absolvierte und sich selbst als mathematisch wenig begabt bezeichnete, brachte sich Karen Spärck Jones das Programmieren selbst bei. "Ich habe mit 15 aufgehört, Mathe zu machen", sagte Spärck Jones im IEEE-Interview mit Abbate(öffnet im neuen Fenster). Und auch Zugriff auf einen Computer hatte sie nicht.
Nicht direkt zumindest. Die CLRU besaß nur einige Lochkartenmaschinen, aber keinen eigenen Rechner. Ihre Programme zur Klassifikation linguistischer Daten ließ Spärck Jones deshalb von ihrem Mann auf dem EDSAC II ausführen, einem der ersten elektronischen Rechner der Universität.
Diese frühen Experimente legten den Grundstein für ihre Doktorarbeit (PDF)(öffnet im neuen Fenster), die sie laut eigener Aussage 1963 abschloss und 1964 erfolgreich verteidigte. Anders als es etwa die englische Wikipedia nahelegt, wurde die Arbeit nicht abgelehnt – im Gegenteil: Sie wurde 1986 von der Edinburgh University Press veröffentlicht und entwickelte sich zu einem der einflussreichsten Werke der Computerlinguistik. Besonders die Idee, Wortbedeutungen statistisch zu gruppieren, fand später breite Anwendung.
Das wichtigste Werk der Computerlinguistik wird geschrieben
1965 erhielt Spärck Jones ein Forschungsstipendium am Newnham College in Cambridge. Fortan arbeitete sie zweigleisig – theoretisch am College, wo sie ihre Dissertation weiterentwickelte, und praktisch an der CLRU, wo sie an einer klaren Forschungsfrage arbeitete: "Kann ich einen automatischen Thesaurus für Information Retrieval bauen?"
Diese Arbeit mündete in ihrem wichtigsten Beitrag zur Entwicklung von Suchtechnologien. 1972 veröffentlichte sie im Journal of Documentation die Studie A statistical interpretation of term specificity and its application in retrieval (PDF)(öffnet im neuen Fenster). Darin führte sie das Konzept der Inverse Document Frequency (IDF) ein, ein bis heute zentraler Begriff in der Informationstheorie: IDF beschreibt, wie selten ein Begriff in einer Dokumentensammlung vorkommt – und leitet daraus seine Relevanz ab.
Kombiniert mit der Term Frequency (TF) – also wie oft ein Begriff in einem einzelnen Dokument erscheint – entstand das heute noch essenzielle Modell TF-IDF(öffnet im neuen Fenster). Dieses bildet die statistische Grundlage moderner Suchmaschinen und war ein entscheidender Schritt hin zu automatischer Textklassifikation, semantischer Suche und maschineller Sprachverarbeitung.
Spärck Jones, ein Kind ihrer Zeit
1964, also das Jahr, in dem Karen Spärck-Jones den Grundstein für ihr Lebenswerk legte, war ein Jahr des Umbruchs – und das nicht nur, weil Mariner 4, die erste Mars-Flyby-Mission(öffnet im neuen Fenster), Bilder des Planeten zur Erde funkte und damit Träume vom Reisen ins Weltall plötzlich zum Greifen nah erscheinen ließ .
Auch in den privaten Wohnzimmern und Küchen sollte bald nichts mehr so sein wie zuvor. In den Kinder- und Jugendzimmern war es bereits ziemlich laut geworden: Popkulturell war 1964 vor allem das Jahr der sogenannten Beatlemania. Nach den Vorjahreshits I Want to Hold Your Hand und She Loves You führte Can't Buy Me Love fast weltweit die Charts an, gefolgt von A Hard Day's Night, dem Titelsong des ersten Spielfilms der Fab Four.
Auch wenn sich viele Menschen die neuen Geräte wie Spülmaschinen und andere elektrische Küchengeräte nicht leisten konnten, wurde der Alltag langsam technischer – und kurzweiliger. Bald sollte auch das Musikhören viel einfacher und vor allem individueller werden, denn die von Philips 1964 vorgestellte Kompaktkassette(öffnet im neuen Fenster) erlaubte unter anderem das Erstellen eigener Playlisten.
Und nur drei Jahren später wurden sowohl in Großbritannien als auch in Deutschland die ersten Fernsehsendungen in Farbe ausgestrahlt – bei der BBC wurde Wimbledon "in colour(öffnet im neuen Fenster)" gezeigt, in der BRD drückte der damalige Vize-Bundeskanzler und Außenminister Willy Brandt symbolisch den Startknopf für das deutsche Farbfernsehen(öffnet im neuen Fenster), worauf die Erfolgsshow Der goldene Schuss – in Farbe – folgte.
Vertrauen in eine rosige, technische Zukunft
Obwohl es noch Jahre dauern sollte, bis die Neuerungen für alle erschwinglich waren, waren die allgemeine Technikbegeisterung und das Vertrauen in eine positive Zukunft riesengroß.
Fliegende Autos, Mini-Atomkraftwerke in jedem Haushalt, futuristische Verkehrssysteme, Urlaub auf dem Mond, Weltfrieden, Bildung für alle wurden nur 19 Jahre nach dem Ende des 2. Weltkriegs in Magazinen und auf Technikmessen als plausible Zukunftsvisionen präsentiert.
Mit den Erwartungen wuchsen jedoch auch die Zweifel und der Wunsch nach einer besseren, gerechteren Welt. Nicht von ungefähr begann damals die New Wave der Science Fiction. Autoren und Autorinnen wie Philip K. Dick, Ursula K. Le Guin oder J. G. Ballard kombinierten technische Utopien mit gesellschaftlichen Fragen und bildeten damit den Zeitgeist und die Hoffnungen und Ängste der Menschen besser ab als das vorangegangene Golden Age mit seinem einseitigen Fokus auf Technikoptimismus und Abenteuer.
Dem Geist jener Zeit entsprechend wandte sich Spärck Jones später gegen unkritischen Technikenthusiasmus(öffnet im neuen Fenster). "Es besteht eine Wechselwirkung zwischen dem Kontext und der Programmieraufgabe selbst", sagte sie. "Man muss nicht jedes Mal, wenn man die Tastatur benutzt, eine philosophische Diskussion führen, aber da die Computertechnik immer stärker in das Leben der Menschen eindringt, muss man über diese Dinge nachdenken."
Sprachverarbeitung in der Sackgasse – und ein Gegenentwurf
Viele Forschungsprojekte in den 1960er Jahren versuchten, Sprache mit festen Regeln zu analysieren und maschinell zu übersetzen, doch diese Ansätze scheiterten zunehmend – der berühmte ALPAC-Report von 1966 etwa bescheinigte der maschinellen Übersetzung damals geringe Praxistauglichkeit.
Karen Spärck Jones verfolgte einen anderen Ansatz: Sie interessierte sich nicht für Übersetzungen, sondern für die Frage, wie man mit Computern semantische Zusammenhänge erkennen kann. In ihrem Aufsatz Synonymy and Semantic Classification(öffnet im neuen Fenster) von 1964 plädierte sie dafür, Wörter nicht als fixe logische Einheiten, sondern als bedeutungsoffene, kontextabhängige Elemente zu verstehen. Ihre Idee, Bedeutungen statistisch zu erfassen und Begriffe in Beziehung zu setzen, war visionär – und beeinflusst bis heute, wie Suchmaschinen Sprache verarbeiten.
Von den Schwierigkeiten, eine Pionierin zu sein
Erst 1999 wurde ihr von der Cambridge-Universität eine Vollzeitprofessur angeboten. Bis dahin hatte sie im Gegensatz zu ihrem fest angestellten und damit gut verdienenden Mann immer nur "soft money", erhalten, also befristete Drittmittel. "Cambridge war nicht user-freundlich im Sinne von nicht frauenfreundlich", sagte sie einmal dazu.
Entsprechend postulierte sie(öffnet im neuen Fenster) immer wieder: "Die Informatik ist viel zu wichtig, um sie den Männern zu überlassen."
Als sie kurz vor ihrem Tod im Jahr 2007 erfuhr, dass sie als erste Frau die renommierte Lovelace-Medaille(öffnet im neuen Fenster) verliehen bekommen würde, sagte sie in einem Interview(öffnet im neuen Fenster) auf die Frage nach ihren Vorbildern, dass am ehesten Margaret Masterman eines gewesen sei, da sie den Cambridger Chauvinismus vor ihr erlebt und daraus die Konsequenz gezogen habe, anderen Frauen eine Chance zu geben.
Allerdings habe sie die Arbeitsweise von Masterman nicht als vorbildlich empfunden, zumal sie deren Ideen nicht immer geteilt habe. Und: "Mein Mann war eines, wenn auch auf andere Art. Er ermutigte mich. Wenn man in einem Fachbereich allein auf sich gestellt ist und von wenig Geld lebt, so wie ich es bis über mein 50. Lebensjahr hinaus tun musste, ist das sehr wertvoll."
Die Verleihung der Auszeichnung fand posthum statt.
Segeln, sammeln, diskutieren: ein erfülltes Privatleben
Karen Spärck Jones und Roger Needham führten Zeitzeugen zufolge bis zu seinem Tod 2003 eine sehr glückliche Ehe. Das lag wohl auch daran, dass beide ihre beruflichen Tätigkeiten sehr liebten – Kollegen und Kolleginnen erinnerten sich später gegenüber der New York Times, dass das Ehepaar in Pausen gern in der Teeküche der Fakultät saß und leidenschaftlich Ideen diskutierte.
Needham arbeitete ab 1962 am renommierten Computer Laboratory der Universität Cambridge, das er von 1980 bis 1995 leitete. Später wurde er Pro-Vizekanzler(öffnet im neuen Fenster) der Universität. In der Fachwelt gilt er als Mitentwickler der Burrows-Abadi-Needham-Logik sowie des Needham-Schroeder-Protokolls – Letzteres ist noch heute eine Grundlage vieler Authentifizierungsverfahren wie Kerberos.
Das Paar liebte Kunst und Literatur und sammelte interessante Gegenstände – um genug Platz für die stetig anwachsende Bibliothek zu schaffen, mietete Needham schließlich sogar ein weiteres Haus in der Nachbarschaft an, in dem auch ein Atelier für das künstlerische Schaffen seiner Frau eingerichtet wurde. Außerdem waren die beiden begeisterte Segler und nahmen mit ihrem 1872 gebauten Itchen Ferry Cutter, einem modifizierten Fischerboot, 30 Jahre lang an Regatten teil(öffnet im neuen Fenster).
Kollegen und Kolleginnen beschreiben sie als humorvolle, praktische, nicht auf Äußerlichkeiten bedachte Frau, die fast immer Jeans, eine weiße Bluse, einen roten Pullover sowie eine aus Treibholz und Teilen eines Hufeisens selbst gefertigte Brosche trug. Wenn sie zu einem formellen Anlass eingeladen war, transportierte sie das Kleid, das sie dort tragen wollte, mit Wäscheklammern am Lenker ihres Fahrrads – eine Szene, die vielen in Erinnerung blieb.
Späte Anerkennung
Spärck Jones starb am 4. April 2007 an den Folgen einer Krebserkrankung. Einen Nachruf in der renommierten Obituaries-Sektion der New York Times gab es damals für sie nicht – anders als für ihren Mann(öffnet im neuen Fenster).
Erst nachdem die Bedeutung ihrer Arbeiten zunehmend anerkannt wurde, würdigte die Zeitung sie 2019 in der Serie Overlooked(öffnet im neuen Fenster) – jener Rubrik also, in der Leben und Wirken übersehener Persönlichkeiten nachträglich honoriert wird. Eine solche lange nicht beachtete Größe war Karen Spärck Jones auf jeden Fall – bis ihre Ideen die Welt veränderten.



