| Kombjuda, host mi? Naa, schdreich des! |
 |
 |
 |
Vom Selbstversuch eines Fachjournalisten mit dem neuesten Diktierprogramm

Mein erstes Spracherkennungssystem habe ich mir selbst programmiert. Das war vor 25 Jahren. Mein „Apple II“ verstand beim Diktat schließlich 20 Wörter, was einerseits sehr ordentlich war für seinen unvorstellbar winzigen Arbeitsspeicher, mich aber andererseits zu einem etwas minimalistischen Schreibstil gezwungen hätte. Seit dieser Zeit träume ich von Rechnern mit Mikrofon statt Tastatur. Ich bin nämlich nicht gerade ein begnadeter Tippkünstler. Leider bin ich auch Münchner – und als solcher verschlucke ich Endungen und spare bei den Konsonanten. Werde ich je meinen PC zum Diktat bitten können
Der Hersteller des Programms Dragon Naturally Speaking 7 ist sich seiner Sache sehr sicher: „Bereits nach fünf Minuten Training“, so die amerikanische Scansoft, erziele ihr neuestes Produkt eine „gute Erkennungsleistung“. Ein passendes Headset (Kopfhörer mit Mikro) wird gleich mitgeliefert, und so starte ich nach 10 Minuten Installation mit dem Diktieren meines ersten Artikels. Das Ergebnis auf dem Bildschirm wirkt allerdings wie die Übersetzung einer chinesischen Bedienungsanleitung durch einen Inder mit Duden. Das eingebaute Wörterbuch verhindert zwar Rechtschreibfehler, leider aber nicht Unsinn. So findet Dragon immer ein nettes Wort für mich – obwohl ich von Mal zu Mal ungehaltener den Befehl „streich das“ ins Mikro blaffe. Da die Software mit dem kleinen roten Drachen auch dieses Kommando längst nicht immer versteht, beglückt sie mich mit immer neuen Sinnlosigkeiten
Testweise übergebe ich das Mikrofon meiner technikfeindlichen Freundin, die thüringischer Herkunft ist – und bin völlig verwundert, wie gehorsam der Rechner ihre Worte korrekt in Buchstaben wandelt. Wir Voralpenländler dagegen tun uns schwer, uns der Maschine verständlich zu machen. Wenn wir durch das Verschlucken von Buchstaben die Sprache aufs (für uns) Wesentliche reduzieren, lassen wir dem Programm kaum eine Chance. Den Sinn des Genuschelten aus dem Kontext oder aus Nuancen im Tonfall zu erschließen, das schafft die beste Technik denn doch noch nicht. Auch kann das Gerät tiefe Stimmen schwerer analysieren als die hohen Frequenzen der Frauen.
Im Handbuch steht etwas von zusätzlichem Training, deutlicher Aussprache und Auswertung von bereits geschriebenen Texten. Bewaffnet mit einem Kaffee zum Ölen der Stimmbänder lese ich meinem Rechenknecht stundenlang Romane vor – von wegen fünf Minuten – und trainiere gleichzeitig meine Aussprache. Ein trockener Mund erweist sich für das Training mindestens so nachteilig wie Hektik oder Übermüdung. Das Training hilft: Endlich kann ich meinem Notebook die SZ vorlesen und es kann mir folgen. Nur für meine Computerzeitung – ausgerechnet! – zeigt er kein Verständnis.
Notgedrungen mache ich mir die Arbeit und füttere das Programm mit Artikeln aus dem Computerbereich. Dragon analysiert die Texte und erweitert seinen Wortschatz um die unbekannten Begriffe. Am meisten hält mich dabei die Rechtschreibprüfung neuer Worte auf. Ich erspare mir diesen Aufwand lieber: Bei der teureren „Professional Version“ kann ich ganze Fachlexika direkt digital einspeisen. Und siehe da: Nach der Wortschatzerweiterung versteht mich mein Notebook immer besser. Hört es doch mal nicht richtig zu, brauche ich nur „korrigier das“ zu sagen, und es bietet mir bis zu zehn fein säuberlich durchnummerierte Alternativen an – Sinnhaftigkeit nicht immer garantiert. Kennt der Rechner kein ähnlich klingendes Wort, so hilft Buchstabieren weiter.
Nach zwei Wochen Eingewöhnung kommt mein Rechner schon einigermaßen mit mir zurecht. Er schreibt weitgehend wortgenau meine linguistischen Auswürfe nieder. Jetzt ist es an der Zeit, ihn absoluten Gehorsam zu lehren: Das Programm steuert auf Wunsch den Rechner und führt gesprochene Befehle aus. „Öffne Microsoft Word“: das Programm startet. Die Kurzfassung „Öffne Word“ versteht Dragon erst, nachdem ich den Programmnamen auf „Word“ geändert habe.
Am Schreibtisch blendet mich die Sonne, und ich frage mich, warum ich nicht zum See gehe, den Text am Strand in den Speicher meines Taschencomputer diktiere und später überspiele. Prompt begehe ich diesen Fehler, denn ich ahne noch nicht, dass mir das fröhliche Kindergeschrei aus dem Off später beim Überspielen der Aufnahme auf den PC reichlich Quatsch-Text bescheren wird. Auf Stimmen im Hintergrund reagiert Dragon generell recht intolerant; auch für Radiogedudel rächt es sich sofort in Form von Wortsalat. Allerdings haben die Programmierer der neuesten Version auch für solche Fälle vorgesorgt. Die Software speichert inzwischen auch das Originaldiktat auf der Festplatte, so dass Vergessliche wie ich sich die Aufnahme noch einmal vorspielen lassen können. Der „Drache“ liest auf Wunsch sogar via Kopfhörer vor, was er verstanden hat.
Dass meine Produktivität nun keine Grenzen mehr kennt, wie die Scansoft-Werbung mir suggerieren wollte, ist zwar übertrieben. Doch zumindest in Teilbereichen ist sie sichtlich gestiegen. Erstmals kann ich mir vorstellen, die Software tatsächlich einzusetzen – auch wenn die häufig notwendigen Eingriffe von Hand lästig sind. Für diese Art von Programm braucht man einfach Geduld. Vielleicht sind die Justizbehörden in Baden-Württemberg ja deshalb nicht der schlechteste Vorzeigekunde.
Der größte Vorteil für mich liegt in weniger Verspannungen und Migräne. Entspannt sitze ich jetzt im Sessel und diktiere bei einem Gläschen Rotwein meine Texte, bis meine Aussprache undeutlich wird... und Dragon wieder seine lyrische Ader zeigt. 
Letzte Änderung: 14:23 22/10 2003
|