Benutzerdefiniertes Woerterbuch fuer praezise Transkription einrichten

Spracherkennung hat in den letzten Jahren enorme Fortschritte gemacht. Moderne Modelle wie das in SuperSpeech verwendete NVIDIA Parakeet-TDT erreichen bei alltaeglicher Sprache eine Genauigkeit von ueber 95 Prozent. Doch sobald Fachbegriffe, Eigennamen, Abkuerzungen oder branchenspezifisches Vokabular ins Spiel kommen, sinkt die Erkennungsrate -- manchmal drastisch.

Das ist kein Fehler des Modells. Spracherkennungsmodelle werden mit allgemeiner Sprache trainiert -- aus dem Internet, aus Hoerbuechern, aus Podcasts. Dein spezifisches Fachvokabular kommt in diesen Trainingsdaten kaum oder gar nicht vor.

SuperSpeech loest dieses Problem mit dem benutzerdefinierten Woerterbuch: einer einfachen, aber wirkungsvollen Funktion, die falsch erkannte Woerter automatisch durch die richtigen ersetzt. In diesem Artikel erfaehrst du, wie das Woerterbuch funktioniert, wie du es einrichtest und wie du es optimal fuer dein Fachgebiet konfigurierst.

Warum erkennt die Spracherkennung Fachbegriffe falsch?

Das Training bestimmt das Vokabular

Ein Spracherkennungsmodell kennt nur die Woerter, die es waehrend des Trainings gehoert hat. Parakeet-TDT wurde mit tausenden Stunden Audiomaterial trainiert -- aber der Grossteil davon ist allgemeine Sprache. Wenn du "Acetylsalicylsaeure" sagst, hat das Modell dieses Wort moeglicherweise nie gehoert und muss raten: "Aseti-Salizil-Saeure"? "Acetyl-Salicylsaeure"? Die einzelnen Silben sind richtig erkannt, aber die Zusammensetzung stimmt nicht.

Dasselbe gilt fuer:

Abkuerzungen: "HbA1c" ist im medizinischen Kontext eindeutig, aber das Modell hoert "h b a eins c" und schreibt es als separate Buchstaben und Zahlen.
Eigennamen: "Rechtsanwalt Mueller-Schlossberg" kann zu "Rechtsanwalt Mueller Schlossberg" oder "Mueller Schlossberger" werden.
Fremdsprachige Begriffe: Lateinische Rechtstermini, englische Fachbegriffe in der IT oder franzoesische Ausdruecke in der Gastronomie werden oft phonetisch statt korrekt transkribiert.
Firmennamen: "N8N" wird zu "n acht n" oder "n 8 n", "SuperSpeech" wird zu "super speech" oder "Super Speech".

Die Loesung: Nachgelagerte Korrektur

Das benutzerdefinierte Woerterbuch arbeitet als Nachbearbeitungsschritt. Nachdem das Spracherkennungsmodell den Text erzeugt hat, durchsucht SuperSpeech das Ergebnis nach bekannten Fehlervarianten und ersetzt sie durch die korrekte Schreibweise. Das geschieht in Millisekunden und ist fuer dich unsichtbar -- du siehst nur das korrigierte Ergebnis.

Dieser Ansatz hat einen entscheidenden Vorteil gegenueber dem Versuch, das Modell selbst zu veraendern: Du brauchst kein Machine-Learning-Wissen, kein Finetuning und keine Trainingsdaten. Du definierst einfach eine Liste von Ersetzungen, und SuperSpeech wendet sie an.

Schritt-fuer-Schritt-Anleitung

Schritt 1: Woerterbuch oeffnen

SuperSpeech bietet zwei Wege, das Woerterbuch zu bearbeiten:

Ueber die grafische Oberflaeche:

Oeffne SuperSpeech ueber das Tray-Icon oder den Hotkey.
Navigiere zu Einstellungen und dann zum Reiter Woerterbuch.
Hier siehst du eine Liste aller vorhandenen Eintraege und kannst neue hinzufuegen, bestehende bearbeiten oder einzelne Eintraege deaktivieren.

Ueber die JSON-Datei: Das Woerterbuch wird als JSON-Datei gespeichert. Du kannst sie mit jedem Texteditor bearbeiten:

macOS: ~/Library/Application Support/SuperSpeech/custom_dictionary.json
Windows: %LOCALAPPDATA%/SuperSpeech/custom_dictionary.json

Die direkte Bearbeitung der JSON-Datei ist praktisch, wenn du viele Eintraege auf einmal hinzufuegen moechtest oder das Woerterbuch mit Kollegen teilen willst.

Schritt 2: Eintraege anlegen

Jeder Woerterbuch-Eintrag besteht aus drei Teilen:

output: Das korrekte Wort oder die korrekte Schreibweise, die im Transkriptionsergebnis erscheinen soll.
variants: Eine Liste von Varianten, die das Sprachmodell moeglicherweise erkennt. Hier traegest du alle phonetischen Schreibweisen ein, die du beobachtet hast.
enabled: Ein Schalter, um einzelne Eintraege zu aktivieren oder zu deaktivieren, ohne sie loeschen zu muessen.

Ein einfaches Beispiel:

{
  "output": "API",
  "variants": ["a p i", "a pi", "api"],
  "caseSensitive": false,
  "enabled": true
}

Wenn das Modell "a p i" oder "a pi" erkennt, ersetzt SuperSpeech es automatisch durch "API".

Schritt 3: Varianten herausfinden

Der wichtigste Schritt beim Anlegen von Woerterbuch-Eintraegen ist das Sammeln der Varianten. Dafuer gibt es zwei Strategien:

Strategie 1: Beobachten und korrigieren Diktiere einige typische Saetze mit deinem Fachvokabular und schaue dir an, wie SuperSpeech die Begriffe transkribiert. Notiere die Fehlervarianten und trage sie ins Woerterbuch ein. Nach ein bis zwei Tagen hast du die haeufigsten Fehlerkennungen abgedeckt.

Strategie 2: Phonetisch vorausdenken Ueberlege dir, wie das Modell ein Wort hoeren koennte. "Cholezystektomie" koennte als "Kolesystektomie", "Kole Systeme Tomie" oder "Kohlezystektomie" erkannt werden. Trage alle Varianten ein, die dir plausibel erscheinen. Es schadet nicht, mehr Varianten anzugeben als noetig -- ueberfluessige Varianten werden einfach nie ausgeloest.

Schritt 4: Testen

Nach dem Anlegen neuer Eintraege teste sie direkt:

Oeffne ein Textfenster (z.B. einen Editor oder eine E-Mail).
Druecke den SuperSpeech-Hotkey.
Sprich einen Satz mit dem Fachbegriff.
Pruefe, ob die Ersetzung korrekt angewendet wurde.

Wenn der Begriff weiterhin falsch transkribiert wird, hast du moeglicherweise eine Variante uebersehen. Schaue dir die rohe Transkription an (ohne Woerterbuch-Korrektur) und fuege die fehlende Variante hinzu.

Praxisbeispiele nach Branche

Medizin

Medizinisches Fachvokabular gehoert zu den anspruchsvollsten Anwendungsfaellen fuer Spracherkennung. Hier ein Beispiel-Woerterbuch fuer eine allgemeinmedizinische Praxis:

[
  {
    "output": "Acetylsalicylsaeure",
    "variants": ["aseti salezil saeure", "acetil salizil saeure", "azetil salizil saeure"],
    "caseSensitive": false,
    "enabled": true
  },
  {
    "output": "Cholezystektomie",
    "variants": ["kolesystektomie", "kole systeme tomie", "kohlezystektomie"],
    "caseSensitive": false,
    "enabled": true
  },
  {
    "output": "HbA1c",
    "variants": ["h b a eins c", "hb a eins c", "h b a 1 c"],
    "caseSensitive": true,
    "enabled": true
  },
  {
    "output": "MRT",
    "variants": ["m r t", "m rt", "mrt"],
    "caseSensitive": true,
    "enabled": true
  },
  {
    "output": "EKG",
    "variants": ["e k g", "e kg", "ekg"],
    "caseSensitive": true,
    "enabled": true
  },
  {
    "output": "Metoprolol-succinat",
    "variants": ["metoprolol succinat", "meto prolol succinat"],
    "caseSensitive": false,
    "enabled": true
  }
]

Recht

Juristische Fachsprache kombiniert deutsche Gesetzessprache mit lateinischen Begriffen und strukturierten Verweisen:

[
  {
    "output": "BGB",
    "variants": ["b g b", "b gb", "bgb"],
    "caseSensitive": true,
    "enabled": true
  },
  {
    "output": "ZPO",
    "variants": ["z p o", "z po", "zpo"],
    "caseSensitive": true,
    "enabled": true
  },
  {
    "output": "StGB",
    "variants": ["s t g b", "st g b", "stgb"],
    "caseSensitive": true,
    "enabled": true
  },
  {
    "output": "culpa in contrahendo",
    "variants": ["kulpa in kontrahendo", "kulpa in contrahendo"],
    "caseSensitive": false,
    "enabled": true
  },
  {
    "output": "BGH",
    "variants": ["b g h", "bgh"],
    "caseSensitive": true,
    "enabled": true
  },
  {
    "output": "OLG",
    "variants": ["o l g", "olg"],
    "caseSensitive": true,
    "enabled": true
  }
]

Technik und IT

In der IT-Branche treffen englische Fachbegriffe auf Abkuerzungen und Produktnamen:

[
  {
    "output": "API",
    "variants": ["a p i", "a pi"],
    "caseSensitive": true,
    "enabled": true
  },
  {
    "output": "Kubernetes",
    "variants": ["kubernetics", "kubernetis", "kuh bernetics"],
    "caseSensitive": false,
    "enabled": true
  },
  {
    "output": "PostgreSQL",
    "variants": ["post gre sql", "postgres q l", "post gress kju el"],
    "caseSensitive": false,
    "enabled": true
  },
  {
    "output": "GitHub",
    "variants": ["git hub", "git hab", "gitt hub"],
    "caseSensitive": false,
    "enabled": true
  },
  {
    "output": "CI/CD",
    "variants": ["c i c d", "ci cd", "c i / c d"],
    "caseSensitive": true,
    "enabled": true
  },
  {
    "output": "N8N",
    "variants": ["n acht n", "n 8 n", "n eight n"],
    "caseSensitive": true,
    "enabled": true
  }
]

Finanzen und Steuern

Im Finanzbereich kommen Abkuerzungen, Gesetzesverweise und englische Fachbegriffe zusammen:

[
  {
    "output": "EStG",
    "variants": ["e s t g", "e st g", "estg"],
    "caseSensitive": true,
    "enabled": true
  },
  {
    "output": "UStG",
    "variants": ["u s t g", "u st g", "ustg"],
    "caseSensitive": true,
    "enabled": true
  },
  {
    "output": "EBITDA",
    "variants": ["ebitda", "e bit da", "ebit da"],
    "caseSensitive": true,
    "enabled": true
  },
  {
    "output": "KfW",
    "variants": ["k f w", "kfw"],
    "caseSensitive": true,
    "enabled": true
  },
  {
    "output": "Abgeltungsteuer",
    "variants": ["abgeltungs steuer", "abgeltung steuer"],
    "caseSensitive": false,
    "enabled": true
  },
  {
    "output": "GuV",
    "variants": ["g u v", "guv", "gu v"],
    "caseSensitive": true,
    "enabled": true
  }
]

Das JSON-Format im Detail

Das Woerterbuch wird als JSON-Array gespeichert. Jedes Element ist ein Objekt mit folgenden Feldern:

output (Pflichtfeld)

Der korrekte Text, der im Transkriptionsergebnis erscheinen soll. Das kann ein einzelnes Wort, eine Abkuerzung oder ein mehrwortiger Ausdruck sein.

"output": "Acetylsalicylsaeure"

variants (Pflichtfeld)

Ein Array von Zeichenketten, die das Sprachmodell moeglicherweise fuer dieses Wort erkennt. Du kannst beliebig viele Varianten angeben. Jede Variante wird in der Transkription gesucht und durch den output-Wert ersetzt.

"variants": ["aseti salezil saeure", "acetil salizil saeure"]

Tipp: Gib lieber zu viele Varianten an als zu wenige. Eine Variante, die nie in der Transkription vorkommt, schadet nicht -- sie wird einfach nie ausgeloest. Eine fehlende Variante bedeutet dagegen eine verpasste Korrektur.

caseSensitive (Optional)

Bestimmt, ob die Suche nach Varianten die Gross- und Kleinschreibung beruecksichtigt. Standardwert ist false.

false (Standard): Die Variante "api" findet sowohl "api" als auch "API" und "Api" im Transkriptionstext.
true: Die Variante "api" findet nur exakt "api", nicht "API" oder "Api".

Wann solltest du caseSensitive: true verwenden?

Bei Abkuerzungen, die nur in Grossbuchstaben korrekt sind: "API", "MRT", "EKG", "BGH"
Bei Eigennamen mit spezifischer Schreibweise: "GitHub" (nicht "github"), "macOS" (nicht "MacOS")
Bei Woertern, die in verschiedenen Schreibweisen unterschiedliche Bedeutungen haben

In den meisten Faellen ist false die richtige Wahl, weil es mehr Fehlervarianten abfaengt.

enabled (Optional)

Ein boolescher Wert, der den Eintrag aktiviert oder deaktiviert. Standardwert ist true.

"enabled": false

Das ist nuetzlich, wenn du einen Eintrag voruebergehend ausschalten moechtest, ohne ihn zu loeschen -- zum Beispiel, wenn eine Ersetzung in einem bestimmten Kontext unerwuenschte Ergebnisse liefert und du sie spaeter anpassen willst.

Fortgeschrittene Techniken

Mehrwort-Ersetzungen

Das Woerterbuch kann nicht nur einzelne Woerter ersetzen, sondern auch Wortgruppen:

{
  "output": "culpa in contrahendo",
  "variants": ["kulpa in kontrahendo", "culpa in kontrahendo"],
  "caseSensitive": false,
  "enabled": true
}

Das ist besonders nuetzlich fuer feststehende Ausdruecke und Redewendungen, die als Einheit korrekt geschrieben werden muessen.

Woerterbuch fuer Teams

In Kanzleien, Praxen oder Unternehmen mit mehreren Nutzern lohnt sich ein gemeinsam gepflegtes Woerterbuch. Die JSON-Datei laesst sich auf einem internen Netzlaufwerk oder in einem geteilten Ordner ablegen. Jeder Arbeitsplatz referenziert dieselbe Datei.

So richtest du das ein:

Erstelle das Woerterbuch einmal zentral und speichere es auf dem gemeinsamen Laufwerk (z.B. Z:\SuperSpeech\kanzlei_woerterbuch.json).
Konfiguriere SuperSpeech auf jedem Arbeitsplatz so, dass es diese Datei als Woerterbuch verwendet.
Aenderungen an der zentralen Datei werden beim naechsten Diktat automatisch uebernommen.

Tipp: Bestimme eine verantwortliche Person, die das Woerterbuch pflegt und neue Eintraege hinzufuegt. So vermeidest du doppelte oder widerspruchliche Eintraege.

Woerterbuch schrittweise aufbauen

Du musst nicht sofort ein vollstaendiges Woerterbuch erstellen. Der effizienteste Ansatz:

Woche 1: Diktiere normal und notiere alle Fachbegriffe, die falsch erkannt werden.
Woche 2: Trage die gesammelten Begriffe mit ihren beobachteten Fehlervarianten ins Woerterbuch ein.
Laufend: Ergaenze neue Begriffe, sobald sie auffallen.

Nach zwei bis drei Wochen hast du erfahrungsgemaess 80 bis 90 Prozent deines haeufig verwendeten Fachvokabulars abgedeckt. Von da an wird das Woerterbuch nur noch selten erweitert.

Konflikte vermeiden

Achte darauf, dass Varianten nicht zu allgemein formuliert sind. Ein Beispiel:

{
  "output": "CT",
  "variants": ["c t"],
  "caseSensitive": false,
  "enabled": true
}

Die Variante "c t" ist so kurz, dass sie moeglicherweise in anderen Kontexten ungewollt ausgeloest wird. Besser ist es, etwas laengere oder spezifischere Varianten zu verwenden, oder caseSensitive: true zu setzen, damit nur die exakte Schreibweise "c t" (in Kleinbuchstaben) ersetzt wird.

Generell gilt: Je kuerzer die Variante, desto hoeher das Risiko unbeabsichtigter Ersetzungen. Teste neue Eintraege nach dem Hinzufuegen mit ein paar typischen Saetzen.

Zusammenspiel mit der Grammatikkorrektur

SuperSpeech bietet neben dem Woerterbuch eine optionale Grammatikkorrektur, die ebenfalls vollstaendig lokal laeuft. Die Reihenfolge der Verarbeitung ist:

Spracherkennung (Parakeet-TDT) erzeugt den Rohtext.
Woerterbuch ersetzt bekannte Fehlervarianten.
Grammatikkorrektur (optional) glaettet Satzzeichen, Gross- und Kleinschreibung und Formulierungen.

Die Grammatikkorrektur greift also nach dem Woerterbuch. Das bedeutet: Deine Woerterbuch-Ersetzungen werden von der Grammatikkorrektur respektiert. Wenn das Woerterbuch "b g b" zu "BGB" korrigiert hat, wird die Grammatikkorrektur "BGB" nicht wieder aendern.

Fuer die meisten Nutzer reicht das Woerterbuch allein aus. Die Grammatikkorrektur ist besonders dann hilfreich, wenn du laengere Passagen am Stueck diktierst und eine natuerlichere Zeichensetzung und Satzstruktur wuenschst.

Haeufige Fragen

Wie viele Eintraege kann das Woerterbuch haben?

Es gibt kein festes Limit. Woerterbuecher mit mehreren hundert Eintraegen funktionieren ohne spuerbare Verlangsamung -- die Nachbearbeitung dauert selbst mit 500 Eintraegen nur wenige Millisekunden.

Kann ich mehrere Woerterbuecher verwenden?

SuperSpeech verwendet pro Konfiguration ein Woerterbuch. Wenn du zwischen Fachgebieten wechselst, kannst du alle Begriffe in einem Woerterbuch zusammenfassen oder die JSON-Datei austauschen.

Was passiert bei einem SuperSpeech-Update?

Das Woerterbuch ist eine separate Datei, die von Updates nicht betroffen ist. Deine Eintraege bleiben erhalten.

Kann das Woerterbuch die Spracherkennung selbst verbessern?

Nein -- das Woerterbuch arbeitet als Nachbearbeitungsschritt. Es korrigiert das Ergebnis nachtraeglich, nicht die Erkennung selbst. In der Praxis ist die phonetische Erkennung des Modells nah genug am richtigen Wort, dass eine Textersetzung zuverlaessig funktioniert.

Fazit: Kleine Konfiguration, grosse Wirkung

Das benutzerdefinierte Woerterbuch ist eine der wirkungsvollsten Funktionen von SuperSpeech -- und eine der einfachsten zu konfigurieren. Mit einer Handvoll Eintraegen fuer deine haeufigsten Fachbegriffe erreichst du eine Erkennungsgenauigkeit, die mit allgemeiner Spracherkennung unmoeglich waere.

Der Zeitaufwand fuer die Einrichtung ist minimal: Eine halbe Stunde fuer die initiale Konfiguration, danach ein paar Minuten pro Woche fuer neue Begriffe. Die Zeitersparnis durch korrekt erkannte Fachbegriffe uebersteigt diesen Aufwand ab dem ersten Diktat.

Wenn du SuperSpeech fuer die Arbeit mit Fachvokabular nutzen moechtest, richte das Woerterbuch direkt bei der Installation ein. Du findest die Funktion unter Einstellungen und dann Woerterbuch -- oder bearbeite die JSON-Datei direkt, wenn du viele Eintraege auf einmal anlegen moechtest. Bei Fragen hilft dir unser Support-Team gerne weiter.

Starte jetzt mit der Online-Demo oder sieh dir die Preise an, um SuperSpeech mit deinem eigenen Fachvokabular zu testen.