Systemweites Diktieren für macOS und Windows

Ein Diktier-Engine, jede Anwendung. Funktioniert in nativen Apps, Browsern, Terminals und sogar in virtuellen Maschinen.

Systemweites Diktieren bedeutet: SuperSpeech funktioniert überall, wo du tippen kannst: in Microsoft Word, im Browser, im Terminal, in Slack, in deiner IDE, in einer VM. Keine pro-App-Integration, keine Erweiterungen, keine Plugins zu warten. Das ist die grundlegende Architekturentscheidung, die SuperSpeech alltagstauglich macht.

Wie systemweites Diktieren funktioniert

Statt einer App, zu der du wechselst, läuft SuperSpeech als Hintergrunddienst mit globalem Hotkey. Wenn du Diktat auslöst, wird Audio vom Standard-Mikrofon aufgenommen, lokal transkribiert und der Text per OS-Input-APIs am Cursor eingefügt. Am Mac: Accessibility-APIs. Unter Windows: SendInput.

  • Funktioniert in jedem Texteingabefeld — keine App-Whitelist
  • Läuft als leichtgewichtige Tray-/Menüleisten-App (~100 MB RAM)
  • Globaler Hotkey löst Diktat ohne App-Wechsel aus
  • Output geht an deine aktuelle Cursor-Position
  • Keine Erweiterung, kein Plugin, keine pro-App-Konfiguration

Getestete Apps und Umgebungen

SuperSpeech funktioniert zuverlässig in:

  • Microsoft Office (Word, Excel, PowerPoint, Outlook)
  • Google Docs, Sheets, Slides, Gmail
  • Slack, Discord, Teams, Zoom-Chat
  • VS Code, JetBrains-IDEs, Sublime, Zed, Xcode
  • Chrome, Safari, Firefox, Edge — alle Web-Apps
  • Terminal, iTerm2, Warp, Windows Terminal, PowerShell
  • Notion, Obsidian, Craft, Bear, Drafts
  • Electron-Apps und VM-Umgebungen (Parallels, VMware)

Architektur

SuperSpeech besteht aus drei Schichten: native Tray-UI (AppKit/SwiftUI am Mac, WinUI/WPF unter Windows), eine ring-buffered Audio-Engine bei 16 kHz Mono und eine ML-Inferenz-Engine mit Core ML am Mac oder ONNX Runtime unter Windows. Diese Schichten kommunizieren via In-Process-Kanäle für null IPC-Latenz.

Ressourcen-Fußabdruck

Idle: ~100 MB RAM, 0-1 % CPU. Während Diktat: +400 MB RAM mit Modell geladen, 15-20 % CPU-Burst bei Inferenz (oft weniger auf GPU/ANE). Das macht SuperSpeech bequem, den ganzen Tag laufen zu lassen.

Häufige Fragen

Funktioniert es in Web-Apps?

Ja. Systemweites Diktieren funktioniert in jedem Texteingabefeld in jedem Browser — inkl. Google Docs, Notion, Linear, Slack Web und jeder Webapp.

Braucht es Erweiterungen oder Plugins?

Nein. Keine Browser-Erweiterungen, keine App-Plugins. SuperSpeech arbeitet auf OS-Input-Ebene und funktioniert überall dort, wo Tippen funktioniert.

Funktioniert es in virtuellen Maschinen?

Ja, mit Einschränkungen. In Parallels Desktop muss Accessibility-Forwarding aktiviert werden. Windows-VMs am Mac funktionieren via SendInput-Forwarding.

Wie viel RAM nutzt es?

Idle: ~100 MB. Mit Modell geladen und diktierend: ~500 MB. Modell wird nach längerer Inaktivität entladen, um Speicher freizugeben.

Verlangsamt es meinen Mac oder PC?

Idle-Impact ist vernachlässigbar. Während Diktat kurzer CPU-/GPU-Burst für Inferenz, dann wieder idle. Die meisten Nutzer bemerken SuperSpeech nicht.

Ein Tool für jedes Texteingabefeld

Funktioniert in Word, Gmail, Slack, VS Code und überall sonst. 30 Tage kostenlos testen.