Listen4Me gebaut — Untertitel direkt auf dem Gerät
16.11.2023 · von Björn Kindler
Listen4Me war meine erste iOS-App — ein kleines Werkzeug für mehr Barrierefreiheit, das gesprochenes Deutsch in Echtzeit als Untertitel auf iPad oder iPhone bringt. Keine Cloud-Runden. Rein deutsch, und bewusst einfach.
Warum diese App zuerst
Eine Verwandte verliert langsam das Gehör. Restaurants, Familienessen, Videoanrufe — immer dasselbe Bild: eine Weile konnte sie Lippen lesen, dann nicht mehr, dann lief das Gespräch ohne sie weiter. Apples eingebaute Live-Untertitel gab es auf iOS damals noch nicht, und die Drittanbieter-Lösungen schickten den Ton in der Regel durch einen Cloud-Transkriptor. Jemandem ein Telefon hinhalten, dessen Stimme durch einen Server in einem anderen Land läuft, war nicht die Antwort.
Der Auftrag war einfach: eine App, die genau eine Sache macht — zuhören, transkribieren, groß anzeigen — und das auf dem Gerät. Etwas, das man jemandem in einem lauten Raum in die Hand drücken kann und das einfach funktioniert.
Die erste Version
v1 von Listen4Me nutzte den eingebauten SFSpeechRecognizer mit aktivierter On-Device-Erkennung,
Long-Form-Modus, dazu eine eigene Audio-Session, die Kopfhörer-Umsteckereien und Bluetooth-Reconnects
überlebt. Die UI war bewusst hässlich: ein großer schwarzer Bildschirm mit weißem Text und einer
Schriftauswahl. Keine Tabs. Keine Einstellung, die nicht zwingend sein musste.
Das schwierigere Problem war nicht die Transkription, sondern der Zustand. Eine schwerhörige Nutzerin will nicht im Zweifel sein, ob das Mikrofon läuft. Die Audio-Engine muss kurze Backgroundings überleben und beim Aufleuchten des Bildschirms sauber weitermachen. Auf der Anzeige müssen genug Zeilen stehen bleiben, dass man den letzten Gedanken wieder findet, bevor er aus dem Bild rollt. Jede dieser kleinen Entscheidungen war eine Rückkopplung mit meiner Verwandten.
Bewusst nur Deutsch
Listen4Me kann nur Deutsch. Die Person, für die ich sie gebaut habe, spricht Deutsch, und es ging darum,
Auswahl wegzunehmen, nicht hinzuzufügen — keine Sprachauswahl, nichts, wo man auf der falschen Einstellung
landet. SFSpeechRecognizer ist auf Deutsch mit On-Device-Erkennung festgelegt, und das ist die
ganze Sprach-Geschichte.
Was ich heute anders machen würde
Mit den heutigen On-Device-Modellen wäre der Transkriptions-Kern anders. Die whisper.cpp-Arbeit, die in
Mundwerk für macOS steckt, könnte im Prinzip auch auf dem iPhone landen — Apple-Silicon-iPads haben
mittlerweile genug Reserven. Eine zweite Iteration von Listen4Me würde das prüfen, besonders für den
Offline-Fall, in dem die Sprachmodelle von SFSpeechRecognizer nicht vorhanden sind.
Die UI würde auch eine sorgfältige Überarbeitung bekommen. Die erste Version ist funktional und aufgeräumt, aber nicht schön — und Apps für Barrierefreiheit verdienen die gleiche Sorgfalt wie alle anderen. Typografie, Kontrast, reduzierte Bewegung — da geht mehr.
Wo nachschauen
Die Produkt-Seite liegt unter /de/apps/listen4me/, die App selbst im iOS App Store. Listen4Me ist ein leises kleines Werkzeug. Wenn jemand in deinem Leben so etwas braucht — das ist die Zielgruppe, an die ich beim Bauen gedacht habe.