Zum Inhalt springen
Kindler | Dev

← Blog

Listen4Me gebaut — Untertitel direkt auf dem Gerät

16.11.2023 · von Björn Kindler

Listen4Me war meine erste iOS-App — ein kleines Werkzeug für mehr Barrierefreiheit, das gesprochenes Deutsch in Echtzeit als Untertitel auf iPad oder iPhone bringt. Keine Cloud-Runden. Rein deutsch, und bewusst einfach.

Warum diese App zuerst

Eine Verwandte verliert langsam das Gehör. Restaurants, Familienessen, Videoanrufe — immer dasselbe Bild: eine Weile konnte sie Lippen lesen, dann nicht mehr, dann lief das Gespräch ohne sie weiter. Apples eingebaute Live-Untertitel gab es auf iOS damals noch nicht, und die Drittanbieter-Lösungen schickten den Ton in der Regel durch einen Cloud-Transkriptor. Jemandem ein Telefon hinhalten, dessen Stimme durch einen Server in einem anderen Land läuft, war nicht die Antwort.

Der Auftrag war einfach: eine App, die genau eine Sache macht — zuhören, transkribieren, groß anzeigen — und das auf dem Gerät. Etwas, das man jemandem in einem lauten Raum in die Hand drücken kann und das einfach funktioniert.

Die erste Version

v1 von Listen4Me nutzte den eingebauten SFSpeechRecognizer mit aktivierter On-Device-Erkennung, Long-Form-Modus, dazu eine eigene Audio-Session, die Kopfhörer-Umsteckereien und Bluetooth-Reconnects überlebt. Die UI war bewusst hässlich: ein großer schwarzer Bildschirm mit weißem Text und einer Schriftauswahl. Keine Tabs. Keine Einstellung, die nicht zwingend sein musste.

Das schwierigere Problem war nicht die Transkription, sondern der Zustand. Eine schwerhörige Nutzerin will nicht im Zweifel sein, ob das Mikrofon läuft. Die Audio-Engine muss kurze Backgroundings überleben und beim Aufleuchten des Bildschirms sauber weitermachen. Auf der Anzeige müssen genug Zeilen stehen bleiben, dass man den letzten Gedanken wieder findet, bevor er aus dem Bild rollt. Jede dieser kleinen Entscheidungen war eine Rückkopplung mit meiner Verwandten.

Bewusst nur Deutsch

Listen4Me kann nur Deutsch. Die Person, für die ich sie gebaut habe, spricht Deutsch, und es ging darum, Auswahl wegzunehmen, nicht hinzuzufügen — keine Sprachauswahl, nichts, wo man auf der falschen Einstellung landet. SFSpeechRecognizer ist auf Deutsch mit On-Device-Erkennung festgelegt, und das ist die ganze Sprach-Geschichte.

Was ich heute anders machen würde

Mit den heutigen On-Device-Modellen wäre der Transkriptions-Kern anders. Die whisper.cpp-Arbeit, die in Mundwerk für macOS steckt, könnte im Prinzip auch auf dem iPhone landen — Apple-Silicon-iPads haben mittlerweile genug Reserven. Eine zweite Iteration von Listen4Me würde das prüfen, besonders für den Offline-Fall, in dem die Sprachmodelle von SFSpeechRecognizer nicht vorhanden sind.

Die UI würde auch eine sorgfältige Überarbeitung bekommen. Die erste Version ist funktional und aufgeräumt, aber nicht schön — und Apps für Barrierefreiheit verdienen die gleiche Sorgfalt wie alle anderen. Typografie, Kontrast, reduzierte Bewegung — da geht mehr.

Wo nachschauen

Die Produkt-Seite liegt unter /de/apps/listen4me/, die App selbst im iOS App Store. Listen4Me ist ein leises kleines Werkzeug. Wenn jemand in deinem Leben so etwas braucht — das ist die Zielgruppe, an die ich beim Bauen gedacht habe.

← Zurück zum Blog