Präzise Transkription Ihrer Vorlesungen, Interviews und Feldaufnahmen — direkt auf Ihrem Windows-PC, ohne Internetverbindung, mit vollständigem Datenschutz.
Wer an einer deutschen Universität forscht, kennt das Problem: Stunden von Interviewaufnahmen, Vorlesungsmitschnitten und Feldaufzeichnungen warten auf Transkription — und die Deadlines für Qualifikationsarbeiten, Drittmittelanträge oder Konferenzbeiträge rücken unerbittlich näher. Akademische Transkriptionssoftware wie StarWhisper löst dieses Problem auf einem Weg, den Cloud-Dienste grundsätzlich nicht bieten können: vollständig offline, auf dem eigenen Gerät, ohne monatliche Minutengebühren.
Die DSGVO stellt besondere Anforderungen an den Umgang mit personenbezogenen Daten — und Interviewdaten aus der Sozialforschung, der Psychologie oder den Gesundheitswissenschaften fallen fast immer in diese Kategorie. Cloud-Transkriptionsdienste, die Audiodaten auf US-amerikanische oder britische Server hochladen, schaffen hier ein echtes Compliance-Problem. StarWhisper umgeht dieses Problem strukturell: Die KI läuft lokal, kein Bit verlässt den Rechner.
Ob Doktorand an der Freien Universität Berlin, Professorin an der LMU München oder wissenschaftliche Mitarbeiterin an der Universität Wien — akademische Transkriptionssoftware muss präzise, schnell und datenschutzkonform sein. StarWhisper erfüllt alle drei Anforderungen.
Forschungsinterviews enthalten regelmäßig personenbezogene Daten: Namen, Ortsangaben, Gesundheitsinformationen, politische Meinungen. Die DSGVO schreibt vor, dass solche Daten nur mit ausdrücklicher Einwilligung der Befragten an Dritte weitergegeben werden dürfen. Kein Interviewpartner hat typischerweise eingewilligt, dass seine Stimmdaten auf den Servern eines US-amerikanischen KI-Unternehmens landen. StarWhisper macht diese Frage obsolet: Die Transkription läuft komplett auf dem lokalen Windows-Rechner, kein Datentransfer, kein Cloud-Upload, keine Drittpartei.
OpenAI Whisper wurde auf 680.000 Stunden mehrsprachigen Audiomaterials trainiert — das ursprüngliche Whisper-Paper weist Fehlerquoten aus, die professionellen menschlichen Transkribenten nahe kommen. Das large-v3-Modell erkennt Fachvokabular, Dialekte und Akzente deutlich zuverlässiger als die meisten Cloud-Dienste. Für Interviews auf Schweizerdeutsch, österreichischem Dialekt oder regionalem Bairisch macht dieser Unterschied sich in der Praxis stark bemerkbar.
Minutenbasierte Cloud-Dienste kosten schnell mehr als gedacht: 20 Stunden Interviewmaterial zu üblichen Marktpreisen von 0,15–0,25 € pro Minute bedeutet 180–300 €. StarWhisper Pro kostet 10 US-Dollar im Monat — pauschal, ohne Mengenbegrenzung. Für Drittmittelprojekte, die ihre Ausgaben gegenüber der DFG oder dem FWF rechtfertigen müssen, ist ein vorhersehbarer Fixpreis ein klarer Vorteil.
Leitfadeninterviews, Fokusgruppen, ethnografische Beobachtungsprotokolle — StarWhisper transkribiert mehrstündige Aufnahmen in Minuten. Das Ergebnis lässt sich direkt in MAXQDA oder Atlas.ti importieren.
Spontansprachkorpora, Dialektaufnahmen, Mehrsprachigkeitsforschung: StarWhisper unterstützt über 29 Sprachen und erkennt zuverlässig auch Code-Switching zwischen Sprachen.
Patienteninterviews, klinische Beobachtungsstudien, Experteninterviews mit Medizinern — sensible Gesundheitsdaten bleiben dank lokaler Verarbeitung vollständig auf dem Forschungsrechner.
Untertitel für Aufzeichnungen, Transkripte für Barrierefreiheit, durchsuchbare Skripte aus Audiovorlesungen — StarWhisper automatisiert diesen Workflow vollständig.
Für die Gesprächsanalyse und die dokumentarische Methode nach Bohnsack liefert StarWhisper Rohtransskripte, die Forschende anschließend nach GAT2-Konventionen verfeinern können — ohne die mühsame Ersttranskription per Hand erledigen zu müssen.
Kostenloser Download: StarWhisper ist dauerhaft kostenlos für bis zu 500 Wörter am Tag — ideal für Studienanfänger und kleinere Transkriptionsprojekte. Jetzt herunterladen und erste Transkripte erstellen.
StarWhisper bündelt verschiedene Whisper-Modelle. Die Wahl des richtigen Modells ist ein Trade-off zwischen Geschwindigkeit und Genauigkeit — und hängt von der Qualität des Audiomaterials ab.
| Modell | Geschwindigkeit | Genauigkeit | Empfohlen für |
|---|---|---|---|
| Tiny / Base | Sehr schnell | Gut | Klares Hochdeutsch, erste Sichtung |
| Small | Schnell | Sehr gut | Standardinterviews, Vorlesungen |
| Medium | Mittel | Exzellent | Dialekt, Mehrsprachigkeit, Fachterminologie |
| Large-v3 | Mit GPU schnell | Höchste | Publikationsreife Transkripte |
Anmerkung: Medium und Large-v3 sind Pro-Modelle. Der Kostenlose Plan enthält Tiny, Base und Small — für die meisten akademischen Interviews völlig ausreichend.
Wie schneidet StarWhisper als akademische Transkriptionssoftware gegenüber den verbreiteten Alternativen ab? Hier eine ehrliche Einschätzung.
f4transkript ist ein Klassiker im deutschsprachigen qualitativen Forschungsraum, aber es bietet keine KI-gestützte automatische Transkription. StarWhisper übernimmt den ersten Transkriptionsschritt vollautomatisch; anschließend kann das Ergebnis in f4transkript zur manuellen Nachbearbeitung importiert werden.
Beide Dienste laden Audiodaten auf US-Server hoch — was für personenbezogene Forschungsdaten kritisch ist. StarWhisper läuft vollständig offline. Außerdem: keine Minute Extrakosten, keine Kontosperrung bei Überschreitung eines Minutenkontingents. Mehr zu Notta-Alternativen auf Deutsch.
Dragon ist für Live-Diktat optimiert, nicht für die Nachtranskription von Audiodateien. StarWhisper kann beides: Echtzeit-Diktat in jedes Windows-Programm und Batch-Transkription von Interviewaufnahmen. Für mehr zum Vergleich mit Dragon auf Deutsch.
Windows 10/11 · Kein Konto erforderlich · Für immer kostenlos (500 Wörter/Tag)
Wer nur gelegentlich kurze Interviews transkribiert, kommt auch ohne NVIDIA-GPU gut aus — Base und Small laufen auf jedem modernen Windows-Rechner akzeptabel schnell. Aber für Projekte mit stundenlangem Material ändert sich das Bild erheblich.
Mit einer NVIDIA RTX 3060 oder 3070 läuft das large-v3-Modell schneller als Echtzeit: Eine 60-minütige Interviewaufnahme ist in etwa 12–15 Minuten transkribiert. Ohne GPU dauert dasselbe mit dem CPU-Fallback vier- bis fünfmal länger. Für eine Dissertation mit 40+ Stunden Interviewmaterial bedeutet das: GPU-Beschleunigung spart buchstäblich Arbeitstage.
CUDA wird automatisch erkannt — keine manuelle Konfiguration notwendig. StarWhisper prüft beim Start, ob eine kompatible NVIDIA-Karte vorhanden ist, und wechselt automatisch in den GPU-Modus. Für Nutzerinnen und Nutzer an Hochschulen, die mit Workstations oder Laptops mit diskreter GPU arbeiten, ist dies ein erheblicher Produktivitätsgewinn.
Ja. Da StarWhisper vollständig lokal auf dem Windows-Rechner läuft und keine Audiodaten an externe Server überträgt, entsteht kein Datentransfer im Sinne der DSGVO. Personenbezogene Sprachdaten aus Forschungsinterviews verlassen den Rechner nicht. Dennoch empfiehlt es sich, die Verarbeitung in der Einwilligungserklärung der Studienteilnehmer transparent zu dokumentieren.
Das large-v3-Modell zeigt eine deutlich bessere Dialekterkennung als kleinere Modelle. Schweizerdeutsch ist herausfordernd für alle automatischen Systeme — hier empfehlen wir das large-v3-Modell und eine anschließende manuelle Korrekturrunde. Bairisch, Österreichisch und andere bundesrepublikanische Dialekte werden vom medium-Modell aufwärts gut erkannt.
StarWhisper exportiert Transkripte als TXT oder kopiert Text direkt in die Zwischenablage. Beide Formate lassen sich direkt in MAXQDA und Atlas.ti importieren. MAXQDA unterstützt auch synchronisierte Audio-Transkript-Verknüpfungen — dafür exportiert man das StarWhisper-Transkript als TXT und verknüpft es manuell mit der Audiodatei in MAXQDA.
Ja, Whisper ist besonders robust gegenüber Hintergrundgeräuschen — das war ein explizites Designziel der OpenAI-Forscher. Typische Hörsaalgeräusche, Tastaturrauschen und leises Murren im Hintergrund beeinträchtigen die Erkennungsqualität nur marginal. Bei sehr schlechter Audioqualität empfiehlt sich vorab eine Rauschunterdrückung mit Tools wie Audacity.
Der Kostenlose Plan ist dauerhaft kostenlos und bietet 500 Wörter pro Tag — für viele Studenten völlig ausreichend. Pro kostet 10 US-Dollar pro Monat oder 80 US-Dollar pro Jahr (entspricht ca. 9–10 € bei aktuellem Wechselkurs). Ein akademischer Gruppenrabatt ist aktuell in Planung; Anfragen können an support@starwhisper.ai gesendet werden.
Der Einstieg in StarWhisper ist bewusst einfach gehalten. Kein Konto, keine Kreditkarte, kein Cloud-Setup. Herunterladen, installieren, erstes Modell laden — das erste Transkript ist in wenigen Minuten fertig.
Für größere Transkriptionsprojekte im Forschungskontext empfehlen wir den Pro-Plan: unbegrenzte Wortanzahl, Zugang zu den großen Modellen und keine Nutzungsunterbrechungen während einer langen Batch-Transkription. Ob Dissertation, Habilitationsschrift oder Drittmittelprojekt — die akademische Transkriptionssoftware von StarWhisper skaliert mit dem Forschungsvorhaben mit.
Weiterführende Informationen finden sich auch auf unserer Seite zur Besprechungstranskription sowie zum Thema medizinische Diktiersoftware für Forschende im Gesundheitswesen.
Kostenlos starten. Kein Konto. Keine Cloud. Keine Kompromisse beim Datenschutz.
Jetzt kostenlos herunterladen