© 2025 Getty Images
Sprachassistenten

Speech to text: So funktioniert’s bei Han­dy, PC & Co.

Von der Stimme zum Text: Moderne Spracherkennung unterstützt effizientes Arbeiten und erleichtert deinen Alltag.

Spra­che statt Tas­ta­tur: Mit Speech to Text (auch Sprach­er­ken­nung oder Dik­tier­funk­ti­on genannt) kannst du gespro­che­ne Wor­te auto­ma­tisch in geschrie­be­nen Text umwan­deln. Egal, ob du unter­wegs Noti­zen machst, Nach­rich­ten dik­tierst oder gan­ze Tex­te ver­fasst – moder­ne Sprach-zu-Text-Tech­no­lo­gien sind heu­te erstaun­lich prä­zi­se. In die­sem Rat­ge­ber erfährst du, wie Speech to Text funk­tio­niert, wel­che Vor­tei­le es bie­tet und wie du die Funk­ti­on auf dei­nem Han­dy, PC oder Lap­top akti­vierst und opti­mal nutzt. 

Was ist Speech to Text?

„Speech to Text“ beschreibt Soft­ware, die Spra­che in Text umwan­delt. Das Mikro­fon dei­nes Geräts nimmt dabei dei­ne Stim­me auf, die Soft­ware ana­ly­siert Klang, Wör­ter und Satz­me­lo­die und erstellt dar­aus fort­lau­fend einen Text. Dank Künst­li­cher Intel­li­genz (KI) und maschi­nel­lem Ler­nen wird die Sprach­er­ken­nung immer bes­ser. Vie­le Sys­te­me pas­sen sich sogar an dei­nen indi­vi­du­el­len Sprach­stil an. 

War­um sich Sprach­ein­ga­be lohnt

Die Sprach­ein­ga­be ist längst mehr als ein prak­ti­sches Extra. Sie ver­än­dert, wie wir mit unse­ren Gerä­ten inter­agie­ren. Statt müh­sam auf der Tas­ta­tur zu tip­pen, sprichst du ein­fach, was du sagen möch­test, und schon erscheint der Text auf dem Bild­schirm. Speech to Text spart nicht nur Zeit, son­dern macht vie­le Auf­ga­ben im All­tag leich­ter und intui­ti­ver. 

Beson­ders unter­wegs spielt die Funk­ti­on ihre Stär­ken aus: Beim Gehen, im Auto (natür­lich mit Frei­sprech­funk­ti­on) oder beim Kochen kannst du Nach­rich­ten dik­tie­ren, ohne dein Smart­phone in der Hand zu hal­ten. So bleibst du pro­duk­tiv, auch wenn du gera­de kei­ne freie Hand hast. 

Ein wei­te­rer Vor­teil ist die Bar­rie­re­frei­heit. Für Men­schen mit moto­ri­schen Ein­schrän­kun­gen oder Seh­be­ein­träch­ti­gun­gen ist die Dik­tier­funk­ti­on eine wert­vol­le Hil­fe. Sie ermög­licht, Tex­te zu schrei­ben, Mails zu ver­fas­sen oder Such­an­fra­gen zu star­ten – ganz ohne Tas­ta­tur oder Maus. 

Zudem unter­stützt Speech to Text die Krea­ti­vi­tät: Ideen, Gedan­ken oder To-dos kannst du spon­tan ein­spre­chen, ohne den Schreib­fluss zu ver­lie­ren. Natür­lich ist die Tech­no­lo­gie (noch) nicht per­fekt: Dia­lek­te, lau­te Umge­bun­gen oder undeut­li­che Aus­spra­che kön­nen zu Feh­lern füh­ren. Doch mit ein wenig Übung und kla­rer Spra­che wird die Sprach­er­ken­nung schnell zu einer ech­ten All­tags­hil­fe, die dir Schreib­ar­beit abnimmt und wert­vol­le Zeit spart. 

Vor­aus­set­zun­gen: So gelingt die Spracherkennung

Damit Speech to Text zuver­läs­sig funk­tio­niert, müs­sen eini­ge Vor­aus­set­zun­gen stim­men. Das fängt beim Mikro­fon an: Die meis­ten Smart­phones sind mit soli­den inte­grier­ten Mikros aus­ge­stat­tet, die für kur­ze Dik­ta­te völ­lig aus­rei­chen. Wenn du jedoch häu­fig dik­tierst oder pro­fes­sio­nel­le Auf­nah­men machst, lohnt sich ein exter­nes Head­set oder Mikro­fon. Der Klang ist kla­rer und Stör­ge­räu­sche wer­den bes­ser gefil­tert, was die Erken­nungs­ra­te deut­lich ver­bes­sert. 

Eben­so wich­tig ist eine ruhi­ge Umge­bung. Hin­ter­grund­ge­räu­sche wie Stra­ßen­lärm, Musik oder Gesprä­che im Raum kön­nen die Sprach­er­ken­nung irri­tie­ren. Ide­al ist ein stil­ler Raum, in dem dei­ne Stim­me gleich­mä­ßig und ohne Echo auf­ge­nom­men wird. 

Ach­te außer­dem dar­auf, dass Betriebs­sys­tem und Apps aktu­ell sind. Updates brin­gen oft ver­bes­ser­te Sprach­mo­del­le und neue Funk­tio­nen, die die Genau­ig­keit erhö­hen. 

Und schließ­lich spielt auch die Inter­net­ver­bin­dung eine Rol­le: Vie­le Sys­te­me ana­ly­sie­ren Spra­che in der Cloud, wo leis­tungs­star­ke Ser­ver den Text ver­ar­bei­ten. Immer mehr Gerä­te bie­ten jedoch Off­line-Sprach­er­ken­nung, die dei­ne Daten lokal aus­wer­tet – das ist nicht nur schnel­ler, son­dern auch bes­ser für den Daten­schutz. 

Wenn alles stimmt, klappt das Dik­tie­ren fast feh­ler­frei – ob in der Notiz-App, in Word oder im Brow­ser. 

Speech to Text auf Android: So akti­vierst du die Diktierfunktion

Android-Gerä­te bie­ten Speech to Text stan­dard­mä­ßig über die Goog­le-Tas­ta­tur (Gboard) oder eine her­stel­ler­eige­ne App. 

Schritt-für-Schritt-Anlei­tung

  1. Öff­ne eine App mit Text­ein­ga­be, z. B. Whats­App, Nach­rich­ten oder Noti­zen. 
  2. Tip­pe ins Text­feld, damit die Tas­ta­tur erscheint. 
  3. Tip­pe auf das Mikro­fon-Sym­bol auf der Tas­ta­tur. 
  4. Sprich dei­nen Text klar und in nor­ma­lem Tem­po. 
  5. Sag Satz­zei­chen wie „Kom­ma“ oder „Punkt“, um sie auto­ma­tisch ein­fü­gen zu las­sen. 
  6. Prü­fe den Text anschlie­ßend und kor­ri­gie­re bei Bedarf. 

Tipp: In den Gboard-Ein­stel­lun­gen kannst du die Off­line-Sprach­er­ken­nung akti­vie­ren. So bleibt dei­ne Stim­me lokal auf dem Gerät, was ein Plus­punkt für Daten­schutz und Geschwin­dig­keit ist. 

Speech to Text auf dem iPho­ne: So nutzt du die Apple-Diktierfunktion

Auch iPho­nes haben eine inte­grier­te Dik­tier­funk­ti­on, die unab­hän­gig von Siri arbei­tet, aber die­sel­be Sprach­er­ken­nungs­tech­no­lo­gie nutzt. 

Schritt-für-Schritt-Anlei­tung

  1. Öff­ne eine App, in der du Text ein­ge­ben kannst (z. B. Nach­rich­ten, Mail oder Noti­zen). 
  2. Tip­pe auf das Mikro­fon-Sym­bol rechts neben der Leer­tas­te. 
  3. Sprich deut­lich in nor­ma­lem Tem­po. 
  4. Satz­zei­chen setzt das Pro­gramm auto­ma­tisch. Du kannst aller­dings mit­dik­tie­ren wenn du ein ande­res Satz­zei­chen möch­test (also zum Bei­spiel ein Aus­ru­fe­zei­chen statt eines Punk­tes). 
  5. Tip­pe erneut auf das Mikro-Sym­bol, um das Dik­tat zu been­den. 
  6. Lies den Text durch und kor­ri­gie­re bei Bedarf klei­ne Feh­ler. 
  7. Unter Ein­stel­lun­genAll­ge­meinTas­ta­turDik­tier­funk­ti­on akti­vie­ren bzw. deak­ti­vie­ren kannst du fest­le­gen, ob du die Sprach­ein­ga­be nut­zen möch­test. 

Speech to Text am PC: So dik­tierst du unter Windows

Auch am Com­pu­ter lässt sich Spra­che ein­fach in Text ver­wan­delnper­fekt für Office-Doku­men­te, E‑Mails oder län­ge­re Tex­te. 

Schritt-für-Schritt-Anlei­tung

  1. Öff­ne das Pro­gramm, in dem du Text ein­ge­ben willst, z. B. Word, OneN­ote oder eine Mail. 
  2. Drü­cke [Win­dows-Tas­te] + [H], um die Sprach­ein­ga­be zu star­ten. 
  3. Sprich klar ins Mikro­fon; der Text erscheint direkt im Doku­ment. 
  4. Sag Befeh­le wie „neu­er Absatz“ oder „Punkt“, um die For­ma­tie­rung zu steu­ern. 
  5. Been­de das Dik­tat mit der­sel­ben Tas­ten­kom­bi­na­ti­on. 

Alter­na­tiv bie­tet Micro­soft 365 im Menü­band den But­tonDik­tie­ren“. Damit kannst du dei­ne Tex­te direkt in Word oder Out­look ein­spre­chen, sogar mit auto­ma­ti­scher Zei­chen­set­zung. 

Speech to Text auf dem Mac: Sprach­ein­ga­be in macOS

Auch auf dem Mac kannst du ganz ein­fach Spra­che in Text umwan­deln. Apple bie­tet dafür zwei Funk­tio­nen an: die Dik­tier­funk­ti­on und die Sprach­steue­rung. Wäh­rend du mit der Dik­tier­funk­ti­on Tex­te in Noti­zen, Mails oder Doku­men­te ein­spre­chen kannst, erlaubt dir die Sprach­steue­rung zusätz­lich, den Mac kom­plett per Stim­me zu bedie­nen, also Apps zu öff­nen, Menüs anzu­kli­cken oder Befeh­le aus­zu­füh­ren. 

Schritt-für-Schritt-Anlei­tung

  1. Kli­cke im Apple-Menü oben links auf „Sys­tem­ein­stel­lun­gen“ (bzw. „Ein­stel­lun­gen“ in neue­ren macOS-Ver­sio­nen). 
  2.  Wäh­le im Menü „Bedie­nungs­hil­fen“ den Punkt „Sprach­steue­rung“. Akti­vie­re dort die gleich genann­te Funk­ti­on. Beim ers­ten Ein­schal­ten lädt dein Mac even­tu­ell Sprach­da­tei­en her­un­ter, damit du sie auch off­line nut­zen kannst. 
  3. Öff­ne eine App, in der du Text ein­ge­ben möch­test, zum Bei­spiel Pages, Mail oder Noti­zen. Sobald die Sprach­steue­rung aktiv ist, kannst du direkt los­spre­chen. Ein Mikro­fon-Sym­bol in der Menü­leis­te zeigt an, dass dein Mac zuhört. 
  4. Du kannst den Dik­tier­mo­dus über das Mikro­fon-Sym­bol akti­vie­ren oder been­den – oder ein­fach Sprach­be­feh­le wie „Auf­wa­chen“ bzw. „Ruhe­zu­stand akti­vie­ren“ sagen. Wäh­rend des Dik­tats kannst du Befeh­le wie „Kom­ma“, „Punkt“, „neu­er Absatz“ oder „neue Zei­le“ ver­wen­den. 
  5. Wenn du fer­tig bist, klickst du erneut auf das Mikro­fon-Sym­bol oder sagst „Ruhe­zu­stand akti­vie­ren“. Nach einer kur­zen Pau­se been­det dein Mac das Dik­tat auch auto­ma­tisch. 
  6. Unter Tas­ta­tur” → Dik­tat kannst du fest­le­gen, wel­che Spra­che ver­wen­det wird, wel­ches Mikro­fon aktiv ist und ob die auto­ma­ti­sche Inter­punk­ti­on ein­ge­schal­tet sein soll. Dort lässt sich auch die klas­si­sche Dik­tier­funk­ti­on akti­vie­ren, falls du nur Text dik­tie­ren, aber kei­ne Sprach­steue­rung nut­zen möch­test. 

Mit der Sprach­steue­rung und der Dik­tier­funk­ti­on bie­tet macOS ein sehr prä­zi­ses und fle­xi­bles Sys­tem zur Sprach­ein­ga­bem, wel­ches ide­al ist, um län­ge­re Tex­te frei­hän­dig zu schrei­ben oder dei­nen Com­pu­ter ganz ohne Tas­ta­tur zu bedie­nen. 

Nütz­li­che Apps & Alternativen

Neben den inte­grier­ten Sys­tem­funk­tio­nen gibt es auch exter­ne Apps, die Sprach­auf­nah­men in Text umwan­deln, ide­al für Inter­views, Mee­tings oder Pod­casts. Im Fol­gen­den fin­dest du eini­ge Bei­spie­le: 

  • Otter.ai: Erkennt Spre­chen­de auto­ma­tisch und erstellt edi­tier­ba­re Tran­skrip­te. 
  • Not­ta: Wan­delt Audio- und Video-Datei­en in Text um. 
  • Speech­no­tes (Nur für Android): Ein­fa­che App für schnel­le Noti­zen, auch off­line nutz­bar. 
  • Dra­gon Any­whe­re: Pro­fi-Tool mit exak­ter Sprach­er­ken­nung, beson­ders für Vielschreiber*innen geeig­net. 

Die meis­ten die­ser Diens­te bie­ten Basis­funk­tio­nen kos­ten­los an, erfor­dern für län­ge­re Dik­ta­te jedoch ein Abo. 

Pas­send dazu 
Jetzt kaufen 

Tipps für per­fek­te Diktate

Mit die­sen Tricks erzielst du bes­se­re Ergeb­nis­se bei der Sprach­er­ken­nung: 

  1. Sprich lang­sam und deut­lich. 
  2. Ver­mei­de Hin­ter­grund­ge­räu­sche. 
  3. For­mu­lie­re kla­re, kur­ze Sät­ze. 
  4. Dik­tie­re Satz­zei­chen, z.B. „Kom­ma“, „Punkt“, „neu­er Absatz“ 
  5. Kon­trol­lie­re den Text direkt nach dem Dik­tat 
  6. Nut­ze Off­line-Funk­tio­nen, wenn dir Daten­schutz wich­tig ist. 

Übri­gens: Je häu­fi­ger du Speech to Text nutzt, des­to bes­ser erkennt dich das Sys­tem. Vie­le Apps spei­chern dein Sprach­pro­fil lokal und opti­mie­ren die Genau­ig­keit mit der Zeit. 

Daten­schutz: So schützt du dei­ne Stimme

Sprach­er­ken­nung funk­tio­niert häu­fig über Cloud-Ser­ver. Dei­ne gespro­che­nen Daten wer­den dabei online ana­ly­siert, um sie in Text umzu­wan­deln. Das erleich­tert die Ver­ar­bei­tung, birgt aber auch Risi­ken, ins­be­son­de­re wenn sen­si­ble Infor­ma­tio­nen dik­tiert wer­den. Wenn du dei­ne Stim­me und per­sön­li­che Inhal­te schüt­zen möch­test, soll­test du eini­ge Sicher­heits­maß­nah­men beach­ten. 

Zunächst emp­fiehlt es sich, den Off­line-Modus zu akti­vie­ren, sofern die App oder das Betriebs­sys­tem dies unter­stützt. So wer­den dei­ne Sprach­da­ten direkt auf dem Gerät ver­ar­bei­tet, ohne an exter­ne Ser­ver gesen­det zu wer­den. Außer­dem lohnt es sich, App-Berech­ti­gun­gen regel­mä­ßig zu über­prü­fen und Mikro­fon­zu­grif­fe nur dann zu erlau­ben, wenn sie wirk­lich nötig sind. 

Ver­trau­li­che Infor­ma­tio­nen soll­test du nur dann dik­tie­ren, wenn klar ist, wie die Daten gespei­chert oder ver­ar­bei­tet wer­den. Auch wenn gro­ße Anbie­ter­fir­men wie Apple, Goog­le oder Micro­soft die Sprach­da­ten oft anony­mi­sie­ren, ist ein regel­mä­ßi­ger Blick in die Daten­schutz­be­stim­mun­gen emp­feh­lens­wert. So behältst du die Kon­trol­le über dei­ne per­sön­li­chen Sprach­auf­nah­men. 

Spra­che ersetzt die Tastatur

Speech to Text ist längst mehr als ein prak­ti­sches Extra: Es ist eine ech­te Arbeits­er­leich­te­rung für All­tag, Beruf und Krea­tiv­ar­beit. Mit nur weni­gen Klicks kannst du dei­ne Spra­che in Text umwan­deln, Noti­zen dik­tie­ren, E‑Mails schrei­ben oder gan­ze Doku­men­te erstel­len, ohne eine ein­zi­ge Tas­te zu drü­cken. Ob auf dem Smart­phone, Lap­top oder Desk­top: Die Dik­tier­funk­ti­on spart nicht nur wert­vol­le Zeit, son­dern stei­gert auch dei­ne Pro­duk­ti­vi­tät und macht das Schrei­ben deut­lich intui­ti­ver. Mit kla­rer Aus­spra­che, der rich­ti­gen App und etwas Übung wird dei­ne Stim­me schnell zum effek­tivs­ten Schreib­werk­zeug, das du je hat­test. So kannst du dei­ne Gedan­ken flüs­sig fest­hal­ten, Auf­ga­ben schnel­ler erle­di­gen und mul­ti­tas­king­fä­hig arbei­tenganz ohne Tip­pen. 

Disclaimer Die OTTO (GmbH & Co KG) übernimmt keine Gewähr für die Richtigkeit, Aktualität, Vollständigkeit, Wirksamkeit und Unbedenklichkeit der auf updated.de zur Verfügung gestellten Informationen und Empfehlungen. Es wird ausdrücklich darauf hingewiesen, dass die offiziellen Herstellervorgaben vorrangig vor allen anderen Informationen und Empfehlungen zu beachten sind und nur diese eine sichere und ordnungsgemäße Nutzung der jeweiligen Kaufgegenstände gewährleisten können.

Time to share:  Falls dir dieser Artikel gefallen hat, freuen wir uns!