Die 40 Sätze Georg Wenkers

in US-amerikanischer Lautung ('phonetischer Schreibung'): PC-gestützte Phonation mit Text-to-Speech-Systemen

Dieses nach Erwerb und Einbau der ersten Sound-Blaster-Karte im Jahre 1993 begonnene Projekt hat zum Ziel, den Sprechakt eines Amerikaners zu emulieren beim Versuch, deutsch gelautete Sätze aus phonetischer Schreibung heraus zu erzeugen. Als Beispiele dienen mir die vom jungen Dialektologen Georg Wenker 1876-1880 ersonnenen, bis heute immer wieder für zahllose Untersuchungen schriftlich und mündlich abgefragten 40 Sätze, die alle für das Deutsche wichtigen Laut- und Morphemkombinationen enthalten. Der Reiz des Ganzen liegt darin,.aus dem für das amerikanische Englisch typischen Schreib- und Ausspracheinventar solche "Bausteine" zu finden, die es praktisch einem des Deutschen völlig unkundigen Sprecher ermöglichen, dennoch deutsch Klingendes hervorzubringen, wie es beispielsweise schon vor Jahrzehnten von anglophonen Schlagersänger/innen versucht wurde.

Ein PC-basiertes System benötigt zur korrekten Umsetzung ein für amerikanische Verhältnisse adaptiertes und optimiertes Programm wie z.B. MONOLOGUE (Pro Audio Spectrum 16) oder SB TALKER (Creative Labs Sound Blaster Pro), die beide unter DOS liefen, jedoch für optimale Performance den Einbau der Hadware, die Installation der zugehörigen Treiber und die Konfiguration des Programms voraussetzten. Mit der Pro Audio Spectrum 16 und Monologue wurde 1993 erstmalig versucht, entsprechend aufbereitete Sätze wie z.B.

uyns. Im vinta fleegun dee trawkenen blatta in dair looft hairoom.
tsvuy. Ass hurt gluykh ouf tsoo shnuyen, dunn veeat duss vatta veeda bassa.
druy. Too cawlen in dain awphan, dawmeet dee milkh bult tsoo kawkhen unfangt.
feea. Dair goota ulta munn ist mit zuynum pfairt doorkhs uys guebrawkhun oont in duss culta vussa guefawlun.

in Computer-Lautung umzusetzen; mit einem bescheidenen Klein-Notebook IBM TP 755c wurde das Verfahren im Herbst 1999 verbessert; leider existieren von beiden Stadien keine Tonmitschnitte und arbeiten die Programme nicht im DOS-Fenster von Windows 2000 oder XP.

Jetzt, im Frühjahr 2008, sollen die Versuche mit neuer, XP-fähiger Software wiederaufgenommen (und die Resultate optimiert) werden. Als Material dienen die ersten 10 der damals umgeschriebenen 40 Sätze.

Bei den getesteten Speech Engines wird deutlich, wie sehr die phonetische Umsetzung auch und gerade von den verfügbaren Stimmen abhängt. Je nach programmtechnischer Feinheit setzen diese u.U. bestimmte Graphemsequenzen sehr heterogen um.

1. (a) Power Text to Speech (speaktext.exe) arbeitet mit AT&T natural voices, verfügt über (freie und käufliche) verschiedensprachliche Stimmen und ist defaultmäßig in der Lage, unsere Sätze in der obigen Fassung MONOLOGUE-konform wiederzugeben. Durch Editing im Programmfenster läßt sich jeder einzelne Satz performativ optimieren; es entsteht folgende Liste [1]:

Heea zint dee beroomtan feeatsikh vankerzatsa, gueshprawkhan fawn uynam ultan ummayrikawna.
1. uyns. Im vinta fleegun dee trawkenen blatta in dair looft hairoom.
2. tsvuy. Ass hurt gluykh ouf tsoo shnuyen, dunn veird duss vatta veeda bassa.
3. druy. Too cawlen in dain awphan, dawmeet dee milkh bult tsoo kawkhen unfangt.
4. feea. Dair goota ulta munn ist mit zuynum pfairt doorkhs uys guebrawkhun oont in duss culta vussa guefarlun.
5. fumf. Air ist for feea awda zaccs vawkhun gueshtawrbun.
6. zaccs. Duss foya varr tsoo shtarkh, dee kookhun zint jaw oonten guns shvarts guebrunt.
7. zeeben. Air ist dee uya imma awna zults oond pfaffa.
8. awkht. Dee fooyssa toon mere zaw zair vey, ikh glowba, ikh hawba zee 'doorkhgueloufun.
9. noyn. Ikh bin buy dair fraw guevayzun oont hawbe ass eea guezawgt; zee sawkta, zee vawlle ass owkh eearur tawkhtur zawgun.
10. tsayn. Ikh vil ass oukh nikht mair veeda toon!

Das beim Durchlauf erzeugte Audio-Signal läßt sich parallel (mit der Vollversion auch programmintern) aufzeichnen und zu einer MP3-Datei konvertieren.
1. (b) Der einfache Haptek-Player ist im Hinblick auf seine Umsetzungsmuster mit (1a) kompatibel und erzeugt eine sehr angenehme Modulation; hierzu die ebenfalls nach parallelem Mitschnitt gewonnene MP3-Datei.

2. Auch Text Aloud (getestet: V. 2.246) gestattet, eine Datei im Programmfenster zu editieren und durch kontrollierendes Abhören schrittweise die phonetische Umsetzung zu optimieren. Infolge abweichender Ausspracheregeln ergaben sich zunächst für Stimme "Sam" folgende Varianten [2] :
.
      Heea zint dee beroomtan feartsikh vankerzatsa, gueshprawkhen fawn eyenem arlten ummerikarna.

  1. uyns. Im vinta fleegun dee trawkenen blatta in dair looft hairoom.
  2. tsveye. Ass hurt glykh ouf tsoo shnyen, dunn veird daws vatta veeda bessa.
  3. dry. Too cawlen in dain awphen, dawmeet dee milkh bult tsoo kawkhen unfangt.
  4. feea. Dare goota ulta munn ist mit zuynum pfairt doorkhs ice guebrawkhun oont in darce culta vussa guefawlun.
  5. fymf. Air ist for feea awda zaccs vawkhun gueshtorben.
  6. zeccs. Darce foya varr tsoo shtarrkh, dee kookhen zint yaw oonten guns shvarts guebrunt.
  7. zeeben. Air ist dee eya imma awna zults oond pfaffa.
  8. awkht. Dee fooyssa toon mere saw sair vey, ikh glowbe, ikh hawbe zee 'doorkhguelowfen.
  9. noin. Ikh bin by dare frow guevayzen oont hawbe ass ear guezawgt; zee sawkter, zee volle ass owkh eeare tawkhtur zawgun.
  10. tsayn. Ikh vil ass oukh nikht mair veeda toon!

Danach wurde aus folgendermaßen modifizierter Liste [1] mit Stimme "Peter" eine WMA-Datei generiert:

Heea zint dee beroomtan feeatsikh vankerzatsa, gueshprawkhan fawn uynam ultan ummayrikawna.

  1. uyns. Im vinta fleegun dee trawkenen blatta in dair looft hairoom.
  2. tsvuy. Ass hurt gluykh ouf tsoo shnuyen, dunn veird duss vatta veeda bassa.
  3. druy. Too cawlen in dain awphan, dawmeet dee milkh bult tsoo kawkhen unfangt.
  4. feea. Dair goota ulta munn ist mit zuynum pfared doorkhs uys guebrawkhun oont in duss culta vussa guefarlun.
  5. fumf. Air ist for feea awda zaccs vawkhun gueshtawrbun.
  6. zaccs. Duss foya varr tsoo shtawkh, dee kookhun zint jaw oonten guns shvarts guebrunt.
  7. zeeben. Air ist dee uya imma awna zults oond pfaffa.
  8. awkht. Dee fewssa toon mere zaw zair vey, ikh glowba, ikh hawba zee 'doorkhgueloufun.
  9. noyn. Ikh bin buy dair frawgh guevayzun oont hawbe ass eea guezawgt; zee sawkta, zee vawlle ass owkh eeara tawkhtur zawgun.
  10. tsayn. Ikh vil ass oukh nikht mair veeda toon!

Mit der Sprecherin "ScanSoft Jennifer" wurde zu folgender modifizierter Liste [4] eine WMA-Datei generiert:

Here zint dee beroomtan feeatsikh vankerzatsa, gueshprawkhen fawn eyenur ummayrikawnerin, dee praizeedentin vairdun vill...

  1. eyence. Im vinta fleegun dee trawkenen blatta in dair looft hairoom.
  2. tsvy. Ass hurt glyekh ouf tsoo shnyurn, dunn veird duss vatta veeda bassa.
  3. dry. Too cawlen in dain awphan, dawmeet dee milkh bult tsoo kawkhen unfangt.
  4. feea. Dair goota ulta munn ist mit zynum pfairt doorkhs ice guebrawkhun oont in duss culta vussa guefarlun.
  5. fumf. Air ist for feea awda zaccs vawkhun gueshtawrbun.
  6. zaccs. Duss foya vawr tsoo shtawrkh, dee kookhun zint jaw oonten guns shvarts guebrawnt.
  7. zeeben. Air ist dee uyar imma awna zults oond pfaffa.
  8. awkht. Dee fooyssa toon mere zaw zair vey, eekh glowba, eekh hawba zee 'doorkhgueloufun.
  9. noyn. eekh bin buy dair frow guevayzun oont hawbe ass ere guezawgt; zee sawkta, zee vawlle ass owkh eeara tawkhtur zawgun.
  10. tsayn. Eekh vil ass oukh nikht mare veeda toon!

3. Text to speech maker arbeitet ähnlich, es können die eingelesenen Sätze editiert werden. Beim erneuten Abspeichern als *.txt werden Frequenzmarkierungen hinzugefügt, z.B. \F0 oder \F1. Zusätzlich erzeugt das Programm eine Tonausgabe-Datei als *.wav, *.vox oder *.mp3, letztere ebenfalls LAME-encoded mit wählbaren Kompressionsraten. (22050 kHz / 32 kbps ... 44100 kHz / 320 kbps). Der Stimmen-"Pool" ist nur sehr begrenzt. Differente Wandlungs-Regeln erforderten für "Microsoft Mike" eine Abänderung unserer Sätze wie folgt:

Heea zint dee beroomtan feeatsikh vankerzatsa, gueshprawkhan fawn eyenam altan americana.
1. eyence . Im vinta fleegun dee trawkenen blatta in dair looft hairoom.
2. tsveye . Ass hurt glike ouf tsoo shneyeun, dunn veird darce vatta veeda bassa.
3. dry. Too cawlen in dain awphan, dawmeet dee milkh bult tsoo kawkhen unfangt.
4. fear . Dair goota ulta munn ist mit zuynum pfairt doorkhs ice guebrawkhun oont in darce culta vussa guefarlun.
5. fooymf. Air ist for feea awdur zaccs vawkhun gueshtorbun.
6. zaccs. Darce foya varr tsoo shtarrkh, dee kookhun zint jaw oonten guns shvarts guebrunt.
7. zeeben. Air ist dee eya imma awna zults oond pfaffa.
8. awkht. Dee fooyssa toon mere zaw zayr vey, ikh glowba, ikh hawba zee 'doorkhguelowfen.
9. noyn. Ikh bin buy dair frow guevayzun oont hawbe ass eea guezawgt; zee sawkter , zee volle ass owkh eeara tawkhtur zawgun.
10. tsayn. Ikh vil ass oukh nikht mair veeda toon!

4. Andere Programme siehe hier; die Links verfolgen keinerlei kommerzielles Interesse).
Hier die restlichen 30 Sätze für weitere Versuche:

alf. Ikh shlawga dikh gluykh mit daim kawkh'lerffel oom dee awrun, doo awffa!
tsverlf. Vorr gayst doo hinn? Zawllen veea mit deea gaihun?
druytsayn. Ass zint shlaykhta tsuytun.
feea'tsayn. Muyn leebus kint, bluyp heea oonten shtayn, dee burzun ganza buyssen dikh torrt.
fumftsayn. Doo hust hoyta umm muysten ghe'lairnt oont bist awrtikh guevayzen.
zakhtsayn. Doo bist nawkh nikht grorss ghenookh, oom uyna flusha vine ows'tsoo'trinkan, doo moost norwkh atvuss vuccsan oont grerssa vairdan.
zeebtsayn. Gay, zuy zore goot oont zark duynar Shvastur, zee zoll dee clidur foor oyra moota fairtikh nayhun oont mit dair Buirsta rine mawkhun.
uhtsayn. Hattust doo een ghe'cunt, dunn vair ass undurs ghe'cawmun oont ass taitu bassur oom ean shtayhun.
noyntsayn. Vare hut mere muynun cawrp mit fluysh gueshtawlen?
tsvuntsikh. Air tawt zore uls hattun zee ean tsoom drashun bur'shtallt, zee hawbun ass arbur zalbst ghe'tawn.
uynoontsvuntsik. vaim hutt air dee noya ghe'shikhta airtsailt?
tsvuyoontsvuntsikh. Munn moos lout shruyan, zonst fairshtait air oons nikht.
druyoontsvuntsikh. Veer zint muida oont hawbun doorst.
fearoontsvuntsikh. uls vear gasturn arbunt tsooruik'kawmun, daw vawrun dee undurn shawn im batt oont vawrun fast uyngur'shlawfun.
foomfoonttsvuntsikh. Dair shnay ist deeza nukht leagun ghe'bleebun, awbur hoyta morgan ist air ghe'shmawltsun.
zaksoonttsvuntsikh. Hintur oonzarum house shtayhun druy shurna upfulboyma mit rortun apfulkhun.
zeebunoonttsvuntsikh. Curnt ear nikht nawkh uynan owgunblick owf oons vartan? Dunn gaihun vear mit oykh.
ukhtoontsvuntsikh. Ear duirft nikht zolkha keendaruyan truyban.
noynoontsvuntsikh. Oonzara Bairga zint nikht zore zaiar horkh, dee oyran zint feel herhar.
druyssikh. Veefeel pfoont voorst oont veefeel brawt vawlt ear hawbun?
uynoontdruyssikh. Ikh fairshtaihu oykh nikht. Ear muist uyn biskhun loutur shprakhun.
tsvuyoontdruyssikh. Hawbt eea cuyn shtuik'khen vuyssa zuyfa owf muynam tish ghe'foondan?
druyoontdruyssikh. Zuyn brooda vil zikh tsvuy sherrna noya hoyza in oyam gawrtan bowun.
fearoontdruyssikh. Duss vawrt kawm eem fawm hairtsun.
foomfoontdruyssikh. Duss varr raykht fawn eenun.
zaksoontdruyssikh. Vuss zitsun darr fer ferguelkhun orbun owf daim moyerkhun?
zeebunoontdruyssikh. Dee bowern huttun foonf awksun oont tsverlf shawfa fore duss dorf guebrawkht, dee vawltun zee fair'cowfun.
ukhtoontdruyssikh. Dee loyta zint hoyta ulla drowssun owf daim faylde oont maihun.
noynoontdruyssikh. Gay nooah, dair browna hoont toot deea nikhts.
feartsikh. Ikh bin mit dain loyten darr hinten oobur dee veeze ins cawrn guefawren.

Ein nächster Schritt wird darin bestehen, des Deutschen völlig unkundige anglophone Sprecher mit obigem Material zu konfrontieren und ihre Sprachrealisationen zu dokumentieren, um sie mit den in die jeweiligen Programme implantierten phonetischen Umsetzungsregeln zu vergleichen.

(c) W. Näser, Marburg. Begonnen 12.2.2008. Stand: 12.3.2008
Für Vollständigkeit keine Gewähr. Nur zu didaktischen Zwecken. Wird ergänzt.