in US-amerikanischer Lautung ('phonetischer Schreibung'): PC-gestützte Phonation mit Text-to-Speech-Systemen
Dieses nach Erwerb und Einbau der ersten Sound-Blaster-Karte im Jahre 1993 begonnene Projekt hat zum Ziel, den Sprechakt eines Amerikaners zu emulieren beim Versuch, deutsch gelautete Sätze aus phonetischer Schreibung heraus zu erzeugen. Als Beispiele dienen mir die vom jungen Dialektologen Georg Wenker 1876-1880 ersonnenen, bis heute immer wieder für zahllose Untersuchungen schriftlich und mündlich abgefragten 40 Sätze, die alle für das Deutsche wichtigen Laut- und Morphemkombinationen enthalten. Der Reiz des Ganzen liegt darin,.aus dem für das amerikanische Englisch typischen Schreib- und Ausspracheinventar solche "Bausteine" zu finden, die es praktisch einem des Deutschen völlig unkundigen Sprecher ermöglichen, dennoch deutsch Klingendes hervorzubringen, wie es beispielsweise schon vor Jahrzehnten von anglophonen Schlagersänger/innen versucht wurde.
Ein PC-basiertes System benötigt zur korrekten Umsetzung ein für amerikanische Verhältnisse adaptiertes und optimiertes Programm wie z.B. MONOLOGUE (Pro Audio Spectrum 16) oder SB TALKER (Creative Labs Sound Blaster Pro), die beide unter DOS liefen, jedoch für optimale Performance den Einbau der Hadware, die Installation der zugehörigen Treiber und die Konfiguration des Programms voraussetzten. Mit der Pro Audio Spectrum 16 und Monologue wurde 1993 erstmalig versucht, entsprechend aufbereitete Sätze wie z.B.
uyns. Im vinta fleegun dee trawkenen blatta in dair looft hairoom.
tsvuy. Ass hurt gluykh ouf tsoo shnuyen, dunn veeat duss vatta veeda bassa.
druy. Too cawlen in dain awphan, dawmeet dee milkh bult tsoo kawkhen unfangt.
feea. Dair goota ulta munn ist mit zuynum pfairt doorkhs uys guebrawkhun oont in duss culta vussa guefawlun.
in Computer-Lautung umzusetzen; mit einem bescheidenen Klein-Notebook IBM
TP 755c wurde das Verfahren im Herbst
1999 verbessert; leider existieren von beiden Stadien keine Tonmitschnitte
und arbeiten die Programme nicht im DOS-Fenster von Windows 2000 oder XP.
Jetzt, im Frühjahr 2008, sollen die Versuche mit neuer,
XP-fähiger Software wiederaufgenommen (und die Resultate optimiert)
werden. Als Material dienen die ersten 10 der damals umgeschriebenen 40
Sätze.
Bei den getesteten Speech Engines wird deutlich, wie sehr die phonetische Umsetzung auch und gerade von den verfügbaren Stimmen abhängt. Je nach programmtechnischer Feinheit setzen diese u.U. bestimmte Graphemsequenzen sehr heterogen um.
1. (a) Power Text to Speech (speaktext.exe) arbeitet mit AT&T natural voices, verfügt über (freie und käufliche) verschiedensprachliche Stimmen und ist defaultmäßig in der Lage, unsere Sätze in der obigen Fassung MONOLOGUE-konform wiederzugeben. Durch Editing im Programmfenster läßt sich jeder einzelne Satz performativ optimieren; es entsteht folgende Liste [1]:
Heea zint dee beroomtan feeatsikh vankerzatsa, gueshprawkhan fawn uynam ultan ummayrikawna.
1. uyns. Im vinta fleegun dee trawkenen blatta in dair looft hairoom.
2. tsvuy. Ass hurt gluykh ouf tsoo shnuyen, dunn veird duss vatta veeda bassa.
3. druy. Too cawlen in dain awphan, dawmeet dee milkh bult tsoo kawkhen unfangt.
4. feea. Dair goota ulta munn ist mit zuynum pfairt doorkhs uys guebrawkhun oont in duss culta vussa guefarlun.
5. fumf. Air ist for feea awda zaccs vawkhun gueshtawrbun.
6. zaccs. Duss foya varr tsoo shtarkh, dee kookhun zint jaw oonten guns shvarts guebrunt.
7. zeeben. Air ist dee uya imma awna zults oond pfaffa.
8. awkht. Dee fooyssa toon mere zaw zair vey, ikh glowba, ikh hawba zee 'doorkhgueloufun.
9. noyn. Ikh bin buy dair fraw guevayzun oont hawbe ass eea guezawgt; zee sawkta, zee vawlle ass owkh eearur tawkhtur zawgun.
10. tsayn. Ikh vil ass oukh nikht mair veeda toon!
Das beim Durchlauf erzeugte Audio-Signal läßt sich parallel (mit
der Vollversion auch programmintern) aufzeichnen und zu einer MP3-Datei
konvertieren.
1. (b) Der einfache Haptek-Player ist im Hinblick auf seine
Umsetzungsmuster mit (1a) kompatibel und erzeugt eine sehr angenehme Modulation;
hierzu die ebenfalls nach parallelem Mitschnitt gewonnene
MP3-Datei.
2. Auch Text Aloud (getestet: V. 2.246) gestattet, eine Datei
im Programmfenster zu editieren und durch kontrollierendes Abhören
schrittweise die phonetische Umsetzung zu optimieren. Infolge abweichender
Ausspracheregeln ergaben sich zunächst für
Stimme "Sam" folgende Varianten [2] :
.
Heea zint dee beroomtan feartsikh vankerzatsa,
gueshprawkhen fawn eyenem arlten ummerikarna.
Danach wurde aus folgendermaßen modifizierter Liste [1] mit Stimme "Peter" eine WMA-Datei generiert:
Heea zint dee beroomtan feeatsikh vankerzatsa, gueshprawkhan fawn uynam ultan ummayrikawna.
Mit der Sprecherin "ScanSoft Jennifer" wurde zu folgender modifizierter Liste [4] eine WMA-Datei generiert:
Here zint dee beroomtan feeatsikh vankerzatsa, gueshprawkhen fawn eyenur ummayrikawnerin, dee praizeedentin vairdun vill...
3. Text to speech maker arbeitet ähnlich, es können die eingelesenen Sätze editiert werden. Beim erneuten Abspeichern als *.txt werden Frequenzmarkierungen hinzugefügt, z.B. \F0 oder \F1. Zusätzlich erzeugt das Programm eine Tonausgabe-Datei als *.wav, *.vox oder *.mp3, letztere ebenfalls LAME-encoded mit wählbaren Kompressionsraten. (22050 kHz / 32 kbps ... 44100 kHz / 320 kbps). Der Stimmen-"Pool" ist nur sehr begrenzt. Differente Wandlungs-Regeln erforderten für "Microsoft Mike" eine Abänderung unserer Sätze wie folgt:
Heea zint dee beroomtan feeatsikh vankerzatsa, gueshprawkhan fawn eyenam altan americana.
1. eyence . Im vinta fleegun dee trawkenen blatta in dair looft hairoom.
2. tsveye . Ass hurt glike ouf tsoo shneyeun, dunn veird darce vatta veeda bassa.
3. dry. Too cawlen in dain awphan, dawmeet dee milkh bult tsoo kawkhen unfangt.
4. fear . Dair goota ulta munn ist mit zuynum pfairt doorkhs ice guebrawkhun oont in darce culta vussa guefarlun.
5. fooymf. Air ist for feea awdur zaccs vawkhun gueshtorbun.
6. zaccs. Darce foya varr tsoo shtarrkh, dee kookhun zint jaw oonten guns shvarts guebrunt.
7. zeeben. Air ist dee eya imma awna zults oond pfaffa.
8. awkht. Dee fooyssa toon mere zaw zayr vey, ikh glowba, ikh hawba zee 'doorkhguelowfen.
9. noyn. Ikh bin buy dair frow guevayzun oont hawbe ass eea guezawgt; zee sawkter , zee volle ass owkh eeara tawkhtur zawgun.
10. tsayn. Ikh vil ass oukh nikht mair veeda toon!
4. Andere Programme siehe
hier; die Links verfolgen
keinerlei kommerzielles Interesse).
Hier die restlichen 30 Sätze für weitere Versuche:
alf. Ikh shlawga dikh gluykh mit daim kawkh'lerffel oom dee awrun, doo awffa!
tsverlf. Vorr gayst doo hinn? Zawllen veea mit deea gaihun?
druytsayn. Ass zint shlaykhta tsuytun.
feea'tsayn. Muyn leebus kint, bluyp heea oonten shtayn, dee burzun ganza buyssen dikh torrt.
fumftsayn. Doo hust hoyta umm muysten ghe'lairnt oont bist awrtikh guevayzen.
zakhtsayn. Doo bist nawkh nikht grorss ghenookh, oom uyna flusha vine ows'tsoo'trinkan, doo moost norwkh atvuss vuccsan oont grerssa vairdan.
zeebtsayn. Gay, zuy zore goot oont zark duynar Shvastur, zee zoll dee clidur foor oyra moota fairtikh nayhun oont mit dair Buirsta rine mawkhun.
uhtsayn. Hattust doo een ghe'cunt, dunn vair ass undurs ghe'cawmun oont ass taitu bassur oom ean shtayhun.
noyntsayn. Vare hut mere muynun cawrp mit fluysh gueshtawlen?
tsvuntsikh. Air tawt zore uls hattun zee ean tsoom drashun bur'shtallt, zee hawbun ass arbur zalbst ghe'tawn.
uynoontsvuntsik. vaim hutt air dee noya ghe'shikhta airtsailt?
tsvuyoontsvuntsikh. Munn moos lout shruyan, zonst fairshtait air oons nikht.
druyoontsvuntsikh. Veer zint muida oont hawbun doorst.
fearoontsvuntsikh. uls vear gasturn arbunt tsooruik'kawmun, daw vawrun dee undurn shawn im batt oont vawrun fast uyngur'shlawfun.
foomfoonttsvuntsikh. Dair shnay ist deeza nukht leagun ghe'bleebun, awbur hoyta morgan ist air ghe'shmawltsun.
zaksoonttsvuntsikh. Hintur oonzarum house shtayhun druy shurna upfulboyma mit rortun apfulkhun.
zeebunoonttsvuntsikh. Curnt ear nikht nawkh uynan owgunblick owf oons vartan? Dunn gaihun vear mit oykh.
ukhtoontsvuntsikh. Ear duirft nikht zolkha keendaruyan truyban.
noynoontsvuntsikh. Oonzara Bairga zint nikht zore zaiar horkh, dee oyran zint feel herhar.
druyssikh. Veefeel pfoont voorst oont veefeel brawt vawlt ear hawbun?
uynoontdruyssikh. Ikh fairshtaihu oykh nikht. Ear muist uyn biskhun loutur shprakhun.
tsvuyoontdruyssikh. Hawbt eea cuyn shtuik'khen vuyssa zuyfa owf muynam tish ghe'foondan?
druyoontdruyssikh. Zuyn brooda vil zikh tsvuy sherrna noya hoyza in oyam gawrtan bowun.
fearoontdruyssikh. Duss vawrt kawm eem fawm hairtsun.
foomfoontdruyssikh. Duss varr raykht fawn eenun.
zaksoontdruyssikh. Vuss zitsun darr fer ferguelkhun orbun owf daim moyerkhun?
zeebunoontdruyssikh. Dee bowern huttun foonf awksun oont tsverlf shawfa fore duss dorf guebrawkht, dee vawltun zee fair'cowfun.
ukhtoontdruyssikh. Dee loyta zint hoyta ulla drowssun owf daim faylde oont maihun.
noynoontdruyssikh. Gay nooah, dair browna hoont toot deea nikhts.
feartsikh. Ikh bin mit dain loyten darr hinten oobur dee veeze ins cawrn guefawren.
Ein nächster Schritt wird darin bestehen, des Deutschen völlig unkundige anglophone Sprecher mit obigem Material zu konfrontieren und ihre Sprachrealisationen zu dokumentieren, um sie mit den in die jeweiligen Programme implantierten phonetischen Umsetzungsregeln zu vergleichen.
(c) W. Näser, Marburg. Begonnen 12.2.2008. Stand: 12.3.2008
Für Vollständigkeit keine Gewähr. Nur zu didaktischen Zwecken.
Wird ergänzt.