Anmerkungen zur Restauration historischer Tonaufnahmen
von Wolfgang NÄSER, Marburg
Historische Aufnahmen von Sprache und
Musik sind umso reizvoller und herausfordernder, je älter sie
sind. Die Beschäftigung mit ihnen ist nicht, wie es auf den
ersten Blick scheinen könnte, eine Spielerei, sondern
wissenschaftliches und künstlerisches Desiderat. Im Gegensatz zu
Textdrucken und Malerei sind Foto, Film und Ton relativ junge
Medien, die es dann zu retten gilt, wenn sie besonders wichtige
Ereignisse, Trends, Persönlichkeiten darstellen und
repräsentieren. Das ist so in der Kunst, aber auch und gerade in
der Wissenschaft - zumal wenn es um Mundarten geht, von
denen jedes Zeugnis der phonetischen Realisierung um so wertvoller
ist, je früher es entstand: wir denken hier auch und gerade an
solche Mundarten, die aufgrund historisch-politischer Ereignisse
für immer erstorben sind. Alte Tonaufnahmen sind auch dazu
angetan, möglicherweise falsche Vorstellungen zu Aussprache und
Intonation zu korrigieren, sofern dies auf der Basis
bescheiden(st)er Tonqualität überhaupt möglich ist.
Somit wären wir bei unserem Schwerpunkt, der historischen
Mundart-Tonaufnahme. Es gibt sie seit etwa 100 Jahren, genau
genommen seit 1899, als das Wiener Phonogramm-Archiv
seinen Dienst aufnahm. Kaiser Franz Josefs berühmte Aufnahme vom
2. August 1903 in Bad Ischl gehört, wie ich zu beweisen versuchte, zu den
ältesten noch verwertbaren Tondokumenten. Ferdinand WREDEs
Aussagen zu Sprache und
Nationalität (1926) gehören ebenso in unsere Schatztruhe wie
ein großer Teil des - leider politisch belasteten - Lautdenkmals reichsdeutscher
Mundarten (1936/37), mit dem in unserer Reihe zum ersten
Male eine schon als modern bezeichenbare Tontechnik in Erscheinung
tritt. In qualitativer Hinsicht gehören zu unserer Gruppe auch
viele Aufnahmen, die in den 50er und 60er Jahren unter besonders
schlechten Bedingungen entstanden oder von denen wir nur sehr
schlechte Kopien besitzen, die jedoch von hohem Wert sind für
Forschung und Lehre.
Dieser Wert kommt dann zum Tragen, wenn die alten bzw.
unzureichend gepflegten Tondokumente so aufbereitet werden, daß
ihr Anhören nicht nur informativ, sondern auch rezeptionsästhetisch
optimal ist.
Das Prinzip des prodesse et delectare (nützen und
erfreuen) gilt auch und gerade hier; technisch umgesetzt, bedeutet
dies
- minimalen Störpegel (Rauschen, Knistern, Schaben,
Kratzen)
- angenehmes, ausgewogenes Klangbild (z.B. nicht zu
viele Bässe)
- optimale Verständlichkeit (der informationsrelevanten
Laute und Lautkombinationen)
- zügigen Sprachfluß (nur kurze interverbale Pausen)
Die Erreichbarkeit dieser Ziele hängt ab vom tatsächlichen oder
objektiven Informationsgehalt der Aufnahme. Dieser ist
umgekehrt proportional zum Störpegel; d.h.: alles, was darunter
liegt, ist physikalisch und informationstechnisch verloren. Ich
kann nur das auswerten, was vorhanden ist, und muß jederzeit damit
rechnen, daß, wie wir noch sehen werden, der Vorteil einer
korrigierenden Maßnahme mit einem davor nicht vorhandenen Nachteil
einhergeht.
Je älter die Aufnahme ist, desto mehr brauche ich an Erfahrung,
Aufwand und Mühe. Ab und zu jedoch stößt man bei "alten"
Einspielungen auf eine frappant gute Qualität, so beim
"Lautdenkmal" z.B. im Falle von Berlin,
Danzig, Elbing,
Ebsdorf b. Marburg oder Tilsit - alles Aufnahmen von 1937, jedoch
schon an die spätere UKW-Qualität erinnernd. Abgesehen
von solchen unerwarteten Glücksfällen bedeutet es immer eine Menge
anstrengender, zeitraubender Arbeit, eine Reihe von Samples wie
die meiner Themenseite zum
Lautdenkmal zu erstellen. Jene Aufnahmen ebenso wie die
bereits erwähnten (Wrede u.a.) fungieren als Beispiele für
Ergebnisse und Hinweise aus meiner bisherigen Praxis. Ich denke
dabei nicht an erste Gehversuche ab 1959, sondern an die
PC-orientierte Zeit ab etwa 1995, als ich begann, auf einem
486SX66 mit einer bescheidenen Festplatte von nur 170 MB und dem
Programm Sound Forge 2.0 die ersten Tondateien zu
editieren, und dabei erstaunt feststellte, wie einfach es doch im
Grunde war bzw. ist, selbst einzelne bedeutungsrelevante Laute wie
das [v] in /Schweißen/ aus dem Sprachkontinuum zu entfernen bzw.
in einen Wortkörper einzufügen, wie ich es 5 Jahre später ganz
vereinzelt auch in einer Opern-Edition
unternahm, um undeutliche oder beim Singen unterdrückte Laute zu
ihrem Recht kommen zu lassen.
Der Sound-Editor ist sozusagen ein akustischer Setz-Kasten für
alle Arten kreativer Tongestaltung. Wie beim Textgestalten
bedeutet Editieren auch hier Löschen, Verschieben,
alle Arten von Verändern: ich unterscheide hierbei
- textuelle (informationelle) Manipulationen
- (a) klangverbessernde bzw. (b) räumlich
verändernde Maßnahmen
Obzwar ausnahmslos die dokumentarische Integrität bzw.
wissenschaftliche Authentizität verletzend, sind
Textmanipulationen dann nötig, wenn z.B. hochpolitische Aussagen
zu tilgen sind, um ein Tondokument wie die Berliner Aufnahme des "Lautdenkmals" als
dialektrepräsentatives Sample auch der Nachwelt fruchtbar zu
machen. Da ist von einem "Sturmlokal" die Rede, von Horst Wessel
usw.. Ich muß die inkriminierbaren bzw. peinlichen Passagen so
tilgen, daß der Sprachfluß nicht beeinträchtigt wird; das Resultat kann sich hören lassen,
allerdings nur im sprachwissenschaftichen Rahmen, hat es
doch seine historisch-politische Echtheit und damit den Charakter
eines Zeitzeugnisses mindestens zum Teil verloren.
Der Bearbeiter bzw. Verwalter historischer Tonaufnahmen steht
somit immer vor der Alternative,
- unter dem Postulat historischer Authentizität auf Kosten der
Rezeptionsästhetik die originale Klangqualität ausnahmslos zu
belassen (dokumentarisches Verwalten) oder
- durch akustische und editorische Eingriffe in das Tondokument
dessen Intention und Aussage zu verstärken und das Hörerlebnis
im ästhetischen Sinne zu optimieren (künstlerisches
Nachschöpfen)
Nicht zuletzt aus didaktischen Gründen habe ich mich
bei allen hier angeführten Hörproben für den zweiten Weg
entschieden.
Klangverbessernde Maßnahmen bilden den
handwerklich-editorischen Alltag des Tonaufnahme-Restaurators.
Sofern ausnahmslos nach [2a] vorgegangen wird, bleibt die
informationelle und damit historische Gültigkeit erhalten; ein
wenig angekratzt werden würde sie, käme ich etwa auf die Idee,
eine der Lautdenkmals-Aussagen z.B. durch Verhallung in
ein anderes, verfremdendes Klangfeld zu versetzen, z.B.
ein klerikales Environment, wie es durch einen Klangfeldprozessor
(Hardware) oder vom Sound-Editor spielend leicht erzeugt werden
kann. Hitler oder Goebbels würden dann z.B. in einer Kirche oder
einem Kloster sprechen statt in einer Open-Air-Arena, das gäbe
Anlaß für jede Menge Spekulationen. Gerade weil heute derartige
Manipulationen möglich sind (und dazu die textuellen!), besteht
zunehmend Zweifel an der Echtheit bestimmter
"historisch-dokumentarischer" Tonaufnahmen; verändert sich hier
das Hintergrundgeräusch innerhalb des Redeflusses abrupt, so
dürfte kein Zweifel daran bestehen, daß unzulässig "geschnitten"
wurde.
Alle Arten der Klangmanipulation erfordern Zusatz-Module in
Gestalt von Programm-Bibliotheken bzw. Plug-ins; Editoren
wie das hervorragende Cool Edit 1.2a haben einen reichhaltigen
"Werkzeug-Satz" an Bord, bieten aber die Möglichkeit, beliebig
viele externe Module als Direct-X oder VST anzubinden,
so z.B. Kompressoren, Limiter, parametrische
Equalizer u.a. Fasziniert von der Vielfalt des Angebots und
der Möglichkeiten, spielt der Anfänger zunächst mit allerhand z.T.
funktionsgleichen Plug-Ins herum, bis sich herauskristallisiert,
welche Programmteile bzw. Module am besten arbeiten und zu unserem
Kern-Equipment gehören. Man kann davon ausgehen, daß z.B. Cool
Edit Pro 1.2a bereits alle wesentlichen Werkzeuge enthält; vom
Funktionsumfang her bedeutet das den Gegenwert einer alle
Raffinessen bietenden Studio-Hardware im Werte von 100.000 DM oder
mehr, noch vor 20 Jahren alleiniges Mittel des kreativen
Masterings. Der komplexe Sound-Editor bedeutet nicht nur
unvorstellbare Platzersparnis, sondern auch eine Kostenreduktion
um 80 % oder mehr. Betrachten wir den Hardware-Aufwand von der
Aufnahme über das Mastering bis zur Produktion, so vereint heute
sogar schon ein Notebook wie das Gericom Overdose S 14.1" TFT
für rund 4.200 DM alle prozeduralen Funktionsbausteine in sich,
vorausgesetzt, die steuernde Software (Sound-Editor,
Brennprogramm) ist an Bord.
Zur Praxis
Die folgenden Proben sind ab 2001 erstellte
Real-Audio-Dateien (*.ra), die heute (2012) mit dem
noch hier
downloadbaren Real Player 6 abgehört werden können.
Neuere Versuche zeigten, daß bei solchen historischen
Sprachaufnahmen auch 10 Jahre später mit verbesserter
Software, zusätzlichen Plugins sowie der (weniger ökonomischen)
Abspeicherung auf MP3pro nur selten bessere Resultate zu
erzielen waren.
I. Was z.B. das Statement Kaiser Franz Josefs
I. von 1903 angeht, meinen bisher schwierigsten Fall, so
dürfte aus dem zugehörigen Text
hervorgehen, welche Schwierigkeiten ich Ende 1999 in mehreren
Schritten bis Anfang 2000 damit hatte, aus meiner
Cassettenkopie so viel an Information herauszuholen, bis ich, in
Ermangelung des bereits erstellten Textes transkriptorisch
"nachschöpfend", das meiste verstehen und niederschreiben konnte.
Ich habe das Ganze noch einmal durchgeführt, nach anderthalb
Jahren zusätzlicher Erfahrung, und dann einige der Schritte
vorgenommen, die meinen Lautdenkmals-Samples zu mehr
Durchhörbarkeit und Klarheit verholfen haben. Ergebnis sind Neubearbeitungen
vom 15.9. und 1.12.2001:
in ersterer gelangt nicht nur als Direct-X-Plugin SONIC
FOUNDRYs Noise
Reduction 2.0a (versuchsweise u.a. 2x hintereinander) zum
Einsatz, sondern auch der in Cool Edit Pro 1.2a enthaltene Hard
Limiter; in der neuesten verwendete ich alternativ das neue
WAVES(tm)-Plugin X-Noise, das in diesem
Falle nicht besser abschneidet und des Kaisers Stimme seltsam
nebelhaft abbildet.
Eine weitere Neubearbeitung vom 17.2.2002 bemühte
Dart
Pro 32, WAVES(tm)-X-Noise, SONIC
FOUNDRYs Noise Reduction und wiederum den Hard
Limiter (-2 / +4 dB). Zwar wurde hierbei ein SNR bis etwa 48
dB (!) erreicht, doch klingt (wie auch bei ausschließlich
Cool-Edit-internen Verfahren festgestellt) die Stimme nach extremer
Rauschunterdrückung seltsam vernebelt, distanziert und
verhallt, so daß sich bei kritisch-distanziertem Vergleichshören
letzlich die "alte" 3.Version
von Anfang 2000 trotz ihrer Zischel-Störungen als die
natürlichste, direkteste, "zupackendste" erweist. Fazit aus allem:
irgendwann ist nichts mehr zu gewinnen, ohne andere
Parameter (unverzichtbare Klangmerkmale) zu gefährden.
Erwogen hatte ich auch schon eine etwas absonderlich und keck
anmutende Methode, unserem Franz Josef I. zu unerwartetem
akustischem Glanz zu verhelfen, und das ginge so: /f/, /s/, /sch/,
/t/ und ggf. andere formantkritische Laute werden in allen
möglichen Umgebungen aus einer anderen, von Alter und Timbre her
möglichst ähnlichen neuzeitlichen Stimme isoliert und
dienen als dateienmäßige Bausteine, als Fundus, um an passender
Stelle in den Sprachfluß eingefügt zu werden. Der
jeweilige Obertongehalt der Fremdbausteine ist so weit zu
reduzieren, daß der Verfremdungseffekt minimiert wird. Das
Einkopieren von Korrektur- oder Substitutionslauten ließe sich
dadurch vereinfachen, daß beim Editieren jeweils eine bestimmte,
programmiertechnisch zugeordnete Taste gedrückt wird (z.B. s
für /s/, S für /sch/ usw.), der PC würde somit teilweise
zur akustischen Schreibmaschine.
II. Nun zur bereits erwähnten Wrede-Rede, einem
Beispiel für die bis ins letzte Detail verfeinerte mechanische
(=Phonographen-)Aufnahme. Hier ist folgendes festzustellen:
- die in den PC einkopierte Originalkopie (Minidisk) ist zwar
stark verknistert, klingt jedoch kernig und zupackend; die
Modulations-Hüllkurve weist aus, daß auch alle Grundtöne
unreduziert zur Verfügung stehen, das bedeutet volle Sonorität.
- um das starke Knistern zu reduzieren, kann ich alternativ
oder in Kombination
(a) Clicks und Pops ggf. in mehreren Durchgängen herausfiltern,
(b) anhand eines automatisch ermittelten Noise Floors
ein definiertes De-Hissing vornehmen und /oder
(c) die Click-Oberwellen durch ein steilflankiges Filter (Butterworth
oder Chebychev Typ 1) abschneiden
oder
(d) das Sample mit möglichst hohem Kompressionsgrad (bis 70 oder
100) zu *.mp3 oder *.ra konvertieren, das hat
die Wirkung eines entsprechenden Filters, und / oder zusätzlich
(e) in manuellem Editing mit Zeitachsen-Zooming
einzelne Clicks, Pops und sonstige Störungen entfernen.
- Filtermaßnahmen nach [2b] und [2c] verflachen den Stimmklang,
lassen Wrede möglicherweise wie durch einen Schalltrichter
sprechen, während die stark datenreduzierende Konversion
zu *.ra einen relativ dumpfen Mittelwellen-Klang
erzeugt. Ähnlich arbeitet (im Audition mode) der hochgelobte Declicker
von Steinberg. Klar, daß bei starker Höhenreduktion
und daher Beschneidung des Obertonspektrums die
überwiegend hochfrequenten Clicks von selbst verschwinden.
- Letztlich muß ich entscheiden zwischen zwei grundsätzlichen rezeptionsästhetischen
Konzepten:
(a) weitgehender objektive akustischer Echtheit
(angenommener natürlicher Stimmklang vor Aufnahme) oder
(b) einer ins Kreativ-Künstlerische gehenden Bearbeitung
als Abbild einer in bestimmten Situationen (Schalltrichter nach
Aufnahme) angenommenen 'virtuellen' Realität.
Ich habe mich mit der zweiten Bearbeitung vom 11.8.2001
für [4b] entschieden; ausschlaggebend war die in dieser "Grammophon-Fassung" herrschende Ruhe
in den Sprechpausen. Die schlank mensurierte Stimme bekommt zudem
etwas Feierliches, an eine Vorlesung Erinnerndes, das die
Wichtigkeit des Gesagten unterstreicht.
Bei der dritten Bearbeitung vom 14./15.9.2001
bin ich folgendermaßen vorgegangen:
- Einladen der Original-Bandkopie (DAT) in Cool Edit Pro 1.2a:
SNR = 20 dB
- Dreimal Tschebycheff-Bandpaß (18. Ordnung) 150...3500
Hz, SNR = 27 dB
- Declicking "Constant Hiss & Crackle": ca. 177.000
Clicks fixed, 0 rejected, SNR = 29 dB
- Sonic Foundry Noise Reduction mit ca. 85 % NR und ca.
8 dB High Shell Gain 3,1 kHz, wenig Wirkung
- Normalizing 95 %
- Dreimal Declicking nach Option 2 "Lots of Hiss &
Crackle": 1240 /1176 /1285 Clicks fixed
- Sonic Foundry NR mit Maximaleinstellung NR
und ca. 8 dB High Shell Gain 3,1 kHz; SNR = 36 dB
- Manuelles Tilgen einiger Pausen-Clicks / -Pops
- Normalizing 93 %
- Abspeichern als *.wav
- Mit Real Enc. 3.1 Encoding mit 8,5 kbps
-------- Nachbearbeitung 1 (15.9.2k1) ---------
- Re-Konversion von *.ra zu *.wav
- Sonorisierung: 2 x Parametr. Equalizer, 216
Hz + 8dB zur Verstärkung der 1. Grundton-Harmonischen
- Normalizing 95 %
- Anheben einiger relevanter Passagen im letzten Drittel der
Aufnahme; SNR jetzt ca. 33 dB
- Abspeichern als *.wav
- Real Enc. 3.1, 8,5 kbps
--------- Nachbearbeitung 2 (18.9.2k1) -------
- aus (13) erhaltene *.wav behandelt mit dem virtuellen
Röhren-Kompressor (und Limiter) T-Rack S 2.0
- Real Enc. 3.1, 8,5 kbps
--------- Nachbearbeitung 3
(24.9.2k1) --------
- Einlesen der in (18) erhaltenen Version
- manuelles Löschen einiger Störimpulse und Absenken
interverbaler Pegel
- manuelles Kürzen der interverbalen Pausen zur Verbesserung
des Redeflusses
- Real Enc. 3.1, 8,5 kbps
Auf Dynamik-Kompression wurde zunächst verzichtet, weil
sonst die nicht entfernbaren, weil die Nutzmodulation
durchsetzenden Klicken, Rauschen und Rumpeln
mit angehoben worden wären. Die (im Gegensatz zur zweiten) mit nur 8,5 kbps
encodierte Fassung klingt dennoch durchsichtig und bietet damit
ein Maximum an Lesbarkeit bzw. Information.
Die am 15.9. nachträglich vorgenommene Sonorisierung
gibt der Stimme etwas Warmes, Zupackendes und reduziert etwas die
Merkmale der typischen "Grammophon"-Aufnahme; allerdings wird
durch eine solche Maßnahme immer das Hintergrund-Rumpeln
mit angehoben. Um diesen Effekt zu begrenzen, muß zuvor die
eigentliche Stimmgrundfrequenz durch einen geeigneten Bandpaß
weggefiltert werden.
Die am 18.9.2k1 mit T-Rack S 2.0 in virtuellem Röhrenverstärker-Klang
erstellte Datei klingt noch zupackender, sonorer als ihre
Vorläuferin. Durch die Dynamik-Kompression wird das
Grund-Geräusch (Schleifen und Rumpeln) lauter, stört jedoch nicht
den wirklichkeitsnäheren Gesamteindruck.
Die am 24.9.2k1 vorgenommenen Manipulationen sind ästhetischer
Natur; das Kürzen interverbaler Pausen dient der Verbesserung des
Sprachflusses und damit der rhetorischen Wirkung, verletzt
allerdings das Prinzip der Authentizität. Trotz aller
Bearbeitungsschritte verbleiben einige Rumpelstörungen
innerhalb der Nutzmodulation, überlagern also bestimmte Laute oder
Lautkombinationen, die bei einer Tilgung mitentfernt würden.
III. Mit dem "Lautdenkmal"
betreten wir, wie schon angedeutet, die Ära der elektrischen
Tonaufnahme; als Schallwandler fungieren sehr gute Kohlequerstrom-,
Bändchen- oder gar Kondensatormikrofone, letztere
erreichen schon in den dreißiger Jahren quasi UKW-taugliche
Frequenzgänge. Das der
Schneidkennlinie
entsprechend "entzerrte" Audiosignal gelangt über einen klirrarmen
Gegentakt-Leistungsverstärker auf den als Schneidstichel wirkenden
Saphir oder Diamanten, der die Auslenkungen der Modulation in eine
Wachsmatrize oder Schallfolie ritzt; die professionelle
Technik erzielt Frequenzgänge, mit denen alle Sprach-Formanten zu
ihrem Recht kommen. Mit elektrodynamischen Leicht-Tonabnehmern
lassen sich solche hochwertigen Aufnahmen schon kurz vor dem 2.
Weltkrieg adäquat abtasten; Fritz KÜHNE berichtet,
man habe bereits mit Mehrweg-Studiolautsprechern
experimentiert und eine HiFi-taugliche Übertragungsstrecke
aufgebaut. In diese Zeit fallen auch die ersten Versuche
kopfbezogener Stereophonie, und im Jahre 1943 machte die
damalige Reichsrundfunkgesellschaft auf einem AEG-Magnetophon mit
neuentwickeltem Zweispur-Kopf die ersten Stereo-Tonbandaufnahmen
der Geschichte.
Das sechs Jahre zuvor realisierte Lautdenkmal bedeutet
einen Meilenstein auf diesem steilen Erfolgsweg. Eingesetzt wurde
ein spezieller Aufnahmewagen der Firma Telefunkenplatte G.m.b.H.,
Abt. Spezialaufnahmen, Hallesches Ufer 30, Berlin SW 11. Es
wurden Wachsmatrizen geschnitten; Zahl und Adressaten der
Pressungen sind mir nicht bekannt.
Sehr gute Ergebnisse erreichten damals auch schon die sog.
"Einkoffer-Aufnahme-/Wiedergabeeinrichtungen" wie die von Franz
v. Trümbach ("Tonograph"), Siemens und Telefunken
(s. Abb.) hergestellten; hierzu u.a.: SCHWANDT,
Erich: Schallplatten-Bastelbuch. Selbstaufnahme- und
Wiedergabe-Praktikum. Leipzig o.J. [1938 ?]; KÜHNE,
Fritz: Neuzeitliche Schallfolienaufnahme. 2. Aufl. München
1952 (Radio-Praktiker-Bücherei Heft 7). Die von SCHWANDT
(S. 21) guten Schallplatten attestierten Frequenzgänge bis
8 oder gar 10 kHz erreichen viele der "Lautdenkmal"-Aufnahmen;
andere, so die entsetzlich gestörte*) und auch vom Inhalt her fragwürdige
Nr. 36 (Unterrodach /Kronach, Oberfranken), verfehlen die
gute Qualität, die in der zweiten Hälfte immer ohrenfälliger wird.
Die Heterogenität des Lautdenkmals kann teilweise auch
daher rühren, daß, auch als Folge des verlorenen Krieges, die
Originale wohl nicht immer sorgfältig gelagert und behandelt
wurden (es ist überhaupt ein Wunder, daß sie die Kriegs- und
Nachkriegswirren einigermaßen überstanden). Die von der Fa. Teldec
(=Telefunken-Decca) GmbH vorgenommene Herstellung von Bandkopien
erfolgte anscheinend nicht nach allen Regeln der Kunst, so hätte
man beispielsweise viele elektrostatische und andere Störungen
durch eine Vorbehandlung und von statischer Ableitung
begleitete Naßabtastung (s. Kasten unten) ganz
oder teilweise vermeiden können. Mindest 35 Jahre lang hätte man
Zeit gehabt, eine neue (und in einigem bessere) Archiv-Einspielung
zu besorgen, doch nichts geschah; andererseits stehen erst seit
wenigen Jahren im Zuge des sich rasant entwickelnden Harddisk-Recordings
und der damit entstandenen Sound(editor)-Software
Werkzeuge bereit, mit denen sich auch in unserem Zusammenhang
wesentliche Verbesserungen erzielen lassen.
--------
*) Die Aufnahme ist durch zahlreiche Kratzer und
Verschmutzungen verdorben (mutwillige Zerstörung wegen des
Inhalts?); um wenigstens einige Wörter hörbar zu machen (s. obigen
Link), habe ich folgende Bearbeitungsschritte unternommen:
Norm.95%; 5 x Declicking Opt.2 (1600 /2541 /2924 /2301 /1500
fixed); BP 180...5500 Hz; 1 x Decl. Opt. 1 (2200 fixed); Norm.95%;
1x Decl. Opt.2 (450 fixed); manuelles Tilgen von Störimpulsen; 2 x
Decl. Opt.2 (260 /250 fixed); Norm.95%; 2 x BP 160...5000 Hz; SF
NR; Norm.95%; Blue Compr.; Norm.95%; vergleichsweises Encoding mit
6,5 /8,5 /12 / 16 kbps.
Zu einigen besonders interessanten Tonproben finden Sie hier einige zusätzliche
Erläuterungen (Abkürzungen: BP =
[steilflankiges] Bandpaßfilter 18. Ordnung zum Kappen unterer und
oberer Spektralanteile; Decl = Declicking zur Ausfilterung
elektrisch oder mechanisch bedingter Nadelimpulse; manEd
= manuelles Editing mit Pausenverkürzung und Störimpuls-Löschung);
Norm. = Normalizing; NR = Noise Reduction,
Verbesserung des Störabstandes; SF NR = Sonic Foundry
Noise Reduction 2.0
Die hier aufgezeigten Möglichkeiten katenativer Filterung
ergaben sich im Laufe meiner Arbeit an zum Teil äußerst
schwierigem Tonmaterial und repräsentieren verschiedene Wege mit
nicht immer identischem Resultat. Welches Vorgehen als "Königsweg"
gelten kann, wird sich erst nach vielen weiteren Versuchen
ergeben; zudem erfordern bestimmte kritische Samples immer wieder
neue, bislang nicht realisierte Verfahren.
- Anselfingen /
Konstanz (155 / w'19,4):
Erstellt Juni 2001; Decl, NR, BP; ruhige, getragene Atmosphäre;
durch DynCP wird das Hintergrund-Glockengeläut geringfügig
verstärkt, auch der beim Überspielen auf CD infolge fehlerhafter
Tonkopfabschirmung auftretende leichte Grund-Brumm. Encoding
zunächst mit 16 kbps.
2. Bearb. 13.9.2k1; Behandlung mit SF Noise Reduction
2.0a (s.u.) und breitbandigere Encodierung mit 32 kbps;
3. Bearb. 24.9.2k1: zusätzl. Normalizing 95%, 2 x
BP 120...6000 Hz, Norm. 95%, Enc. 32 kbps: sehr starke Brillanzanhebung
zur Verdeutlichung dialektspezifischer Lautungen (vor allem Sibilanten
und Affrikaten); alternativ zeigte sich der 16-kbps-Modus
als ausreichend
4. Bearb. 30.11.2k1: zusätzl. Norm. 95%, Waves
X-Noise (mittig), dadurch etwas Brillanzverlust, deshalb
wieder Enc. 32 kbps.
- Berstadt /Büdingen (Hessen, 117
/ Q' 20,3)
3. Bearb. 15.1.2k2: Norm. 90%; 3 x BP 170...6000
Hz; 3x Decl. Opt.2; Del. Silence >200 ms (27/11"); Harmonic
Exciter; Hard Limiter +15/-2 dB; X-Noise
24/25; Hard Limiter [2] +3/-2 dB; BP [2] 170...5500 Hz;
Norm. 92%; Enc. 16 kbps
- Boldixum /Föhr (186 /
P 18,5), stark verknistert, erhebl. Pegeldifferenz zwischen
beiden Sprechern
Bearb. 27.12.2k1: Norm. 95%, BP 160...6000 Hz; Norm. 95%;
5x Decl. Opt.2; Del. Silence >200 ms(1); Norm. 95%; SF NR;
Del. Silence >200 ms(2); 3x Decl. Opt.2; PB 160...6000 Hz(2);
Del. Silence >200 ms(3); Blue Compr.; 3x Decl. Opt.2,
Encoding > RA 16 kbps
2. Bearb. 28.12.2k1, speziell zur Hervorhebung der
für den sonst schwer verständl. Dialekt charakteristischen
Laute: Harmonic Exciter (Arboretum) ; 3 x Decl. Opt.2;
2x Decl. Opt.1 (!), Del. Silence > 200ms; Hard
Limiter +13 dB/Peak -2 dB; 2x BP 170...5500 Hz +
Norm. 94%; Sonic Foundry NR; Norm. 94%; Enc. 16 kbps
- Dießen am Ammersee (Bayern,
142 / v' 33,2):
1. Bearb. Februar 2000, zunächst volle Länge. Durch
schmalbandige Encodierung (*.ra, 8 kBps!) sehr ruhig +
ausgeglichen, doch wenig Höhen.
2. Bearb. August 2001; verkürzt auf ca. 1 Min., manEd;
Höhen mit Harmonic Exciter angehoben (erfordert neue
Encodierung mit 12 kBps), zusätzlich DynCP und
Normalizing auf fast 100%, hierdurch etwas rauhe *.ra
3. Bearb. 11.9.2001 mit Sonic Foundry NR
- Ebsdorf / Marburg a.d. Lahn (116
/ N' 19,10)
2. Bearb. 16.1.2k2: 3x BP 170...6000 Hz; 3x Decl. Opt.2;
Del. Silence; Izotope Ozone Harmonic Exciter; X-Noise
15 /22; Hard Limiter +16 /-1.5 dB; Enc. 32 kbs;
kräftiger und ausgewogener als die zwar "UKW-mäßigere", doch mit
deutlicher Präsenzdelle generierte 1. Version
- unbekannter Ort (18 [1936],
niederdeutsch)
2. Bearb. 14.10.2k1: Norm.97%; 5x Decl. Opt.2; BP
180...6000 Hz; Del. Silence (autom., 26 Sek.!); SF NR; Blue
Comp.; Norm.97%; Enc. 16 kbps; klingt trotz 16 kbps
durchsichtiger als die mit 32 kbps encodierte Version 1
3. Bearb. 31.12.2k1: zusätzl. Harmonic Exciter;
Waves X-Noise(tm); Hard Limiter +15/-2 dB, 2x BP
170...5500 Hz (zwischendurch jeweils Normalizing 90%), Enc. 16
kbps: keine wesentliche Verbesserung gegenüber (2)
4. Bearb. (zum Vergleich mit 3, 31.12.2k1): 3x BP
170...5500 Hz; Norm. 95%; 3x Decl. Opt.2; Del. Silence >
200ms (45 Instances); Harmonic Exciter; Waves X-Noise; Hard
Limiter +15/-2 dB; Notch DTMF 60+180 Hz /47 dB; Norm. 95%; 3 x
Decl. Opt.2; Norm. 93%; Harm. Exciter 50%; Waves X-Noise; Norm.
90%; Enc. 16 kbps: keine wesentliche Verbesserung
gegenüber (2)
5. Bearb. 31.12.2k1: Fassung (2) + Hard Limiter
+15 /-2 dB; Harmonic Exciter; Normalizing 90%; BP
170...5500 Hz; Enc. 16 kbps
6. Bearb. 31.12.2k1: Fassung (2) + Norm.
90%; Harmonic Exciter; Norm. 90%; Waves X-Noise 43%;
Hard Limiter +10 /-2 dB; Enc. 16 kbps; bisher
durchsichtigste, "angenehmste" Version
- Fredeburg /Meschede (Westfalen, 173
/ G' 16,9):
Erstellt Aug. 2001. manEd; *Decl, NR, BP, sehr starke
DynCP (mit Pump-Effekt) und Encodierung mit 32
kbps; in der ersten Hälfte periodisch wiederkehrendes Kratzen
innerhalb der Nutzmodulation ebenfalls hervorgehoben; Alternativen:
2.- 4. (vergleichende) Bearb. =
Schmalband-Fassung: 13.9.2k1: manEd usw.; zusätzlich SF-NR
2.0a; Blue Compressor; Encoding mit 12
kbps unterdrückt einen Teil des in der ersten Hälfte störenden
Kratzens;
5.- 7. (vgl.) Bearb. am 15.9.2k1: mehrfaches
Declicking mit Option 1 "Constant Hiss & Crackle"
(zus. ca. 500.000 Clicks fixed!), Hard Limiting und Mehrfach-Bandpaß
(Encoding 32 kbps erforderlich) bringen keine
Verbesserung.
8. Bearb. 11.+12.10.2k1: Norm.95%; Decl. Opt.2;
Norm.95%; 15x Decl. Opt.2; BP 180...5500 Hz; Norm.95%;
SF NR; Norm.95%; Del. Silence; Blue Compr.; Norm.95%; BP
180...5000 Hz; bis 0:42'7 5x Decl. Opt.1;
[12.10.] Amplitude einiger Kratzstörungen und sonstige
auffällige Maxima auf ca. 35-50% red.; Norm. 95%; Decl. Opt. 2;
Enc. 16 kbps, als 3. Fassung publiziert. Das durch
partielle Verunreinigung oder Beschädigung der Platte
entstandene periodische Kratzen ließ sich auch durch diese
Neubearbeitung nicht tilgen.
- Freudenstadt /Schwarzwald (163
/ p' 17,3; red. bearb.)
2. Bearb. 15.1.2k2: Norm. 92%; 3 x BP 170...6000
Hz; 3x Decl. Opt.2; Del. Silence >200 ms (48 / 22,3"); Decl.
Opt.2; Del. Silence (4 / 0,5"); Decl. Opt. 2; Del. Sil. (4 /
0,5"); manEd.; Decl. Opt. 2; Del. Sil. (2 / 0,4"); Hard
Limiter +15 / -2 dB; BP 170...5500 Hz; Norm. 92%; X-Noise
24 / 25; SF Noise Red. 33.4 / 9.4/..3.3 /
4dB; Norm. 90%; Enc. 32 kbps; klingt etwas ausgewogener
und weniger verzerrt als die eine Präsenzdelle
aufweisende Version 1.
- Groß-Strengeln /Angerburg
(Ostpreußen, 084 / V 98,10; red. bearb): durch
viele Clicks und Crackles (auch innerhalb der Nutzmodulation)
gestört; trotz dieses Umstands und der stark politischen Färbung
wegen der dialektalen Relevanz in das Proben-Corpus integriert.
1. Bearb. 18.1.2k2: 3x BP 170...5500 Hz; 3x Decl. Opt.2;
2 x Decl. Opt.1; Del. Silence >180 ms (12 / 3,2");
Izotope Ozone MB Harmonic Exciter (Bd.2+3); X-Noise 12 /26;
Decl. Opt.2; Del. Sil. (12 /3,6"); Hard Limiter +15 /-1
dB; Norm. 70%; BP 180...5000 Hz; Norm. 90%; Enc.
16 kbps
- Hamburg-Finkenwerder (011 /
d 26,8):
Ältere Aufnahme (# 11). Probe erstellt Aug. 2001. manEd; *Decl,
BP, DynCP, nochmals BP. Durch Dynamik-Kompression
dialektrelevante Lautungen hervorgehoben. Stimmton schlank,
Sprachgebung, Inhalt + Intonation gut didaktisierbar.
2. Bearb. 24.9.2k1: Normalizing 95%; 5 x Declicking
Option 2; BP 120...6000 Hz; SF-NR 2.0a; Blue Compr.; Normal.
95%; manEd; BP 140...6000 Hz; Blue Compr.; Norm. 95 %; Enc. 16
kbps: Stimmton sonorer, Brillanz-Anhebung
3. Bearb. 11.1.2k2: länger (2'27"); Norm. 95%; 2x
BP 170...5500 Hz; Decl. Opt.2; Del. Silence >170 ms (44
Instances = 20,17"); Decl. Opt.2; Del Silence w.o. (2 Inst.);
Decl. Opt.2; Del. Sil. (5 Inst.): Decl. Opt.2; Del. Sil. (3
Inst.); Decl. Opt.2; Harmonic Exciter 82,5%; X-Noise
Thresh. 12.1; Hard Limiter 10/-3 dB; Norm. 90%; X-Noise
w.o. [2]; Enc. 16 kbps.
Erkenntnisse:
- Dialektrelevante schwachtonige Lautungen lassen sich
durch das Hard Limiting besser hervorheben (und
damit didaktisieren); hierdurch gewinnt die Lesbarkeit
(Verständlichkeit)
- Nach jedem weiteren Declicking konnten neu gewonnene
Leerstellen (Silence >170 ms) getilgt werden; insgesamt
wird die Datei dadurch ca. 26 Sekunden kürzer und damit der
Erzählfluß wesentlich verbessert.
- Haunswies
/Aichach (056, p' 33,11), volle Länge, neu bearb.
11.2.2k12: Ausgang von *.wav; 4x Spectralizer 4
kHz, 4x Declicking (9300/1100/895/779 Instances), 2x Sci-Filter
120...6000 Hz (10. Ordnung), Blue Compressor (Default), Hard
Limiter -1/+2 dB, Denoising 14/22,9 dB, 4x Notch 50Hz
- Holt, Gemeinde Straelen
/Geldern (231 / C' 4,5; 14.1.2k2/wv)
Bearb. 14.1.2k2: Norm. 93%; 2x BP 170...5500 Hz; Decl. Opt.2;
Norm. 90%; Harmonic Exciter; Hard Limiter +15/-1 dB; 3 x
Decl. Opt.2; manuelles Tilgen v. Leerstellen (2'04" > 1'52");
Waves X-Noise 17.1 / 27; Enc. 16 kbps
- Jabel / Waren, Mecklenburg (105
/ d 42,2)
2. Bearbeitung 17.10.2k1: zusätzlich SF NR; BP
170...5500 Hz; Blue Compr.; Norm.95%, Enc. 16 kbps,
dennoch durchsichtiger als 1. Version mit 32 kbps.
- Kassel (281 / F'
23,10; red. bearb.)
3. Bearb. 14.1.2k2: Norm. 90%; 3 x BP 170...6000
Hz; Decl. Opt.2; Del. Silence >175 ms (34 / 13,41"); ** Hard
Limiter +15 / -2dB; X-Noise 11 / 21; Encoding 16 kbps
4. Bearb. 14.1.2k2: von ** an Hard Limiter +15
/-3 dB; (alternativ) Sonic Foundry NR
75.5/13.7/...3.31/6; Hard Limiter [2] +3 /-2 dB;
Enc. 16 kbps. Da - wegen Verzerrungsgefahr - der Harmonics
Exciter hier nicht in Frage kam und sich ohne
Höhenanhebung X-Noise ebensowenig empfahl, wurde statt
dessen kombinatorisch Sonic Foundrys Noise Reduction
verwendet und dabei der Bereich um 3,1 kHz um 6 dB angehoben.
Hierdurch entstanden einige weit über 90% hinausgehende
Amplitudenspitzen; mit nochmaligem Hard Limiting (+ 3dB)
wurde das Signal durchgängig auf ca. 90% begrenzt sowie Lesbarkeit
und Eindringlichkeit nochmals verbessert. Bei stark
reduziertem Wiedergabe-Output bleibt die Verständlichkeit
dennoch erhalten - im Gegensatz zu einem Sprachfluß mit
"natürlicher" Amplitudenstatistik.
5. Bearb. 23.1.2k2 (Probe wegen ihres trockenen
Humors nur leicht gekürzt)
Norm. 92%; 1 x Clickfix 2.04; 3x BP 170...6000 Hz; 3x
Decl. Opt.2; Hyperprism Harmonic Exciter (odd + even); X-Noise;
Del. Sil. >260ms (76 /34"); Izotope Ozone MB
Harmonic Exciter; dB Mastering Limiter; Norm. 90%;
man.Ed.; Enc. 16 kbps
- Kunzendorf b. Neurode / Glatz
(Niederschlesien, 204 / O' 66,3):
sehr lautes Knistern, dumpfe Sprachmodulation; nach zunächst
"konventionellem" Vorgehen
2. Bearb. 10.10.2k1: Norm. 95%; BP 160...6.000 Hz;
Normal. 95%; 5x Decl. Opt.2; Del.Silence + manEd; 5 x Decl.
Opt.2; SF NR; BlueComp; Norm. 95%; Encoding 16 kbps
3. Bearb. 17.1.2k2: 3x BP 170...5500 Hz; 4x Decl.
Opt.2; Del. Sil. >180 ms (38 /20"); Izotope Ozon
MB Harmonic Exciter; 3x Decl. Opt2; Arboretum Harmonic
Exciter; SF Noise Red. 64.5 /15.7/...2.9/2
dB; Hard Limiter +15 /-1.5 dB; BP 170...4500 Hz; Hard
Limiter [2] +4 /-1.5 dB; Enc. 16 kbps. Diese Bearb. stößt
an die Grenzen des Machbaren. Die extreme Ketten-Filterung
bringt zwar Verbesserungen, hebt die Nutzmodulation aus dem
Störnebel heraus und verbessert die Lesbarkeit, doch hinterläßt
Sonic Foundrys Noise Reduction (hier eindeutig
Waves' X-Noise überlegen!) einen etwas "künstlichen"
Klang; die dafür verantwortlichen Obertöne werden durch das
relativ schmalbandige Encoding mit 16 kbps größtenteils
weggefiltert, so daß das Real-Audio-Endprodukt wieder
natürlicher klingt.
4. Bearb. 17.1.2k2: das weiterentwickelte Direct-X-Plugin
Clickfix V. 2.06 arbeitet in nur einem Durchgang
schneller und gründlicher als das in Cool Edit Pro 1.2a
implementierte Declicking und ermöglicht zudem ein Vorhören
in Echtzeit; hernach 1 x BP 170...4500 Hz, Del. Silence
>180 ms (38 / 22"); Izotope Ozone MB HE; SF NR 43 / 11.7...3
/ +3 dB; ** Hard Limiter +15 / -1.5 dB; Normal. 90%; aufgrund
von Rauheiten bei 16 kbps mußte zu 32 kbps
*.ra encodiert werden. Das Endprodukt klingt geschlossen und
natürlicher als Version 3.
5. Bearb.: von ** an alternativ dB Audioware Mastering
Limiter + Normal. 90%; klingt bei identischem
Amplituden-Maximum lauter und kräftiger als Version 4.
- München (052 / t' 36,2; 3.
Fassung 31.12.2k1): zusätzl. Hard Limiter +10 /-2 dB;
Enc. 16 kbp
4. Bearb. 14.1.2k2: Norm. 90%; 2x BP 170...5500
Hz; Decl. Opt.2; Del. Silence (51 / 16,9"); Decl. Opt.2; Harmonic
Exciter; Hard Limiter +15/-2 dB; 3x Decl.
Opt.2; X-Crackle 82.1 / 56; X-Noise 28.8 / 46; 2
x Decl. Opt.2; Man.Ed. (redaktionell); Hard Limiter [2]
+6 / -2 dB; X-Noise [2] 22/25; Enc. 16 kbps.
Mittels dieser langen "Filterkette" konnten dialektrelevante
Lautungen hervorgehoben werden.
- Ostrohe /Norderdithmarschen (185
/ V 21,12)
sehr störendes Knistern, dumpfe Modulation; deshalb
2. Bearb. 11.10.2k1: Norm.95%; Decl. Opt.2;
Norm.95%; 10x Decl. Opt.2; BP 180...5500
Hz; Norm.95%; SF NR; Norm.95%; Del. Silence; Blue Compr.;
Norm.95%; Enc. 16 kbps
- Ramsloh (Saterland, 223 /
i 13,3)
3. Bearb. 16.1.2k2: 3x. BP 170...6000 Hz; 3x Decl.
Opt.2; Izotope Ozone Multiband Harmonic Exciter;
X-Noise 24b / 25; Del. Silence >200 ms (14 / 8,2"),
Del. Sil. > 180 ms (4 / 0,5"); Hard Limiter +20
/ -1.5 dB; Enc. 16 kbps; bisher "schärfstes" Limiting, dadurch
optimale Darstellung der schwachtonigen dialektrelevanten
Lautung.
- Sankt Andreasberg im Oberharz (019
/ A' 30,2)
Ältere Aufnahme, hohes Grundgeräusch, daher *Decl,
NR, BP, DynCP mit Normalizing ca. 95 dB; manEd; Wert
gelegt wurde weniger auf Ästhetik denn auf optimale
Informationsvermittlung und Verdeutlichung dialekttypischer
Lautmerkmale, die durch 16-kBit-Encoding zur Geltung
kommen.
2. Bearb. Cuxhaven, 9.10.2k1: Norm. 95%, 5 x
Declicking (Option 2), BP 160...6000 Hz ext./18. Ordnung; Delete
Silence (manEd), SF NR; Blue Compr.; BP 170...6000 Hz w.o.;
Norm. 95%; Encoding 32 kbps
3. Bearb. 30.11.2k1: Norm 95%, Waves X-Noise
(Mittenpos.), Enc. 32 kbps
- Scheie b. Bückeburg
/Schaumburg-Lippe (014 / t 21,5; 12.1.2k2/wv)
12./13.1.2002: Erste Bearbeitung dieses ziemlich beschädigten,
aber historisch und erzähltechnisch interessanten Tondokuments.
Nach Filterung (BP 18. Ordnung,
170...5500 Hz) und mehrmaligem Declicking (Option 2)
mit Hyperprisms Harmonic Exciter die Brillanzen
angehoben (Pre-Emphasis) + 1 x Decl. Opt. 2 (zur
teilweisen Tilgung der mitverstärkten restlichen Nadelimpulse),
damit nach anschließendem X-Noising (entspricht hier De-Emphasis)
noch genügend "Substanz" im Hochtonbereich verfügbar ist.
Via Hard Limiter die schwachen Anteile der
Amplitudenstatistik um 10 dB angehoben und der Maximaloutput auf
-0.5 dB begrenzt. ** Danach Normalizing 90% und 2 x BP
170...5500 Hz Sonic Foundry Noise Reduction (max., mit
Anhebung 5 dB um 2900 Hz), 3 x Declicking Opt. 2,
manuelles Tilgen aller Leerstellen (wegen der Crackles
aufgrund von Schallplattenschäden nicht automatisch möglich) und
Encoding mit 16 kbps.
2. Bearb. 13.1.2k2: von ** an manuelles Tilgen
aller Leerstellen (ca. 30 Sekunden gewonnen!); multiples
Declicking (Opt. 2); Normal. 93 %; *** Enc. 16 kbps. Im
Vgl. zu Fassung 1 geringfügig weniger Höhen, etwas
voller.
3. Bearb. 13.1.2k2: von *** an Hard Limiter
+10/-1 dB; Waves X-Noise Thresh. 31.7 / Red. 18; Enc.
16 kbps; SNR und Lesbarkeit verbessert
- Siegenburg /Bez.-Amt
Kelheim, Niederbayern (061, l' 38,4; Ges.-Aufn., 11.2.2k12;
Technik wie im Falle Haunswies
- unbekannter Ort (18
[1936], niederdeutsch; 7. Fassung (Gesamtaufn.) 11.2.2k12;
Technik wie 056 und 061
- Waldbüttelbronn / Würzburg (125
/ Y' 26,11; red. bearb.)
3. Bearb. 24.1.2k2: Norm. 90%; 5x Decl.
Opt2; Ddel. Silence >220ms (25"); manEd; Izotope Ozone MB Harmonic
Exciter; X-Noise 15 /35; DB Mastering Limiter;
=> *.wav; REnc. 3.1 => 16 kbps
- Warbeyen / Kleve (230 / z 4,1)
2. Bearb. 28.12.2k1: zusätzl. Hard Limiter
+15/-2 dB, BP 180...6000 Hz, Norm. 87%; Enc. 32 kbps
- Wulfen / Recklinghausen (229
/ A' 9,1):
Erstellt Aug. 2001; wie in [5]
durch manEd viele Pausen verkürzt und Sprachfluß
wesentlich verbessert; *Decl, BP, DynCP; 16-kBit-*.ra;
ausgezeichnete Verständlichkeit auch nebentoniger
dialektrelevanter Lautfolgen.
2. Bearb. 10.10.2k1: Vorgehen wie in [019], noch
weiter verbesserte Tonqualität durch 32 kbps
- Zechendorf /Deutsch Krone,
Grenzmark (Pommern, 072 / g 66,3)
3. Bearb. 16.1.2k2: 3x BP 170...6000 Hz; 3x Decl.
Opt.2; Izotope Multibd. Harm. Exciter; X-Noise
15 /20; SF Noise Reduction -7.2 /-5.5/...2.9/10;
Del. Silence >180 ms (10 /1.5"); Hard Limiter +16
/-1.5 dB; Enc. 16 kbps; Resultat wie in #223 (Ramsloh).
IV. Zusammenfassend läßt sich
folgendes feststellen:
- Ältere Aufnahmen sind nicht selten behaftet mit unangenehmen
Störungen, die unter kritischer Abwägung physikalischer,
kommunikativer und rezeptionsästhetischer Aspekte
und im Hinblick auf die spätere wissenschaftliche
(*.wav) und/oder didaktische (*.wav, *.mp3, *.wma, *.ra)
Verwendung so zu mindern sind, daß hierdurch keine Artefakte
(künstliche Zusätze) und sonstige Verfremdungen
entstehen; an Störungen unterscheiden wir:
1.1. bei Schallplatten (um die es hier
ausschließlich geht) / =>
Gegenmaßnahmen:
- mehr oder weniger starkes Grund-Rauschen
(Abnutzung, Nadelgeräusche) =>
Naßabtastung + Nadelfilter (Tiefpaß) bzw. De-Hissing
- Knacken (radiale Sprünge bzw. mutwillige
Einritzungen) =>
Naßabtastung + Declicking
- Kratzen (longitudial und radial fortschreitend,
meist aufgrund einer fleckförmigen Verunreinigung oder
Beschädigung) =>
mechanische Reinigung und / oder Naßabtastung + De-Noising
- Poltern / Rumpeln (durch
abnutzungs- oder fabrikationsbedingte Rillenschäden
oder horizontale Verwerfungen) =>
Rumpelfilter (Hochpaß)
- Pops (Wind- und Artikulationsgeräusche
bei der Aufnahme) =>
manuelle oder automatische Tilgung, sofern ohne Einbuße der
Nutzmodulation und des Informationsgehaltes möglich
- Knistern (durch elektrostatische Aufladung bei
Wiedergabe) =>
Naßabtastung + Declicking und / oder De-Hissing
Anmerkungen:
(a) Auch wenn erklärtermaßen gute Bandkopien
vorhanden sind, ist ein erneutes
korrigierendes Abtasten der
Original-Tonträger (Matrizen, Tonfolien, Platten)
anzustreben, denn 1. könnten bei der Erst-Abtastung
Unachtsamkeiten und/oder technische Fehler
aufgetreten sein, 2. wurden seit etwa 1960 Gerät
(Tonarme, Systeme, Antriebe, Verstärker) und
Methoden (Naßabtastung, Ladungsabbau) entscheidend
verbessert.
(b) Beim Abtasten ist zu achten auf:
1. optimale Schonung (=minimalen Verschleiß) des
Tonträgers durch adäquate Auflagekraft
2. sichere Rillenführung des Abnehmersystems (kein
Schlingern)
3. Minimierung tangentialer Abtastfehler
4. Ableitung elektrostatischer Ladung an Masse
(mittels Zusatz-"Tonarm", der zugleich die Platte
mit einer klaren (H2O
dest.) oder Reinigungsflüssigkeit (wg. klebriger
Rückstände nicht zu empfehlen!) benetzt. |
1.2. Die mit der
HF-Vormagnetisierung (1940) wesentlich verbesserten Tonbänder
(heute: analoge Offenspulen- und Cassettenbänder)
können gestört sein durch:
- Grund-Rauschen (infolge lagerbedingter Magnetisierung
oder mangelhaftem Aufnahme-Störabstand)
- Brummen (Wechselstrom-Einstreuungen infolge
mangelhafter Abschirmung oder Erdung)
- Modulationsrauschen bzw. (der
Modulationskurve überlagerte) Rauschfahnen
- Knacken (elektrostatische Aufladungen / Schaltstörungen
schon bei Aufnahme bzw. nur beim Abspielen oder infolge
Schneidens mit aufmagnetisierter Schere)
- Knistern (elektrostatische Aufladungen beim
Abspielen)
- Poltern / Rumpeln (durch elektrische
bzw. mikrofontechnische Aufnahme-Fehler)
- Pops (Wind- und Artikulationsgeräusche bei der
Aufnahme)
- Dropouts (kurzzeitige Aussetzer durch
Beschichtungsfehler)
- (meist periodische) Lautstärkeschwankungen (durch
bandführungsbedingte Aufnahme- /Wiedergabefehler oder
unbeabsichtigte Teil-Löschung in starkem Wechselfeld)
- "Schwimmen" im Hochton-(=Brillanz-)Bereich
(durch Azimuth-Fehler bei der Aufnahme oder Wiedergabe)
- Die früher ausschließlich mechanisch und/oder mit
bescheidenen elektrischen Filtern bewerkstelligte Schallplatten-Restauration
erfährt heute durch computativ-digitale
Verfahren ganz wesentliche Verbesserungen. Letztere sind
unerläßlich, wenn wir die Originalplatten nicht (mehr) abtasten
können und auf mehr oder weniger gute Tonband-Kopien angewiesen
sind.
Unter den digitalen Hilfsmitteln spielt der Click/Pop/Crackle
Eliminator eine informationstechnisch wie
hörästhetisch entscheidende Rolle. Das Programm Cool Edit
1.2a, an dem wir uns orientieren, bewertet
als mechanisch und elektrisch bedingte Stör-Phänomene neben den
sog. Pops (s.o.)
- Constant Hiss and Crackle
(gleichmäßiges Rauschen und Krachen/Knattern),
- Hiss + Lots of Clicks (Rauschen und oftmaliges
Knacken/Knistern)
Anmerkungen:
- Sie können das Declicking stark gestörter
Aufnahmen vereinfachen und beschleunigen, indem Sie zuvor
a) die hochfrequenten Impulsanteile ausfiltern (Bandpaß)
und / oder
b) im Zusammenhang mit einer Sprechpausen-Verkürzung
möglichst viele Pausen-Clicks manuell tilgen.
- Vor jeder Entstörung sind mit "Auto Find All
Levels" die Bezugspegel des Samples zu ermmitteln.
- Entstören wir nach [1], so werden schon in einem
Durchgang praktisch alle als Clicks
identifizierten steilflankigen Impulse getilgt (xxx fixed, 0
rejected), also auch solche innerhalb der Nutzmodulation,
wodurch dort sehr kurze Dropouts entstehen, die das
Signal holprig und zerrissen klingen lassen. In den
allermeisten Fällen empfiehlt sich [2]; hier werden
meist nur störende Pausen-Clicks getilgt (wir können
das auch graphisch an der Veränderung des
Modulationsverlaufs ablesen), andere zurückgewiesen
(rejected) und daher belassen.
- Wiederholen wir diese Prozedur (= multiples
Declicking), so werden möglicherweise jeweils hunderte
oder gar tausende weiterer (kleinerer) Clicks getilgt, was
sich nur geringfügig auswirkt, doch zur weiteren Beruhigung
des Signals beitragen kann. Die Bearbeitung des Kasseler Beispiels zeigte, daß
etwas rauh modulierte Stimmen dabei "rissig" werden
können. In solchen Fällen sollte nach nur einmaligem
Declicking
- SONIC FOUNDRYs "Noise
Reduction 2" oder
- WAVES (tm) X-Noise(s. auch unten)
bemüht werden:
** Durch zu scharfe Präsenz- bzw. Brillanzanhebung werden
mit SF NR in der Nutzmodulation liegende Clickstörungen
zurückgeholt.
---
- Allgemein ist ein ausgewogenes Klangbild anzustreben:
das von Technikern wie dem früher sehr bekannten Ing. Fritz KÜHNE
geforderte Idealprodukt 400.000 aus tiefster und
höchster Frequenz (also 40...10.000 Hz, 80...5.000 Hz,
100...4.000 Hz) entspricht dem früher favorisierten "warmen"
(Mittelwellen-)Klang. Wird dieses audiophile Ideal
strikt beachtet, so entstehen in apparativ bzw. akustisch
ungünstigen Fällen möglicherweise überproportional dumpfe
bzw. baßlastige Aufnahmen mit folgenden Nachteilen:
- die Grund(ton)frequenzen beanspruchen den größten Teil
innerhalb der Amplitudenstatistik und damit auch der
nutzbaren Übertragungsenergie
- "bumsige" Signale neigen zur Übersteuerung
- Trittschall und andere tieffrequente Störungen
(Möbelrücken, Türenschließen usw.) in unprofessionellen
Aufnahmen behindern mehr als gewöhnlich die
Sprachverständlichkeit.
Dumpf klingende Signale können mit einer
Kombination verschiedener Methoden verbessert werden:
- steilflankiges Abschneiden im Grundtonbereich
unter 150 / 180 Hz, ggf. als Bandpaß-Parameter.
Generell darf eine Tiefenabschneidung nicht so weit gehen,
daß das Signal spitz, körperlos und "künstlich" klingt.
- Frequenzkorrektur (=Anheben des formantkritischen
Bereichs) mit einem Parametrischen Equalizer oder
dem Noise-Reduction-Modul (NR 2.0a) von Sonic Foundry
- Dynamik-Kompression oder Hard Limiting,
danach ggf. (nochmals) Bandpaß 180...5500 Hz.
Dadurch erhöhen sich Sprachverständlichkeit und Störabstand
(signal-to-noise ratio), damit die wahrnehmbare
Lautstärke der Sprachinformation. Durch zusätzliche Dynamik-Kompression
oder ein verzerrungsarmes Hard Limiting ergibt sich
ein seit langem in der drahtlosen Nachrichtenübermittlung
(z.B. Überseerundfunk, Amateurfunk) bekannter Effekt: die
Sprache wird schon bei geringer Leistung als lauter, eindringlicher
empfunden als ein unkomprimiertes, "natürliches" Signal mit
seinen in der Regel hohen Amplitudendifferenzen. Positiv
betroffen sind hierbei vor allem druckschwache Laute
wie /s/, /f/, /k/, /t/ oder /ch/, die in stark gestörten
und/oder schmalbandigen Aussendungen oft kaum wahrzunehmen
sind, andererseits die Hauptrolle spielen in puncto Sprachverständlichkeit
und Dialektdistinktion. Ein gutes Beispiel für eine
solche methodische Kombinatorik ist die (am 8.3.2003
erstellte) Lautdenkmal-Probe aus Worpswede,
wo in zwei Durchgängen mit einem Bandpaßfilter 12. Ordnung
jeweils bei 150 Hz abgeschnitten und das Signal per Hard
Limiting und Dynamik-Kompression nivelliert
wurde; zudem wurden überlange Pausen getilgt und trotz der Filterung
und des mehrmaligen De-Clickings verbliebene
Störgeräusche zweimal mit Wavestm-X-Noise so
weit reduziert, daß zuvor mit einem Harmonic Exciter angehobene
Präsenz- und Brillanzanteile des Spektrums zugunsten der
didaktischen Präsentierbarkeit erhalten blieben.
Wenn zu "scharf" eingestellt, erzeugen Software-Kompressoren
(z.B. Blue Compr. von DigiLogue) eine Art Raumresonanz-Effekt,
der besonders in längeren Hör-Dateien demotivierend
wirkt. Wenn es nicht möglich ist, diesen Effekt rückgängig zu
machen (und statt dessen den klangneutraleren Hard Limiter
einzusetzen), ist der Resonanz-Anteil im Spektrum mittels Notch-Filter
zu reduzieren.
- Für breitbandige, aber beträchtlich gestörte (Knistern,
Knacken, Schaben) Aufnahmen (wie Fredeburg
/Meschede) empfehlen sich folgende (* ggf. mehrmalige)
Maßnahmen:
- * Bandpaß (Tschebyscheff, 18. Ordnung) ca. 170...6000
- * Declicking (Option 2)
- X-Noise und/oder SF Noise Reduction oder
- De-Noising mit 40 dB (High Hiss Reduction) und
hohem Präzisionsfaktor (20)
- Dynamik-Kompression oder Hard Limiting
(+10 / -2 dB); wenn optimal eingestellt, ist der HL
ist klangneutraler und wirkungsvoller.
Weiteres dazu:
- multiples Declicking (s.o.) und Höhenabschneidung
erst ab ca. 7 kHz, wenn Bandbreitenerhalt gewünscht
- Dynamik-Kompression mit digilogue BlueCompressor (max.
Soft-Knee-Einstellung) oder Sonic Foundry Track Compressor
nur dann, wenn hierbei kein verfremdender Raumresonanz-Effekt
entsteht
- Bursts: Das periodische Schaben bzw. Kratzen der
Fredeburg-Aufnahme kennen wir von vielen anderen älteren
Schallplatten; Ursachen sind partielle Verunreinigungen
(Verklebungen, Schmutzflecken; chemisch entfernbar) oder
Zerstörungen. Genau betrachtet, handelt es sich hier um
eine stetig wiederkehrende definierte Folge ultra-kurzer
Nadelimpulse, die zusammen einen Burst bilden; tritt
dieser in Modulationspausen auf, ist er problemlos zu
tilgen, nicht jedoch, wenn er der Nutzmodulation überlagert
ist. Gelänge es, ein Filter zu konstruieren, das den Burst
im Echtzeit-Durchgang oder einem anderen Bearbeitungsmodus
(z.B. gegenphasig) auslöscht, so wäre das ein Durchbruch in
der restaurativen Tonbearbeitung.
- Alternativen zum Declicking :
- ggf. mehrmaliger Bandpaß (s.o.)
- Hiss / Noise Reduction auf der Basis
eines automatisch ermittelten Noise
Floors bzw. Noise Profiles. Eine NR mit 40
dB oder mehr filtert nicht nur die hochfrequenten
Störimpulse weg; sie beschneidet auch den Nutzfrequenzgang
sowohl im Grundton- wie vor allem im Brillanzbereich.
b) extrem steilflankige Bandpaßfilterung (200...3500
Hz) und / oder
c) *.ra-Encodierung mit nur 8 (oder gar 6)
kBps.
- Maßnahmen gegen Verzerrungen:
- präventiv bei steilflankiger Bandpaßfilterung:
"normalisieren" Sie vor einer solchen Maßnahme auf
etwa 80 bis 85%
- korrigierend: gehen Sie in den Modus Noise
Reduction / Clip Restoration und wählen Sie
"Lightly Clipped". Wird die betroffene Passage dabei zu
stark abgesenkt, korrigieren Sie sie mit einem den
Durchschnittsmaxima entsprechenden Normalizing.
- Bandpaßfilterung, Dynamik-Kompression / Hard
Limiting und Normalizing bis ca. 90 % erhöhen zusammen
Lautstärke und damit Verständlichkeit nebentoniger
Lautsequenzen, die (z.B. als Flexionsendungen) meist dialektale
Merkmale enthalten.
- Stark gestörte und schmalbandige Aufnahmen
können informationell verbessert werden durch:
- * Bandpaß 180...3000 Hz
- * Declicking (Option 1)
- X-Noise (maximal) und / oder Encoding mit 8,5
kbps
Senken Sie generell Zischlaute und Obstruenten nur so weit
ab, daß Sprachverständlichkeit und Dialektdistinktion
erhalten bleiben, auch wenn dies zu Lasten der Hör-Ästhetik
geht.
- Breitbandige, wenig gestörte Einspielungen erfordern
nur geringfügige Filtermaßnahmen (BP 80...8.000 Hz, X-Noise) und
können als 32-kBps-*.ra encodiert werden, sofern nicht
angestrebt wird, wie im Falle von Danzig,
Elbing und Jabel,
nach zusätzlichem Declicking und (höhenanhebender) SF-Noise
Reduction (nachbearbeitend) eine Basis für "pre-emphatische"
16-kbps-Encodierung zu schaffen.
- Sichern Sie grundsätzlich alle Bearbeitungs-Zwischenschritte
(*.mp3 / 64 kBps reicht aus). Protokollieren Sie die
jeweiligen Maßnahmen und Einstellungen.
Links:
- How to begin restoring old records (Allen
Rény)
- About sound restoration (Sound & Vision
Engineering Department Technical University of Gdansk)
- Audio preservation and restoration (Univ.
Libraries, Univ. of Washington; Bibliographie)
(c) Dr. W. Näser 8/2k1 ff.
Wird ergänzt. Stand: 11.2.2012
(zuvor: 7.4.2003)