Anmerkungen zur Restauration historischer Tonaufnahmen
von Wolfgang NÄSER, Marburg
Historische Aufnahmen von Sprache und Musik sind umso
reizvoller und herausfordernder, je älter sie sind. Die Beschäftigung
mit ihnen ist nicht, wie es auf den ersten Blick scheinen könnte,
eine Spielerei, sondern wissenschaftliches und künstlerisches Desiderat.
Im Gegensatz zu Textdrucken und Malerei sind Foto, Film und Ton relativ junge
Medien, die es dann zu retten gilt, wenn sie besonders wichtige Ereignisse,
Trends, Persönlichkeiten darstellen und repräsentieren. Das ist
so in der Kunst, aber auch und gerade in der Wissenschaft - zumal wenn es
um Mundarten geht, von denen jedes Zeugnis der phonetischen Realisierung
um so wertvoller ist, je früher es entstand: wir denken hier auch und
gerade an solche Mundarten, die aufgrund historisch-politischer Ereignisse
für immer erstorben sind. Alte Tonaufnahmen sind auch dazu angetan,
möglicherweise falsche Vorstellungen zu Aussprache und Intonation zu
korrigieren, sofern dies auf der Basis bescheiden(st)er Tonqualität
überhaupt möglich ist.
Somit wären wir bei unserem Schwerpunkt, der historischen
Mundart-Tonaufnahme. Es gibt sie seit etwa 100 Jahren, genau genommen
seit 1899, als das Wiener
Phonogramm-Archiv
seinen Dienst aufnahm. Kaiser Franz Josefs berühmte Aufnahme vom 2.
August 1903 in Bad Ischl gehört, wie ich zu
beweisen versuchte, zu den
ältesten noch verwertbaren Tondokumenten. Ferdinand
WREDEs Aussagen zu Sprache
und Nationalität (1926) gehören ebenso in unsere Schatztruhe
wie ein großer Teil des - leider politisch belasteten -
Lautdenkmals reichsdeutscher Mundarten
(1936/37), mit dem in unserer Reihe zum ersten Male eine schon als modern
bezeichenbare Tontechnik in Erscheinung tritt. In qualitativer Hinsicht
gehören zu unserer Gruppe auch viele Aufnahmen, die in den 50er und
60er Jahren unter besonders schlechten Bedingungen entstanden oder von denen
wir nur sehr schlechte Kopien besitzen, die jedoch von hohem Wert sind für
Forschung und Lehre.
Dieser Wert kommt dann zum Tragen, wenn die alten bzw. unzureichend gepflegten
Tondokumente so aufbereitet werden, daß ihr Anhören nicht nur
informativ, sondern auch rezeptionsästhetisch optimal ist.
Das Prinzip des prodesse et delectare (nützen und erfreuen) gilt
auch und gerade hier; technisch umgesetzt, bedeutet dies
-
minimalen Störpegel (Rauschen, Knistern, Schaben, Kratzen)
-
angenehmes, ausgewogenes Klangbild (z.B. nicht zu viele Bässe)
-
optimale Verständlichkeit (der informationsrelevanten Laute und
Lautkombinationen)
-
zügigen Sprachfluß (nur kurze interverbale Pausen)
Die Erreichbarkeit dieser Ziele hängt ab vom tatsächlichen oder
objektiven Informationsgehalt der Aufnahme. Dieser ist umgekehrt
proportional zum Störpegel; d.h.: alles, was darunter liegt, ist
physikalisch und informationstechnisch verloren. Ich kann nur das auswerten,
was vorhanden ist, und muß jederzeit damit rechnen, daß, wie
wir noch sehen werden, der Vorteil einer korrigierenden Maßnahme mit
einem davor nicht vorhandenen Nachteil einhergeht.
Je älter die Aufnahme ist, desto mehr brauche ich an Erfahrung, Aufwand
und Mühe. Ab und zu jedoch stößt man bei "alten" Einspielungen
auf eine frappant gute Qualität, so beim "Lautdenkmal" z.B. im Falle
von Berlin, Danzig,
Elbing, Ebsdorf b. Marburg
oder Tilsit - alles Aufnahmen von 1937, jedoch schon
an die spätere UKW-Qualität erinnernd. Abgesehen von solchen
unerwarteten Glücksfällen bedeutet es immer eine Menge anstrengender,
zeitraubender Arbeit, eine Reihe von Samples wie die meiner
Themenseite zum Lautdenkmal zu erstellen.
Jene Aufnahmen ebenso wie die bereits erwähnten (Wrede u.a.) fungieren
als Beispiele für Ergebnisse und Hinweise aus meiner bisherigen Praxis.
Ich denke dabei nicht an erste Gehversuche ab 1959, sondern an die PC-orientierte
Zeit ab etwa 1995, als ich begann, auf einem 486SX66 mit einer bescheidenen
Festplatte von nur 170 MB und dem Programm Sound Forge 2.0 die ersten
Tondateien zu editieren, und dabei erstaunt feststellte, wie einfach es doch
im Grunde war bzw. ist, selbst einzelne bedeutungsrelevante Laute wie das
[v] in /Schweißen/ aus dem Sprachkontinuum zu entfernen bzw. in einen
Wortkörper einzufügen, wie ich es 5 Jahre später ganz vereinzelt
auch in einer Opern-Edition unternahm,
um undeutliche oder beim Singen unterdrückte Laute zu ihrem Recht kommen
zu lassen.
Der Sound-Editor ist sozusagen ein akustischer Setz-Kasten für alle
Arten kreativer Tongestaltung. Wie beim Textgestalten bedeutet Editieren
auch hier Löschen, Verschieben, alle Arten von
Verändern: ich unterscheide hierbei
-
textuelle (informationelle) Manipulationen
-
(a) klangverbessernde bzw. (b) räumlich verändernde
Maßnahmen
Obzwar ausnahmslos die dokumentarische Integrität bzw. wissenschaftliche
Authentizität verletzend, sind Textmanipulationen dann nötig, wenn
z.B. hochpolitische Aussagen zu tilgen sind, um ein Tondokument wie die Berliner
Aufnahme des "Lautdenkmals" als
dialektrepräsentatives Sample auch der Nachwelt fruchtbar zu machen.
Da ist von einem "Sturmlokal" die Rede, von Horst Wessel usw.. Ich muß
die inkriminierbaren bzw. peinlichen Passagen so tilgen, daß der
Sprachfluß nicht beeinträchtigt wird; das
Resultat kann sich hören lassen, allerdings
nur im sprachwissenschaftichen Rahmen, hat es doch seine
historisch-politische Echtheit und damit den Charakter eines Zeitzeugnisses
mindestens zum Teil verloren.
Der Bearbeiter bzw. Verwalter historischer Tonaufnahmen steht somit immer
vor der Alternative,
-
unter dem Postulat historischer Authentizität auf Kosten der
Rezeptionsästhetik die originale Klangqualität ausnahmslos zu belassen
(dokumentarisches Verwalten) oder
-
durch akustische und editorische Eingriffe in das Tondokument dessen Intention
und Aussage zu verstärken und das Hörerlebnis im ästhetischen
Sinne zu optimieren (künstlerisches Nachschöpfen)
Nicht zuletzt aus didaktischen Gründen habe ich mich bei allen
hier angeführten Hörproben für den zweiten Weg entschieden.
Klangverbessernde Maßnahmen bilden den handwerklich-editorischen
Alltag des Tonaufnahme-Restaurators. Sofern ausnahmslos nach [2a] vorgegangen
wird, bleibt die informationelle und damit historische Gültigkeit erhalten;
ein wenig angekratzt werden würde sie, käme ich etwa auf die Idee,
eine der Lautdenkmals-Aussagen z.B. durch Verhallung in ein anderes,
verfremdendes Klangfeld zu versetzen, z.B. ein klerikales Environment,
wie es durch einen Klangfeldprozessor (Hardware) oder vom Sound-Editor spielend
leicht erzeugt werden kann. Hitler oder Goebbels würden dann z.B. in
einer Kirche oder einem Kloster sprechen statt in einer Open-Air-Arena, das
gäbe Anlaß für jede Menge Spekulationen. Gerade weil heute
derartige Manipulationen möglich sind (und dazu die textuellen!), besteht
zunehmend Zweifel an der Echtheit bestimmter "historisch-dokumentarischer"
Tonaufnahmen; verändert sich hier das Hintergrundgeräusch innerhalb
des Redeflusses abrupt, so dürfte kein Zweifel daran bestehen, daß
unzulässig "geschnitten" wurde.
Alle Arten der Klangmanipulation erfordern Zusatz-Module in Gestalt von
Programm-Bibliotheken bzw. Plug-ins; Editoren wie das hervorragende
Cool Edit 1.2a haben einen reichhaltigen "Werkzeug-Satz" an Bord, bieten
aber die Möglichkeit, beliebig viele externe Module als Direct-X
oder VST anzubinden, so z.B. Kompressoren, Limiter,
parametrische Equalizer u.a. Fasziniert von der Vielfalt des Angebots
und der Möglichkeiten, spielt der Anfänger zunächst mit allerhand
z.T. funktionsgleichen Plug-Ins herum, bis sich herauskristallisiert, welche
Programmteile bzw. Module am besten arbeiten und zu unserem Kern-Equipment
gehören. Man kann davon ausgehen, daß z.B. Cool Edit Pro 1.2a
bereits alle wesentlichen Werkzeuge enthält; vom Funktionsumfang her
bedeutet das den Gegenwert einer alle Raffinessen bietenden Studio-Hardware
im Werte von 100.000 DM oder mehr, noch vor 20 Jahren alleiniges Mittel des
kreativen Masterings. Der komplexe Sound-Editor bedeutet nicht nur unvorstellbare
Platzersparnis, sondern auch eine Kostenreduktion um 80 % oder mehr. Betrachten
wir den Hardware-Aufwand von der Aufnahme über das Mastering bis zur
Produktion, so vereint heute sogar schon ein Notebook wie das Gericom
Overdose S 14.1" TFT für rund 4.200 DM alle prozeduralen
Funktionsbausteine in sich, vorausgesetzt, die steuernde Software (Sound-Editor,
Brennprogramm) ist an Bord.
Zur Praxis
Die folgenden Proben sind ab 2001 erstellte Real-Audio-Dateien
(*.ra), die heute (2012) mit dem noch
hier
downloadbaren Real Player 6 abgehört werden können. Neuere
Versuche zeigten, daß bei solchen historischen Sprachaufnahmen
auch 10 Jahre später mit verbesserter Software, zusätzlichen Plugins
sowie der (weniger ökonomischen) Abspeicherung auf MP3pro nur
selten bessere Resultate zu erzielen waren.
I. Was z.B. das Statement Kaiser Franz Josefs I. von
1903 angeht, meinen bisher schwierigsten Fall, so dürfte aus dem
zugehörigen Text hervorgehen,
welche Schwierigkeiten ich Ende 1999 in mehreren Schritten bis Anfang
2000 damit hatte, aus meiner Cassettenkopie so viel an Information
herauszuholen, bis ich, in Ermangelung des bereits erstellten Textes
transkriptorisch "nachschöpfend", das meiste verstehen und niederschreiben
konnte.
Ich habe das Ganze noch einmal durchgeführt, nach anderthalb Jahren
zusätzlicher Erfahrung, und dann einige der Schritte vorgenommen, die
meinen Lautdenkmals-Samples zu mehr Durchhörbarkeit und Klarheit
verholfen haben. Ergebnis sind Neubearbeitungen vom
15.9. und
1.12.2001: in ersterer gelangt nicht nur
als Direct-X-Plugin SONIC FOUNDRYs Noise
Reduction 2.0a (versuchsweise u.a. 2x hintereinander) zum Einsatz, sondern
auch der in Cool Edit Pro 1.2a enthaltene Hard Limiter; in der neuesten
verwendete ich alternativ das neue WAVES(tm)-Plugin
X-Noise, das in diesem Falle nicht besser abschneidet und des Kaisers
Stimme seltsam nebelhaft abbildet.
Eine weitere Neubearbeitung vom 17.2.2002 bemühte Dart
Pro 32, WAVES(tm)-X-Noise, SONIC
FOUNDRYs Noise Reduction und wiederum den Hard
Limiter (-2 / +4 dB). Zwar wurde hierbei ein SNR bis etwa 48 dB (!) erreicht,
doch klingt (wie auch bei ausschließlich Cool-Edit-internen Verfahren
festgestellt) die Stimme nach extremer Rauschunterdrückung seltsam
vernebelt, distanziert und verhallt, so daß sich bei kritisch-distanziertem
Vergleichshören letzlich die "alte"
3.Version von Anfang
2000 trotz ihrer Zischel-Störungen als die natürlichste,
direkteste, "zupackendste" erweist. Fazit aus allem: irgendwann ist
nichts mehr zu gewinnen, ohne andere Parameter (unverzichtbare
Klangmerkmale) zu gefährden.
Erwogen hatte ich auch schon eine etwas absonderlich und keck anmutende Methode,
unserem Franz Josef I. zu unerwartetem akustischem Glanz zu verhelfen, und
das ginge so: /f/, /s/, /sch/, /t/ und ggf. andere formantkritische Laute
werden in allen möglichen Umgebungen aus einer anderen, von Alter und
Timbre her möglichst ähnlichen neuzeitlichen Stimme isoliert
und dienen als dateienmäßige Bausteine, als Fundus, um an passender
Stelle in den Sprachfluß eingefügt zu werden. Der jeweilige
Obertongehalt der Fremdbausteine ist so weit zu reduzieren, daß der
Verfremdungseffekt minimiert wird. Das Einkopieren von Korrektur- oder
Substitutionslauten ließe sich dadurch vereinfachen, daß beim
Editieren jeweils eine bestimmte, programmiertechnisch zugeordnete Taste
gedrückt wird (z.B. s für /s/, S für /sch/ usw.),
der PC würde somit teilweise zur akustischen Schreibmaschine.
II. Nun zur bereits erwähnten Wrede-Rede, einem Beispiel
für die bis ins letzte Detail verfeinerte mechanische
(=Phonographen-)Aufnahme. Hier ist folgendes festzustellen:
-
die in den PC einkopierte Originalkopie (Minidisk) ist zwar stark verknistert,
klingt jedoch kernig und zupackend; die Modulations-Hüllkurve weist
aus, daß auch alle Grundtöne unreduziert zur Verfügung stehen,
das bedeutet volle Sonorität.
-
um das starke Knistern zu reduzieren, kann ich alternativ oder in
Kombination
(a) Clicks und Pops ggf. in mehreren Durchgängen herausfiltern,
(b) anhand eines automatisch ermittelten Noise Floors ein definiertes
De-Hissing vornehmen und /oder
(c) die Click-Oberwellen durch ein steilflankiges Filter
(Butterworth oder Chebychev Typ 1) abschneiden
oder
(d) das Sample mit möglichst hohem Kompressionsgrad (bis 70 oder 100)
zu *.mp3 oder *.ra konvertieren, das hat die Wirkung eines
entsprechenden Filters, und / oder zusätzlich
(e) in manuellem Editing mit Zeitachsen-Zooming einzelne
Clicks, Pops und sonstige Störungen entfernen.
-
Filtermaßnahmen nach [2b] und [2c] verflachen den Stimmklang, lassen
Wrede möglicherweise wie durch einen Schalltrichter sprechen, während
die stark datenreduzierende Konversion zu *.ra einen relativ dumpfen
Mittelwellen-Klang erzeugt. Ähnlich arbeitet (im Audition mode)
der hochgelobte Declicker von Steinberg. Klar, daß bei
starker Höhenreduktion und daher Beschneidung des
Obertonspektrums die überwiegend hochfrequenten Clicks von selbst
verschwinden.
-
Letztlich muß ich entscheiden zwischen zwei grundsätzlichen
rezeptionsästhetischen Konzepten:
(a) weitgehender objektive akustischer Echtheit (angenommener
natürlicher Stimmklang vor Aufnahme) oder
(b) einer ins Kreativ-Künstlerische gehenden Bearbeitung als
Abbild einer in bestimmten Situationen (Schalltrichter nach Aufnahme)
angenommenen 'virtuellen' Realität.
Ich habe mich mit der zweiten Bearbeitung vom 11.8.2001 für
[4b] entschieden; ausschlaggebend war die in dieser
"Grammophon-Fassung" herrschende Ruhe in den
Sprechpausen. Die schlank mensurierte Stimme bekommt zudem etwas Feierliches,
an eine Vorlesung Erinnerndes, das die Wichtigkeit des Gesagten unterstreicht.
Bei der dritten Bearbeitung vom 14./15.9.2001 bin ich
folgendermaßen vorgegangen:
-
Einladen der Original-Bandkopie (DAT) in Cool Edit Pro 1.2a: SNR = 20 dB
-
Dreimal Tschebycheff-Bandpaß (18. Ordnung) 150...3500 Hz, SNR
= 27 dB
-
Declicking "Constant Hiss & Crackle": ca. 177.000 Clicks
fixed, 0 rejected, SNR = 29 dB
-
Sonic Foundry Noise Reduction mit ca. 85 % NR und ca. 8 dB High Shell
Gain 3,1 kHz, wenig Wirkung
-
Normalizing 95 %
-
Dreimal Declicking nach Option 2 "Lots of Hiss & Crackle": 1240
/1176 /1285 Clicks fixed
-
Sonic Foundry NR mit Maximaleinstellung NR und ca. 8 dB High
Shell Gain 3,1 kHz; SNR = 36 dB
-
Manuelles Tilgen einiger Pausen-Clicks / -Pops
-
Normalizing 93 %
-
Abspeichern als *.wav
-
Mit Real Enc. 3.1 Encoding mit 8,5 kbps
-------- Nachbearbeitung 1 (15.9.2k1) ---------
-
Re-Konversion von *.ra zu *.wav
-
Sonorisierung: 2 x Parametr. Equalizer, 216 Hz + 8dB zur
Verstärkung der 1. Grundton-Harmonischen
-
Normalizing 95 %
-
Anheben einiger relevanter Passagen im letzten Drittel der Aufnahme; SNR
jetzt ca. 33 dB
-
Abspeichern als *.wav
-
Real Enc. 3.1, 8,5 kbps
--------- Nachbearbeitung 2 (18.9.2k1) -------
-
aus (13) erhaltene *.wav behandelt mit dem virtuellen
Röhren-Kompressor (und Limiter) T-Rack S 2.0
-
Real Enc. 3.1, 8,5 kbps
--------- Nachbearbeitung 3 (24.9.2k1) --------
-
Einlesen der in (18) erhaltenen Version
-
manuelles Löschen einiger Störimpulse und Absenken interverbaler
Pegel
-
manuelles Kürzen der interverbalen Pausen zur Verbesserung des Redeflusses
-
Real Enc. 3.1, 8,5 kbps
Auf Dynamik-Kompression wurde zunächst verzichtet, weil sonst
die nicht entfernbaren, weil die Nutzmodulation durchsetzenden
Klicken, Rauschen und Rumpeln mit angehoben worden
wären. Die (im Gegensatz zur zweiten) mit
nur 8,5 kbps encodierte Fassung klingt dennoch durchsichtig und bietet
damit ein Maximum an Lesbarkeit bzw. Information.
Die am 15.9. nachträglich vorgenommene Sonorisierung gibt der
Stimme etwas Warmes, Zupackendes und reduziert etwas die Merkmale der typischen
"Grammophon"-Aufnahme; allerdings wird durch eine solche Maßnahme immer
das Hintergrund-Rumpeln mit angehoben. Um diesen Effekt zu begrenzen,
muß zuvor die eigentliche Stimmgrundfrequenz durch einen geeigneten
Bandpaß weggefiltert werden.
Die am 18.9.2k1 mit T-Rack S 2.0 in virtuellem
Röhrenverstärker-Klang erstellte Datei klingt noch zupackender,
sonorer als ihre Vorläuferin. Durch die Dynamik-Kompression wird
das Grund-Geräusch (Schleifen und Rumpeln) lauter, stört jedoch
nicht den wirklichkeitsnäheren Gesamteindruck.
Die am 24.9.2k1 vorgenommenen Manipulationen sind ästhetischer
Natur; das Kürzen interverbaler Pausen dient der Verbesserung des
Sprachflusses und damit der rhetorischen Wirkung, verletzt allerdings das
Prinzip der Authentizität. Trotz aller Bearbeitungsschritte
verbleiben einige Rumpelstörungen innerhalb der Nutzmodulation,
überlagern also bestimmte Laute oder Lautkombinationen, die bei einer
Tilgung mitentfernt würden.
III. Mit dem "Lautdenkmal" betreten wir,
wie schon angedeutet, die Ära der elektrischen Tonaufnahme; als
Schallwandler fungieren sehr gute Kohlequerstrom-,
Bändchen- oder gar Kondensatormikrofone, letztere erreichen
schon in den dreißiger Jahren quasi UKW-taugliche Frequenzgänge.
Das der
Schneidkennlinie
entsprechend "entzerrte" Audiosignal gelangt über einen klirrarmen
Gegentakt-Leistungsverstärker auf den als Schneidstichel wirkenden Saphir
oder Diamanten, der die Auslenkungen der Modulation in eine Wachsmatrize
oder Schallfolie ritzt; die professionelle Technik erzielt
Frequenzgänge, mit denen alle Sprach-Formanten zu ihrem Recht kommen.
Mit elektrodynamischen Leicht-Tonabnehmern lassen sich solche hochwertigen
Aufnahmen schon kurz vor dem 2. Weltkrieg adäquat abtasten; Fritz
KÜHNE berichtet, man habe bereits mit
Mehrweg-Studiolautsprechern experimentiert und eine HiFi-taugliche
Übertragungsstrecke aufgebaut. In diese Zeit fallen auch die ersten
Versuche kopfbezogener Stereophonie, und im Jahre 1943 machte die
damalige Reichsrundfunkgesellschaft auf einem AEG-Magnetophon mit neuentwickeltem
Zweispur-Kopf die ersten Stereo-Tonbandaufnahmen der Geschichte.
Das sechs Jahre zuvor realisierte Lautdenkmal bedeutet einen Meilenstein
auf diesem steilen Erfolgsweg. Eingesetzt wurde ein spezieller Aufnahmewagen
der Firma Telefunkenplatte G.m.b.H., Abt. Spezialaufnahmen, Hallesches Ufer
30, Berlin SW 11. Es wurden Wachsmatrizen geschnitten; Zahl und Adressaten
der Pressungen sind mir nicht bekannt.
Sehr gute Ergebnisse erreichten damals auch schon die sog.
"Einkoffer-Aufnahme-/Wiedergabeeinrichtungen" wie die von Franz v.
Trümbach ("Tonograph"), Siemens und Telefunken (s.
Abb.) hergestellten; hierzu u.a.: SCHWANDT, Erich:
Schallplatten-Bastelbuch. Selbstaufnahme- und Wiedergabe-Praktikum.
Leipzig o.J. [1938 ?]; KÜHNE, Fritz: Neuzeitliche
Schallfolienaufnahme. 2. Aufl. München 1952
(Radio-Praktiker-Bücherei Heft 7). Die von SCHWANDT (S.
21) guten Schallplatten attestierten Frequenzgänge bis 8 oder
gar 10 kHz erreichen viele der "Lautdenkmal"-Aufnahmen; andere, so die
entsetzlich gestörte*) und auch
vom Inhalt her fragwürdige
Nr. 36 (Unterrodach /Kronach, Oberfranken), verfehlen die gute
Qualität, die in der zweiten Hälfte immer ohrenfälliger wird.
Die Heterogenität des Lautdenkmals kann teilweise auch daher
rühren, daß, auch als Folge des verlorenen Krieges, die Originale
wohl nicht immer sorgfältig gelagert und behandelt wurden (es ist
überhaupt ein Wunder, daß sie die Kriegs- und Nachkriegswirren
einigermaßen überstanden). Die von der Fa. Teldec (=Telefunken-Decca)
GmbH vorgenommene Herstellung von Bandkopien erfolgte anscheinend nicht nach
allen Regeln der Kunst, so hätte man beispielsweise viele elektrostatische
und andere Störungen durch eine Vorbehandlung und von statischer
Ableitung begleitete Naßabtastung (s. Kasten unten)
ganz oder teilweise vermeiden können. Mindest 35 Jahre lang hätte
man Zeit gehabt, eine neue (und in einigem bessere) Archiv-Einspielung zu
besorgen, doch nichts geschah; andererseits stehen erst seit wenigen Jahren
im Zuge des sich rasant entwickelnden Harddisk-Recordings und der
damit entstandenen Sound(editor)-Software Werkzeuge bereit, mit denen
sich auch in unserem Zusammenhang wesentliche Verbesserungen erzielen
lassen.
--------
*) Die Aufnahme ist durch zahlreiche Kratzer und Verschmutzungen
verdorben (mutwillige Zerstörung wegen des Inhalts?); um wenigstens
einige Wörter hörbar zu machen (s. obigen Link), habe ich folgende
Bearbeitungsschritte unternommen: Norm.95%; 5 x Declicking Opt.2 (1600 /2541
/2924 /2301 /1500 fixed); BP 180...5500 Hz; 1 x Decl. Opt. 1 (2200 fixed);
Norm.95%; 1x Decl. Opt.2 (450 fixed); manuelles Tilgen von Störimpulsen;
2 x Decl. Opt.2 (260 /250 fixed); Norm.95%; 2 x BP 160...5000 Hz; SF NR;
Norm.95%; Blue Compr.; Norm.95%; vergleichsweises Encoding mit 6,5 /8,5 /12
/ 16 kbps.
Zu einigen besonders interessanten
Tonproben finden Sie hier einige
zusätzliche Erläuterungen
(Abkürzungen: BP = [steilflankiges] Bandpaßfilter 18.
Ordnung zum Kappen unterer und oberer Spektralanteile; Decl = Declicking
zur Ausfilterung elektrisch oder mechanisch bedingter Nadelimpulse;
manEd = manuelles Editing mit Pausenverkürzung
und Störimpuls-Löschung); Norm. = Normalizing;
NR = Noise Reduction, Verbesserung des Störabstandes; SF NR
= Sonic Foundry Noise Reduction 2.0
Die hier aufgezeigten Möglichkeiten katenativer Filterung ergaben
sich im Laufe meiner Arbeit an zum Teil äußerst schwierigem
Tonmaterial und repräsentieren verschiedene Wege mit nicht immer identischem
Resultat. Welches Vorgehen als "Königsweg" gelten kann, wird sich erst
nach vielen weiteren Versuchen ergeben; zudem erfordern bestimmte kritische
Samples immer wieder neue, bislang nicht realisierte Verfahren.
-
Anselfingen / Konstanz (155
/ w'19,4):
Erstellt Juni 2001; Decl, NR, BP; ruhige, getragene Atmosphäre; durch
DynCP wird das Hintergrund-Glockengeläut geringfügig verstärkt,
auch der beim Überspielen auf CD infolge fehlerhafter Tonkopfabschirmung
auftretende leichte Grund-Brumm. Encoding zunächst mit 16 kbps.
2. Bearb. 13.9.2k1; Behandlung mit SF Noise Reduction 2.0a (s.u.)
und breitbandigere Encodierung mit 32 kbps;
3. Bearb. 24.9.2k1: zusätzl. Normalizing 95%, 2 x BP 120...6000
Hz, Norm. 95%, Enc. 32 kbps: sehr starke Brillanzanhebung zur
Verdeutlichung dialektspezifischer Lautungen (vor allem Sibilanten
und Affrikaten); alternativ zeigte sich der 16-kbps-Modus als
ausreichend
4. Bearb. 30.11.2k1: zusätzl. Norm. 95%, Waves X-Noise
(mittig), dadurch etwas Brillanzverlust, deshalb wieder Enc. 32
kbps.
-
Berstadt /Büdingen (Hessen, 117 / Q'
20,3)
3. Bearb. 15.1.2k2: Norm. 90%; 3 x BP 170...6000 Hz; 3x Decl.
Opt.2; Del. Silence >200 ms (27/11"); Harmonic Exciter; Hard
Limiter +15/-2 dB; X-Noise 24/25; Hard Limiter [2]
+3/-2 dB; BP [2] 170...5500 Hz; Norm. 92%; Enc. 16 kbps
-
Boldixum /Föhr (186 / P 18,5), stark
verknistert, erhebl. Pegeldifferenz zwischen beiden Sprechern
Bearb. 27.12.2k1: Norm. 95%, BP 160...6000 Hz; Norm. 95%; 5x Decl. Opt.2;
Del. Silence >200 ms(1); Norm. 95%; SF NR; Del. Silence >200 ms(2);
3x Decl. Opt.2; PB 160...6000 Hz(2); Del. Silence >200 ms(3); Blue Compr.;
3x Decl. Opt.2, Encoding > RA 16 kbps
2. Bearb. 28.12.2k1, speziell zur Hervorhebung der für
den sonst schwer verständl. Dialekt charakteristischen Laute: Harmonic
Exciter (Arboretum) ; 3 x Decl. Opt.2; 2x Decl. Opt.1 (!),
Del. Silence > 200ms; Hard Limiter +13 dB/Peak -2 dB; 2x BP
170...5500 Hz + Norm. 94%; Sonic Foundry NR; Norm. 94%; Enc. 16 kbps
-
Dießen am Ammersee (Bayern, 142
/ v' 33,2):
1. Bearb. Februar 2000, zunächst volle Länge. Durch
schmalbandige Encodierung (*.ra, 8 kBps!) sehr ruhig + ausgeglichen,
doch wenig Höhen.
2. Bearb. August 2001; verkürzt auf ca. 1 Min., manEd;
Höhen mit Harmonic Exciter angehoben (erfordert neue Encodierung
mit 12 kBps), zusätzlich DynCP und Normalizing auf fast 100%,
hierdurch etwas rauhe *.ra
3. Bearb. 11.9.2001 mit Sonic Foundry NR
-
Ebsdorf / Marburg a.d. Lahn (116 / N' 19,10)
2. Bearb. 16.1.2k2: 3x BP 170...6000 Hz; 3x Decl. Opt.2; Del. Silence;
Izotope Ozone Harmonic Exciter; X-Noise 15 /22; Hard Limiter
+16 /-1.5 dB; Enc. 32 kbs; kräftiger und ausgewogener als
die zwar "UKW-mäßigere", doch mit deutlicher Präsenzdelle
generierte 1. Version
-
unbekannter Ort (18 [1936], niederdeutsch)
2. Bearb. 14.10.2k1: Norm.97%; 5x Decl. Opt.2; BP 180...6000
Hz; Del. Silence (autom., 26 Sek.!); SF NR; Blue Comp.; Norm.97%; Enc. 16
kbps; klingt trotz 16 kbps durchsichtiger als die mit 32 kbps encodierte
Version 1
3. Bearb. 31.12.2k1: zusätzl. Harmonic Exciter; Waves
X-Noise(tm); Hard Limiter +15/-2 dB, 2x BP 170...5500 Hz
(zwischendurch jeweils Normalizing 90%), Enc. 16 kbps: keine wesentliche
Verbesserung gegenüber (2)
4. Bearb. (zum Vergleich mit 3, 31.12.2k1): 3x BP 170...5500
Hz; Norm. 95%; 3x Decl. Opt.2; Del. Silence > 200ms (45 Instances); Harmonic
Exciter; Waves X-Noise; Hard Limiter +15/-2 dB; Notch DTMF 60+180 Hz /47
dB; Norm. 95%; 3 x Decl. Opt.2; Norm. 93%; Harm. Exciter 50%; Waves X-Noise;
Norm. 90%; Enc. 16 kbps: keine wesentliche Verbesserung gegenüber
(2)
5. Bearb. 31.12.2k1: Fassung (2) + Hard Limiter +15
/-2 dB; Harmonic Exciter; Normalizing 90%; BP 170...5500 Hz; Enc.
16 kbps
6. Bearb. 31.12.2k1: Fassung (2) + Norm. 90%; Harmonic
Exciter; Norm. 90%; Waves X-Noise 43%; Hard Limiter +10 /-2 dB;
Enc. 16 kbps; bisher durchsichtigste, "angenehmste" Version
-
Fredeburg /Meschede (Westfalen, 173 / G'
16,9):
Erstellt Aug. 2001. manEd; *Decl, NR, BP, sehr starke DynCP (mit
Pump-Effekt) und Encodierung mit 32 kbps; in der ersten
Hälfte periodisch wiederkehrendes Kratzen innerhalb der
Nutzmodulation ebenfalls hervorgehoben; Alternativen:
2.- 4. (vergleichende) Bearb. = Schmalband-Fassung:
13.9.2k1: manEd usw.; zusätzlich SF-NR 2.0a; Blue Compressor;
Encoding mit 12 kbps unterdrückt einen Teil des in der ersten
Hälfte störenden Kratzens;
5.- 7. (vgl.) Bearb. am 15.9.2k1: mehrfaches Declicking
mit Option 1 "Constant Hiss & Crackle" (zus. ca. 500.000
Clicks fixed!), Hard Limiting und Mehrfach-Bandpaß (Encoding
32 kbps erforderlich) bringen keine Verbesserung.
8. Bearb. 11.+12.10.2k1: Norm.95%; Decl. Opt.2; Norm.95%; 15x
Decl. Opt.2; BP 180...5500 Hz; Norm.95%; SF NR; Norm.95%; Del. Silence;
Blue Compr.; Norm.95%; BP 180...5000 Hz; bis 0:42'7 5x Decl.
Opt.1; [12.10.] Amplitude einiger Kratzstörungen und sonstige
auffällige Maxima auf ca. 35-50% red.; Norm. 95%; Decl. Opt. 2; Enc.
16 kbps, als 3. Fassung publiziert. Das durch partielle Verunreinigung
oder Beschädigung der Platte entstandene periodische Kratzen ließ
sich auch durch diese Neubearbeitung nicht tilgen.
-
Freudenstadt /Schwarzwald (163 / p' 17,3;
red. bearb.)
2. Bearb. 15.1.2k2: Norm. 92%; 3 x BP 170...6000 Hz; 3x Decl.
Opt.2; Del. Silence >200 ms (48 / 22,3"); Decl. Opt.2; Del. Silence (4
/ 0,5"); Decl. Opt. 2; Del. Sil. (4 / 0,5"); manEd.; Decl. Opt. 2; Del. Sil.
(2 / 0,4"); Hard Limiter +15 / -2 dB; BP 170...5500 Hz; Norm. 92%;
X-Noise 24 / 25; SF Noise Red. 33.4 / 9.4/..3.3 / 4dB;
Norm. 90%; Enc. 32 kbps; klingt etwas ausgewogener und weniger verzerrt
als die eine Präsenzdelle aufweisende Version 1.
-
Groß-Strengeln /Angerburg (Ostpreußen,
084 / V 98,10; red. bearb): durch viele Clicks und
Crackles (auch innerhalb der Nutzmodulation) gestört;
trotz dieses Umstands und der stark politischen Färbung wegen der
dialektalen Relevanz in das Proben-Corpus integriert.
1. Bearb. 18.1.2k2: 3x BP 170...5500 Hz; 3x Decl. Opt.2; 2 x Decl.
Opt.1; Del. Silence >180 ms (12 / 3,2"); Izotope Ozone MB Harmonic
Exciter (Bd.2+3); X-Noise 12 /26; Decl. Opt.2; Del. Sil. (12 /3,6"); Hard
Limiter +15 /-1 dB; Norm. 70%; BP 180...5000 Hz; Norm.
90%; Enc. 16 kbps
-
Hamburg-Finkenwerder (011 / d 26,8):
Ältere Aufnahme (# 11). Probe erstellt Aug. 2001. manEd; *Decl, BP,
DynCP, nochmals BP. Durch Dynamik-Kompression dialektrelevante Lautungen
hervorgehoben. Stimmton schlank, Sprachgebung, Inhalt + Intonation
gut didaktisierbar.
2. Bearb. 24.9.2k1: Normalizing 95%; 5 x Declicking Option
2; BP 120...6000 Hz; SF-NR 2.0a; Blue Compr.; Normal. 95%; manEd; BP 140...6000
Hz; Blue Compr.; Norm. 95 %; Enc. 16 kbps: Stimmton sonorer,
Brillanz-Anhebung
3. Bearb. 11.1.2k2: länger (2'27"); Norm. 95%; 2x BP
170...5500 Hz; Decl. Opt.2; Del. Silence >170 ms (44 Instances = 20,17");
Decl. Opt.2; Del Silence w.o. (2 Inst.); Decl. Opt.2; Del. Sil. (5 Inst.):
Decl. Opt.2; Del. Sil. (3 Inst.); Decl. Opt.2; Harmonic Exciter 82,5%;
X-Noise Thresh. 12.1; Hard Limiter 10/-3 dB; Norm. 90%; X-Noise w.o.
[2]; Enc. 16 kbps.
Erkenntnisse:
-
Dialektrelevante schwachtonige Lautungen lassen sich durch das Hard
Limiting besser hervorheben (und damit didaktisieren); hierdurch gewinnt
die Lesbarkeit (Verständlichkeit)
-
Nach jedem weiteren Declicking konnten neu gewonnene Leerstellen (Silence
>170 ms) getilgt werden; insgesamt wird die Datei dadurch ca. 26 Sekunden
kürzer und damit der Erzählfluß wesentlich verbessert.
-
Haunswies /Aichach (056,
p' 33,11), volle Länge, neu bearb. 11.2.2k12: Ausgang
von *.wav; 4x Spectralizer 4 kHz, 4x Declicking (9300/1100/895/779
Instances), 2x Sci-Filter 120...6000 Hz (10. Ordnung), Blue Compressor (Default),
Hard Limiter -1/+2 dB, Denoising 14/22,9 dB, 4x Notch 50Hz
-
Holt, Gemeinde Straelen /Geldern (231
/ C' 4,5; 14.1.2k2/wv)
Bearb. 14.1.2k2: Norm. 93%; 2x BP 170...5500 Hz; Decl. Opt.2; Norm. 90%;
Harmonic Exciter; Hard Limiter +15/-1 dB; 3 x Decl. Opt.2; manuelles
Tilgen v. Leerstellen (2'04" > 1'52"); Waves X-Noise 17.1 / 27; Enc. 16
kbps
-
Jabel / Waren, Mecklenburg (105 /
d 42,2)
2. Bearbeitung 17.10.2k1: zusätzlich SF NR; BP 170...5500
Hz; Blue Compr.; Norm.95%, Enc. 16 kbps, dennoch durchsichtiger als
1. Version mit 32 kbps.
-
Kassel (281 / F' 23,10; red.
bearb.)
3. Bearb. 14.1.2k2: Norm. 90%; 3 x BP 170...6000 Hz; Decl.
Opt.2; Del. Silence >175 ms (34 / 13,41"); ** Hard Limiter +15
/ -2dB; X-Noise 11 / 21; Encoding 16 kbps
4. Bearb. 14.1.2k2: von ** an Hard Limiter +15
/-3 dB; (alternativ) Sonic Foundry NR 75.5/13.7/...3.31/6;
Hard Limiter [2] +3 /-2 dB; Enc. 16 kbps. Da - wegen
Verzerrungsgefahr - der Harmonics Exciter hier nicht in Frage kam
und sich ohne Höhenanhebung X-Noise ebensowenig empfahl, wurde
statt dessen kombinatorisch Sonic Foundrys Noise Reduction
verwendet und dabei der Bereich um 3,1 kHz um 6 dB angehoben. Hierdurch
entstanden einige weit über 90% hinausgehende Amplitudenspitzen; mit
nochmaligem Hard Limiting (+ 3dB) wurde das Signal durchgängig
auf ca. 90% begrenzt sowie Lesbarkeit und Eindringlichkeit
nochmals verbessert. Bei stark reduziertem Wiedergabe-Output bleibt die
Verständlichkeit dennoch erhalten - im Gegensatz zu einem Sprachfluß
mit "natürlicher" Amplitudenstatistik.
5. Bearb. 23.1.2k2 (Probe wegen ihres trockenen Humors nur
leicht gekürzt)
Norm. 92%; 1 x Clickfix 2.04; 3x BP 170...6000 Hz; 3x Decl. Opt.2;
Hyperprism Harmonic Exciter (odd + even); X-Noise; Del. Sil.
>260ms (76 /34"); Izotope Ozone MB Harmonic Exciter; dB Mastering
Limiter; Norm. 90%; man.Ed.; Enc. 16 kbps
-
Kunzendorf b. Neurode / Glatz (Niederschlesien,
204 / O' 66,3):
sehr lautes Knistern, dumpfe Sprachmodulation; nach zunächst
"konventionellem" Vorgehen
2. Bearb. 10.10.2k1: Norm. 95%; BP 160...6.000 Hz; Normal. 95%; 5x
Decl. Opt.2; Del.Silence + manEd; 5 x Decl. Opt.2; SF NR; BlueComp; Norm.
95%; Encoding 16 kbps
3. Bearb. 17.1.2k2: 3x BP 170...5500 Hz; 4x Decl. Opt.2; Del.
Sil. >180 ms (38 /20"); Izotope Ozon MB Harmonic
Exciter; 3x Decl. Opt2; Arboretum Harmonic Exciter;
SF Noise Red. 64.5 /15.7/...2.9/2 dB; Hard Limiter +15
/-1.5 dB; BP 170...4500 Hz; Hard Limiter [2] +4 /-1.5 dB; Enc. 16
kbps. Diese Bearb. stößt an die Grenzen des Machbaren. Die extreme
Ketten-Filterung bringt zwar Verbesserungen, hebt die Nutzmodulation aus
dem Störnebel heraus und verbessert die Lesbarkeit, doch
hinterläßt Sonic Foundrys Noise Reduction (hier
eindeutig Waves' X-Noise überlegen!) einen etwas "künstlichen"
Klang; die dafür verantwortlichen Obertöne werden durch das relativ
schmalbandige Encoding mit 16 kbps größtenteils weggefiltert,
so daß das Real-Audio-Endprodukt wieder natürlicher klingt.
4. Bearb. 17.1.2k2: das weiterentwickelte Direct-X-Plugin Clickfix
V. 2.06 arbeitet in nur einem Durchgang schneller und
gründlicher als das in Cool Edit Pro 1.2a implementierte Declicking
und ermöglicht zudem ein Vorhören in Echtzeit; hernach 1
x BP 170...4500 Hz, Del. Silence >180 ms (38 / 22"); Izotope Ozone MB
HE; SF NR 43 / 11.7...3 / +3 dB; ** Hard Limiter +15 / -1.5 dB; Normal. 90%;
aufgrund von Rauheiten bei 16 kbps mußte zu 32 kbps *.ra
encodiert werden. Das Endprodukt klingt geschlossen und natürlicher
als Version 3.
5. Bearb.: von ** an alternativ dB Audioware Mastering
Limiter + Normal. 90%; klingt bei identischem Amplituden-Maximum lauter
und kräftiger als Version 4.
-
München (052 / t' 36,2; 3. Fassung
31.12.2k1): zusätzl. Hard Limiter +10 /-2 dB; Enc. 16 kbp
4. Bearb. 14.1.2k2: Norm. 90%; 2x BP 170...5500 Hz; Decl. Opt.2;
Del. Silence (51 / 16,9"); Decl. Opt.2; Harmonic Exciter; Hard
Limiter +15/-2 dB; 3x Decl. Opt.2; X-Crackle 82.1 / 56;
X-Noise 28.8 / 46; 2 x Decl. Opt.2; Man.Ed. (redaktionell); Hard
Limiter [2] +6 / -2 dB; X-Noise [2] 22/25; Enc. 16
kbps. Mittels dieser langen "Filterkette" konnten dialektrelevante Lautungen
hervorgehoben werden.
-
Ostrohe /Norderdithmarschen (185 /
V 21,12)
sehr störendes Knistern, dumpfe Modulation; deshalb
2. Bearb. 11.10.2k1: Norm.95%; Decl. Opt.2; Norm.95%;
10x Decl. Opt.2; BP 180...5500 Hz; Norm.95%; SF NR;
Norm.95%; Del. Silence; Blue Compr.; Norm.95%; Enc. 16 kbps
-
Ramsloh (Saterland, 223 / i 13,3)
3. Bearb. 16.1.2k2: 3x. BP 170...6000 Hz; 3x Decl. Opt.2; Izotope
Ozone Multiband Harmonic Exciter; X-Noise 24b / 25;
Del. Silence >200 ms (14 / 8,2"), Del. Sil. > 180 ms (4 / 0,5"); Hard
Limiter +20 / -1.5 dB; Enc. 16 kbps; bisher "schärfstes"
Limiting, dadurch optimale Darstellung der schwachtonigen dialektrelevanten
Lautung.
-
Sankt Andreasberg im Oberharz (019 / A'
30,2)
Ältere Aufnahme, hohes Grundgeräusch, daher *Decl,
NR, BP, DynCP mit Normalizing ca. 95 dB; manEd; Wert gelegt wurde
weniger auf Ästhetik denn auf optimale Informationsvermittlung und
Verdeutlichung dialekttypischer Lautmerkmale, die durch 16-kBit-Encoding
zur Geltung kommen.
2. Bearb. Cuxhaven, 9.10.2k1: Norm. 95%, 5 x Declicking (Option
2), BP 160...6000 Hz ext./18. Ordnung; Delete Silence (manEd), SF NR; Blue
Compr.; BP 170...6000 Hz w.o.; Norm. 95%; Encoding 32 kbps
3. Bearb. 30.11.2k1: Norm 95%, Waves X-Noise (Mittenpos.),
Enc. 32 kbps
-
Scheie b. Bückeburg /Schaumburg-Lippe
(014 / t 21,5; 12.1.2k2/wv)
12./13.1.2002: Erste Bearbeitung dieses ziemlich beschädigten, aber
historisch und erzähltechnisch interessanten Tondokuments. Nach
Filterung (BP 18. Ordnung, 170...5500 Hz) und mehrmaligem
Declicking (Option 2) mit Hyperprisms Harmonic Exciter die
Brillanzen angehoben (Pre-Emphasis) + 1 x Decl. Opt. 2 (zur
teilweisen Tilgung der mitverstärkten restlichen Nadelimpulse), damit
nach anschließendem X-Noising (entspricht hier
De-Emphasis) noch genügend "Substanz" im Hochtonbereich
verfügbar ist. Via Hard Limiter die schwachen Anteile der
Amplitudenstatistik um 10 dB angehoben und der Maximaloutput auf -0.5 dB
begrenzt. ** Danach Normalizing 90% und 2 x BP 170...5500 Hz Sonic
Foundry Noise Reduction (max., mit Anhebung 5 dB um 2900 Hz), 3 x
Declicking Opt. 2, manuelles Tilgen aller Leerstellen (wegen der
Crackles aufgrund von Schallplattenschäden nicht automatisch
möglich) und Encoding mit 16 kbps.
2. Bearb. 13.1.2k2: von ** an manuelles Tilgen aller Leerstellen
(ca. 30 Sekunden gewonnen!); multiples Declicking (Opt. 2); Normal.
93 %; *** Enc. 16 kbps. Im Vgl. zu Fassung 1 geringfügig weniger
Höhen, etwas voller.
3. Bearb. 13.1.2k2: von *** an Hard Limiter +10/-1 dB;
Waves X-Noise Thresh. 31.7 / Red. 18; Enc. 16 kbps; SNR und
Lesbarkeit verbessert
-
Siegenburg /Bez.-Amt Kelheim, Niederbayern
(061, l' 38,4; Ges.-Aufn., 11.2.2k12; Technik wie im Falle
Haunswies
-
unbekannter Ort (18 [1936],
niederdeutsch; 7. Fassung (Gesamtaufn.) 11.2.2k12; Technik
wie 056 und 061
-
Waldbüttelbronn / Würzburg (125
/ Y' 26,11; red. bearb.)
3. Bearb. 24.1.2k2: Norm. 90%; 5x Decl. Opt2; Ddel.
Silence >220ms (25"); manEd; Izotope Ozone MB Harmonic Exciter;
X-Noise 15 /35; DB Mastering Limiter; => *.wav; REnc. 3.1 =>
16 kbps
-
Warbeyen / Kleve (230 / z 4,1)
2. Bearb. 28.12.2k1: zusätzl. Hard Limiter +15/-2
dB, BP 180...6000 Hz, Norm. 87%; Enc. 32 kbps
-
Wulfen / Recklinghausen (229 / A' 9,1):
Erstellt Aug. 2001; wie in [5] durch
manEd viele Pausen verkürzt und Sprachfluß wesentlich
verbessert; *Decl, BP, DynCP; 16-kBit-*.ra; ausgezeichnete Verständlichkeit
auch nebentoniger dialektrelevanter Lautfolgen.
2. Bearb. 10.10.2k1: Vorgehen wie in [019], noch weiter verbesserte
Tonqualität durch 32 kbps
-
Zechendorf /Deutsch Krone, Grenzmark (Pommern,
072 / g 66,3)
3. Bearb. 16.1.2k2: 3x BP 170...6000 Hz; 3x Decl. Opt.2; Izotope
Multibd. Harm. Exciter; X-Noise 15 /20; SF Noise
Reduction -7.2 /-5.5/...2.9/10; Del. Silence >180 ms (10 /1.5"); Hard
Limiter +16 /-1.5 dB; Enc. 16 kbps; Resultat wie in #223 (Ramsloh).
IV. Zusammenfassend läßt sich folgendes feststellen:
-
Ältere Aufnahmen sind nicht selten behaftet mit unangenehmen
Störungen, die unter kritischer Abwägung physikalischer,
kommunikativer und rezeptionsästhetischer Aspekte und
im Hinblick auf die spätere wissenschaftliche (*.wav) und/oder
didaktische (*.wav, *.mp3, *.wma, *.ra) Verwendung so zu mindern
sind, daß hierdurch keine Artefakte (künstliche Zusätze)
und sonstige Verfremdungen entstehen; an Störungen unterscheiden
wir:
1.1. bei Schallplatten (um die es hier ausschließlich
geht) / => Gegenmaßnahmen:
-
mehr oder weniger starkes Grund-Rauschen (Abnutzung, Nadelgeräusche)
=> Naßabtastung + Nadelfilter
(Tiefpaß) bzw. De-Hissing
-
Knacken (radiale Sprünge bzw. mutwillige Einritzungen)
=> Naßabtastung + Declicking
-
Kratzen (longitudial und radial fortschreitend, meist aufgrund einer
fleckförmigen Verunreinigung oder Beschädigung)
=> mechanische Reinigung und / oder
Naßabtastung + De-Noising
-
Poltern / Rumpeln (durch abnutzungs- oder
fabrikationsbedingte Rillenschäden oder horizontale
Verwerfungen) => Rumpelfilter
(Hochpaß)
-
Pops
(Wind- und Artikulationsgeräusche bei der Aufnahme)
=> manuelle oder automatische Tilgung,
sofern ohne Einbuße der Nutzmodulation und des Informationsgehaltes
möglich
-
Knistern (durch elektrostatische Aufladung bei Wiedergabe)
=> Naßabtastung + Declicking
und / oder De-Hissing
Anmerkungen:
(a) Auch wenn erklärtermaßen gute Bandkopien vorhanden
sind, ist ein erneutes korrigierendes Abtasten der
Original-Tonträger (Matrizen, Tonfolien, Platten) anzustreben, denn
1. könnten bei der Erst-Abtastung Unachtsamkeiten und/oder technische
Fehler aufgetreten sein, 2. wurden seit etwa 1960 Gerät (Tonarme, Systeme,
Antriebe, Verstärker) und Methoden (Naßabtastung, Ladungsabbau)
entscheidend verbessert.
(b) Beim Abtasten ist zu achten auf:
1. optimale Schonung (=minimalen Verschleiß) des Tonträgers durch
adäquate Auflagekraft
2. sichere Rillenführung des Abnehmersystems (kein Schlingern)
3. Minimierung tangentialer Abtastfehler
4. Ableitung elektrostatischer Ladung an Masse (mittels Zusatz-"Tonarm",
der zugleich die Platte mit einer klaren
(H2O dest.) oder
Reinigungsflüssigkeit (wg. klebriger Rückstände nicht
zu empfehlen!) benetzt. |
1.2. Die mit der HF-Vormagnetisierung (1940)
wesentlich verbesserten Tonbänder (heute: analoge
Offenspulen- und Cassettenbänder) können gestört
sein durch:
-
Grund-Rauschen (infolge lagerbedingter Magnetisierung oder
mangelhaftem Aufnahme-Störabstand)
-
Brummen (Wechselstrom-Einstreuungen infolge mangelhafter Abschirmung
oder Erdung)
-
Modulationsrauschen bzw. (der Modulationskurve
überlagerte) Rauschfahnen
-
Knacken (elektrostatische Aufladungen /
Schaltstörungen schon bei Aufnahme bzw. nur beim Abspielen oder
infolge Schneidens mit aufmagnetisierter Schere)
-
Knistern (elektrostatische Aufladungen beim Abspielen)
-
Poltern / Rumpeln (durch elektrische bzw. mikrofontechnische
Aufnahme-Fehler)
-
Pops (Wind- und Artikulationsgeräusche bei der Aufnahme)
-
Dropouts (kurzzeitige Aussetzer durch Beschichtungsfehler)
-
(meist periodische) Lautstärkeschwankungen (durch
bandführungsbedingte Aufnahme- /Wiedergabefehler oder unbeabsichtigte
Teil-Löschung in starkem Wechselfeld)
-
"Schwimmen" im Hochton-(=Brillanz-)Bereich (durch Azimuth-Fehler
bei der Aufnahme oder Wiedergabe)
-
Die früher ausschließlich mechanisch und/oder mit bescheidenen
elektrischen Filtern bewerkstelligte Schallplatten-Restauration
erfährt heute durch computativ-digitale Verfahren
ganz wesentliche Verbesserungen. Letztere sind unerläßlich, wenn
wir die Originalplatten nicht (mehr) abtasten können und auf mehr oder
weniger gute Tonband-Kopien angewiesen sind.
Unter den digitalen Hilfsmitteln spielt der Click/Pop/Crackle
Eliminator eine informationstechnisch wie hörästhetisch
entscheidende Rolle. Das Programm Cool Edit 1.2a, an dem wir
uns orientieren, bewertet als mechanisch und elektrisch bedingte
Stör-Phänomene neben den sog. Pops (s.o.)
-
Constant Hiss and Crackle (gleichmäßiges
Rauschen und Krachen/Knattern),
-
Hiss + Lots of Clicks (Rauschen und oftmaliges Knacken/Knistern)
Anmerkungen:
-
Sie können das Declicking stark gestörter Aufnahmen vereinfachen
und beschleunigen, indem Sie zuvor
a) die hochfrequenten Impulsanteile ausfiltern (Bandpaß)
und / oder
b) im Zusammenhang mit einer Sprechpausen-Verkürzung möglichst
viele Pausen-Clicks manuell tilgen.
-
Vor jeder Entstörung sind mit "Auto Find All Levels" die Bezugspegel
des Samples zu ermmitteln.
-
Entstören wir nach [1], so werden schon in einem Durchgang praktisch
alle als Clicks identifizierten steilflankigen Impulse getilgt
(xxx fixed, 0 rejected), also auch solche innerhalb der Nutzmodulation,
wodurch dort sehr kurze Dropouts entstehen, die das Signal holprig
und zerrissen klingen lassen. In den allermeisten Fällen empfiehlt
sich [2]; hier werden meist nur störende Pausen-Clicks
getilgt (wir können das auch graphisch an der Veränderung
des Modulationsverlaufs ablesen), andere zurückgewiesen (rejected) und
daher belassen.
-
Wiederholen wir diese Prozedur (= multiples Declicking), so werden
möglicherweise jeweils hunderte oder gar tausende weiterer (kleinerer)
Clicks getilgt, was sich nur geringfügig auswirkt, doch zur weiteren
Beruhigung des Signals beitragen kann. Die Bearbeitung des
Kasseler Beispiels zeigte, daß etwas
rauh modulierte Stimmen dabei "rissig" werden können. In solchen
Fällen sollte nach nur einmaligem Declicking
-
SONIC FOUNDRYs "Noise Reduction 2"
oder
-
WAVES (tm) X-Noise(s. auch unten)
bemüht werden:
** Durch zu scharfe Präsenz- bzw. Brillanzanhebung werden mit SF NR
in der Nutzmodulation liegende Clickstörungen zurückgeholt.
---
-
Allgemein ist ein ausgewogenes Klangbild anzustreben: das von Technikern
wie dem früher sehr bekannten Ing. Fritz KÜHNE
geforderte Idealprodukt 400.000 aus tiefster und höchster Frequenz
(also 40...10.000 Hz, 80...5.000 Hz, 100...4.000 Hz) entspricht dem früher
favorisierten "warmen" (Mittelwellen-)Klang. Wird dieses audiophile
Ideal strikt beachtet, so entstehen in apparativ bzw. akustisch ungünstigen
Fällen möglicherweise überproportional dumpfe bzw.
baßlastige Aufnahmen mit folgenden Nachteilen:
-
die Grund(ton)frequenzen beanspruchen den größten Teil innerhalb
der Amplitudenstatistik und damit auch der nutzbaren Übertragungsenergie
-
"bumsige" Signale neigen zur Übersteuerung
-
Trittschall und andere tieffrequente Störungen (Möbelrücken,
Türenschließen usw.) in unprofessionellen Aufnahmen behindern
mehr als gewöhnlich die Sprachverständlichkeit.
Dumpf klingende Signale können mit einer Kombination verschiedener
Methoden verbessert werden:
-
steilflankiges Abschneiden im Grundtonbereich unter 150 / 180 Hz,
ggf. als Bandpaß-Parameter. Generell darf eine Tiefenabschneidung
nicht so weit gehen, daß das Signal spitz, körperlos und
"künstlich" klingt.
-
Frequenzkorrektur (=Anheben des formantkritischen Bereichs) mit einem
Parametrischen Equalizer oder dem Noise-Reduction-Modul (NR 2.0a)
von Sonic Foundry
-
Dynamik-Kompression oder Hard Limiting, danach ggf. (nochmals)
Bandpaß 180...5500 Hz.
Dadurch erhöhen sich Sprachverständlichkeit und
Störabstand (signal-to-noise ratio), damit die wahrnehmbare
Lautstärke der Sprachinformation. Durch zusätzliche
Dynamik-Kompression oder ein verzerrungsarmes Hard Limiting
ergibt sich ein seit langem in der drahtlosen Nachrichtenübermittlung
(z.B. Überseerundfunk, Amateurfunk) bekannter Effekt: die Sprache wird
schon bei geringer Leistung als lauter, eindringlicher empfunden
als ein unkomprimiertes, "natürliches" Signal mit seinen in der Regel
hohen Amplitudendifferenzen. Positiv betroffen sind hierbei vor allem
druckschwache Laute wie /s/, /f/, /k/, /t/ oder /ch/, die in stark
gestörten und/oder schmalbandigen Aussendungen oft kaum wahrzunehmen
sind, andererseits die Hauptrolle spielen in puncto
Sprachverständlichkeit und Dialektdistinktion. Ein gutes
Beispiel für eine solche methodische Kombinatorik ist die (am 8.3.2003
erstellte) Lautdenkmal-Probe aus Worpswede, wo in
zwei Durchgängen mit einem Bandpaßfilter 12. Ordnung jeweils bei
150 Hz abgeschnitten und das Signal per Hard Limiting und
Dynamik-Kompression nivelliert wurde; zudem wurden überlange
Pausen getilgt und trotz der Filterung und des mehrmaligen
De-Clickings verbliebene Störgeräusche zweimal mit
Wavestm-X-Noise so weit reduziert, daß zuvor mit
einem Harmonic Exciter angehobene Präsenz- und Brillanzanteile
des Spektrums zugunsten der didaktischen Präsentierbarkeit erhalten
blieben.
Wenn zu "scharf" eingestellt, erzeugen Software-Kompressoren (z.B.
Blue Compr. von DigiLogue) eine Art Raumresonanz-Effekt, der
besonders in längeren Hör-Dateien demotivierend wirkt. Wenn
es nicht möglich ist, diesen Effekt rückgängig zu machen (und
statt dessen den klangneutraleren Hard Limiter einzusetzen), ist der
Resonanz-Anteil im Spektrum mittels Notch-Filter zu reduzieren.
-
Für breitbandige, aber beträchtlich gestörte
(Knistern, Knacken, Schaben) Aufnahmen (wie
Fredeburg /Meschede) empfehlen sich folgende (*
ggf. mehrmalige) Maßnahmen:
-
* Bandpaß (Tschebyscheff, 18. Ordnung) ca. 170...6000
-
* Declicking (Option 2)
-
X-Noise und/oder SF Noise Reduction oder
-
De-Noising mit 40 dB (High Hiss Reduction) und hohem
Präzisionsfaktor (20)
-
Dynamik-Kompression oder Hard Limiting (+10 / -2 dB); wenn
optimal eingestellt, ist der HL ist klangneutraler und wirkungsvoller.
Weiteres dazu:
-
multiples Declicking (s.o.) und Höhenabschneidung erst
ab ca. 7 kHz, wenn Bandbreitenerhalt gewünscht
-
Dynamik-Kompression mit
digilogue
BlueCompressor (max.
Soft-Knee-Einstellung)
oder
Sonic
Foundry Track Compressor nur dann, wenn hierbei kein verfremdender
Raumresonanz-Effekt entsteht
-
Bursts: Das periodische Schaben bzw. Kratzen der Fredeburg-Aufnahme
kennen wir von vielen anderen älteren Schallplatten; Ursachen sind partielle
Verunreinigungen (Verklebungen, Schmutzflecken; chemisch entfernbar) oder
Zerstörungen. Genau betrachtet, handelt es sich hier um eine stetig
wiederkehrende definierte Folge ultra-kurzer Nadelimpulse, die zusammen einen
Burst bilden; tritt dieser in Modulationspausen auf, ist er problemlos
zu tilgen, nicht jedoch, wenn er der Nutzmodulation überlagert ist.
Gelänge es, ein Filter zu konstruieren, das den Burst im Echtzeit-Durchgang
oder einem anderen Bearbeitungsmodus (z.B. gegenphasig) auslöscht, so
wäre das ein Durchbruch in der restaurativen Tonbearbeitung.
-
Alternativen zum Declicking :
-
ggf. mehrmaliger Bandpaß (s.o.)
-
Hiss / Noise Reduction auf der Basis eines automatisch ermittelten
Noise Floors
bzw. Noise Profiles. Eine NR mit 40 dB oder mehr filtert nicht
nur die hochfrequenten Störimpulse weg; sie beschneidet auch den
Nutzfrequenzgang sowohl im Grundton- wie vor allem im
Brillanzbereich.
b) extrem steilflankige Bandpaßfilterung (200...3500 Hz) und
/ oder
c) *.ra-Encodierung mit nur 8 (oder gar 6) kBps.
-
Maßnahmen gegen Verzerrungen:
-
präventiv bei steilflankiger Bandpaßfilterung:
"normalisieren" Sie vor einer solchen Maßnahme auf etwa 80 bis
85%
-
korrigierend: gehen Sie in den Modus Noise Reduction / Clip
Restoration und wählen Sie "Lightly Clipped". Wird die betroffene
Passage dabei zu stark abgesenkt, korrigieren Sie sie mit einem den
Durchschnittsmaxima entsprechenden Normalizing.
-
Bandpaßfilterung, Dynamik-Kompression / Hard
Limiting und Normalizing bis ca. 90 % erhöhen zusammen
Lautstärke und damit Verständlichkeit
nebentoniger Lautsequenzen, die (z.B. als Flexionsendungen) meist
dialektale Merkmale enthalten.
-
Stark gestörte und schmalbandige Aufnahmen können
informationell verbessert werden durch:
-
* Bandpaß 180...3000 Hz
-
* Declicking (Option 1)
-
X-Noise (maximal) und / oder Encoding mit 8,5 kbps
Senken Sie generell Zischlaute und Obstruenten nur so weit ab, daß
Sprachverständlichkeit und Dialektdistinktion erhalten
bleiben, auch wenn dies zu Lasten der Hör-Ästhetik geht.
-
Breitbandige, wenig gestörte Einspielungen erfordern nur
geringfügige Filtermaßnahmen (BP 80...8.000 Hz, X-Noise) und
können als 32-kBps-*.ra encodiert werden, sofern nicht angestrebt wird,
wie im Falle von Danzig,
Elbing und Jabel, nach
zusätzlichem Declicking und (höhenanhebender) SF-Noise Reduction
(nachbearbeitend) eine Basis für "pre-emphatische" 16-kbps-Encodierung
zu schaffen.
-
Sichern Sie grundsätzlich alle
Bearbeitungs-Zwischenschritte (*.mp3 / 64 kBps reicht aus).
Protokollieren Sie die jeweiligen Maßnahmen und
Einstellungen.
Links:
-
How
to begin restoring old records (Allen Rény)
-
About
sound restoration (Sound & Vision Engineering Department Technical
University of Gdansk)
-
Audio
preservation and restoration (Univ. Libraries, Univ. of Washington;
Bibliographie)
(c) Dr. W. Näser 8/2k1 ff.
Wird ergänzt. Stand: 11.2.2012 (zuvor: 7.4.2003)