ZWEI MIKRO-FLASHRECORDER FÜR FELDFORSCHUNG UND SPRACHDOKUMENTATION

W. Näser, Marburg, 28.10.2k6 ff.

Den State-of-the-Art einer ebenso ökonomischen wie effektiven WMA-Kompression (-> audio.htm) repräsentieren zwei kürzlich eingeführte, sehr preiswerte Olympus-Kleinstrecorder: der WS-200S und der WS-300M.

Nur 94 x 40 x 15 mm "groß" und (mit eingelegter AAA-Batterie 1,5 Volt LR 03) nur 54 Gramm "schwer" ist der WS-200S; sein interner Speicher von 128 MB ermöglicht maximal 54 Stunden und 50 Minuten Aufnahmezeit. Der fast baugleiche, filigraner wirkende, vermutlich in den Kompressionsalgorithmen überarbeitete WS-300M speichert auf 256 MB bis 68 h 45 Minuten.

Ausgesteuert wird automatisch, wahlweise auch signalgesteuert (definiert empfindliche Aufnahme-Schaltung bei Audio-Input). Eingebaut sind jeweils zwei winzige Elektret-Kondensatormikrofone (ohne Windschutz, daher nicht für Außenaufnahmen geeignet); extern können über 3,5mm-Klinkenbuchsen Kopfhörer und ein Mono-oder Stereomikro (auch ohne Eigenspeisung!) angeschlossen werden. Die Wiedergabe erfolgt (regelbar) entweder über den Phones-Ausgang (max. 0,1 Watt an > 8 Ohm) oder den eingebauten Lautsprecher mit 16 mm Durchmesser.

Alle Samples (Tabelle unten) entstehen an externen Elektret-Mikrofonen; diese erhalten ihre Speisepannung aus dem Recorder. Die zweckdienlich kleinen und relativ mikrofoniearmen ECMs sind in bezug auf Empfindlichkeit, Klangtransparenz und Rauschfreiheit auf Eignung zu prüfen. In den diesbezüglichen Versuchen knüpfe ich an Erfahrungen an, die ich ab 1986/1987 mit Bau und Erprobung von über 50 selektierten ECM-Kleinkapseln (einige davon im Bild links, mit koaxialem Aufsteck-Adapter) für sprachwissenschaftliche Forschung und Live-Tondokumentationen (Konzertmitschnitte) gewinnen konnte.

Da aus ökonomischen Gründen ausschließlich mit mehr oder weniger starker Signal-Kompression gearbeitet wird (WMA), ist entscheidend, ob und wie in den verfügbaren Modi charakteristische Artefakte (verfälschende, unnatürliche Anteile) dem Nutzsignal hinzugefügt werden und durch welche Maßnahmen dieses Phänomen negativ oder positiv beeinflußbar ist.

Mode
300M
Sample
stereo
Sampl
kHz
Rate
kB/s
Faktor
Komp
max. Dauer
Frequenzgang
in Hz
Arte-
fakte
editierbar
(Audition)
ST-HQ     x Interview  2x CE 20/18
14.3.2k7    2x PZM-EB01
25.3.2k7
   2x PZM-EB01
01.4.2k7    2x PZM-EB01
   ja   44   64   22   8 h 45 Min. 100...15.000 - ja
SHQ 30.10.2k6  K 41+19    ja   44   64   22   4 h 20 Min. 100...15.000 (*) ja
HQ 20.2.2007  K 23 + WS     44   32   44   8 h 50 Min. 100...12.000 * ja
HQ     x 23.2.2007  Br-K   44   32   44  17 h 30 Min. 100...12.000 (*) ja
SP 30.10.2k6  K 41
23.2.2007  Br-K
    12   16   88  17 h 25 Min. 100...5.000 ** ja
SP         x 21.2.2007  GK
23.2.2007
 Br-K
  22   16   88  34 h 35 Min. 100...5.000 ** ja
LP 21.2.2007  CE20TC14
23.2.2007  CE2851
      8     5 250 54 h 50 Min. 100...2.000 **** ja
LP     x 23.2.2007  CE20TC14
23.2.2007
 CE28/51
      8     8 196 68 h 45 Min.  100...3.000 *** ja

2-kanalige Signalverarbeitung erlauben beide Geräte nur bei S(T)HQ (Kompressionsfaktor 22; mono = Kanal L). Mit Artefakten ist hier nicht oder nur ganz leicht bei extrem breitbandigen Meßaufnahmen zu rechnen, in den übrigen Modi stellen sich wenige (HQ) bis starke Verfremdungen (LP) ein.

Das stereophone Sample SHQ spricht Uta Näser (30.10.2k6) in von mir 1987 gebaute, auch zu Live-Konzertaufnahmen benutzte, auf eine EB-Kompakttraverse (Abb. hier und unten) gesteckte ECM-Kapseln (41 und 19); im SHQ-Mode verwandte ich das WS-200S mit Kapsel 41 für zwei dialektologische "Feld"-Aufnahmen: den Wenker-Satz 16 aus den mittelhessischen Orten Gilserberg und Ebsdorfergrund.

HQ entstand mit beiden Geräten an der ebenfalls 1987 gebauten, mit Windschutz bestückten Kapsel 23; erstaunlich gut klingt das am 23.2.2k7 mit einer selektierten EB-Breitbandkapsel erstellte Sample.

Die im SP-Mode erstellten Samples bieten trotz Kompressionsfaktor 88 erstaunlich gute Sprachqualität, sofern mit leicht höhenanhebendem Mikro (z.B. Eigenbau-K 41) eine Art Pre-Emphasis geschaffen wird. Durch die höhere Samplingfrequenz (22 kHz) produziert das WS-300M deutlich weniger Artefakte als sein mit nur 12 kHz arbeitender Vorgänger; hierzu das das mit einer linear abbildenden Eigenbaukapsel erstellte Sample mit - trotz nur 5 kHz Bandbreite - einer an konventionellen UKW-Rundfunk erinnernden Qualität. Die mit Außengeräuschen (Lärm der nahen Stadtautobahn) "unterlagerte" Aufnahme zeigt so gut wie keine Artefakte, während die mit der brillanzbetonten Kapsel erstellte, leicht rauh modulierte Aufnahme beim mehrmaligen Vergleichshören deutliche Verfremdungen erkennen läßt.

LP eignet sich wegen der starken Klangeinbußen nur für informatorische Langzeitüberwachung. Zur Reduktion der Zischlaute und zur Ökonomisierung der Amplitudenstatistik eignet sich optimal ein dem Aufnahme-Frequenzgang entsprechendes, die Grundton- und Brillanzfrequenzen kappendes "Bandpaß"-Mikrofon, wie es im Telefonverkehr eingesetzt wird. Ich verwende am WS-300M und vergleichsweise am WS-200S einen 1987 gebauten, 27,5 * 9 mm "großen" Mikrofonkopf mit 3 mm Einspracheöffnung, in den eine AKG-Back-Electret-Kapsel CE 20 TC 14 eingepaßt ist (Frequenzgang 300...3.400 Hz). Der ebenfalls in eine EB-Kapsel (2/2k7) integrierte AKG-Nahbesprechungswandler CE28/51 mit "schlankerer" Charakteristik (Einsprache <1 mm!) läßt in den ohne Windschutz erstellten Samples das Signal etwas brillanter erscheinen, was vor allem den Hauch- und Zischlauten zugutekommt.

Mein Foto 1 oben zeigt das aufnahmebereite WS-200S mit adaptiertem ECM-Kopf (vom Vivanco EM 30, mit Schaumstoff-Windschutz), Bild 2 nach Abziehen der Batterie-Einheit als externes Laufwerk: per USB 2.0 (full speed) lassen sich die intern gespeicherten *.wma im PC mit geeignetem Player (z.B. Winamp) direkt abspielen oder mit einem WMA-fähigen Editor (z.B. Audition 2.0) und entsprechenden Codecs bearbeiten.

Bild 3 zeigt das (mit Schutzverklebung versehene) WS-300M .

Im (ebenfalls mit nur 64 kB/s arbeitenden, möglicherweise weiter verbesserten) STHQ-Modus überrascht es durch Breitbandigkeit und Klangtreue. Das Sample Interview entstand am 19.2.2007 an einem (1987 konzipierten, selbstgebauten) Stereo-Mikrofonsystem (Bild 4); dessen schwenkbare Zwillings-Aufnahmen (für Cinch-Verbindungen) sind hier bestückt mit 1987 selbstgebauten Miniatur-Köpfen, die jeweils eine von AKG für professionelle Anwendungen entwickelte Back-Electret-Kapsel CE 20/18 enthalten (Frequenzumfang 20...20.000 Hz).

Ein zweites STHQ-Sample entstand am 14.3.2k7 mittels zweier selbstgebauter, mit je einer Low-Cost-ECM-Kapsel bestückter Grenzflächen-Mikrofone (Bild rechts); in einer Distanz von ca. 80 cm auf dem Balkonboden eines Hotels an der Nordsee zeichneten sie um 7:20 Uhr morgens Vogelstimmen auf. Die Klarheit und Differenzierbarkeit der Signale lassen diese Technik auch für die wissenschaftliche Ornithologie interessant werden.

Das dritte STHQ-Sample erstellte ich im "Diktat"-Modus (d.h. mit geringer Mikrofonempfindlichkeit) am 25.3.2k7 in der katholischen Pfarrkirche St. Peter und Paul Marburg. Die Grenzflächen lagen jeweils ca.1 m rechts und links vom Dirigenten, als der etwa 4 m entfernte Marburger Bachchor ein A-capella-Stück probte. Bei diesem extrem schwierigen Programm-Material zeigen sich - in Gestalt leichter "Rauschfahnen" - die Grenzen des 64kBps-Algorithmus.

In ca. 40 cm Distanz auf einem Tisch liegend und schräg von oben besprochen, eignen sich (im "Konferenz"-Modus) am WS-300M diese prinzipiell um 6 dB empfindlicheren Mikrofone sehr gut für sprach- und sozialwissenschaftliche Interviews, auch weil der für die Interaktion so wichtige Blick-Kontakt zum Informanten nicht durch einen Mikrofon-Aufbau beeinträchtigt wird (zu weiteren Erfahrungen siehe auch hier). Wie das vierte, am 1.4.2k7 entstandene, mit Waves-X-Noise bereinigte Sample (Lesung: Uta Näser) beweist, eignet sich in dieser Konstellation das WS-300M auch sehr gut zur Aufnahme von Hörbüchern.

Bei nahezu identischen Abmessungen bietet der etwas filigraner wirkende Recorder 256 MB internen Speicher und ebenfalls 3 weitere Aufnahme-Modi (dazu die mit Eigenbau-Kapsel 23 + Windschutz am 20.2.2k7 aufgenommenen Samples). Im Unterschied zum WS-200M arbeitet LP mit 8 kB/s (K=196) und speichert damit Tonfrequenzen bis ca. 3 kHz, somit wichtige laut- und bedeutungsunterscheidende Formanten; auch entstehen deutlich weniger Artefakte, was professionelle Langzeit-Dokumentation (z.B. im Rahmen einer Objekt-Überwachung) ermöglicht.

Neu im Display ist eine winzige Pegelanzeige (1 Balken = Mono, 2 = Stereo), mit deren Hilfe bei VCVA (variable control voice actuating) der Start-Stopp-Pegel zum Auslösen der Aufnahme eingestellt werden kann. Dieses nützliche Feature hätte auch dazu genutzt werden können, wie in manchen MD-Recordern während der Aufnahme mit << und >> den Eingangspegel (und damit die in puncto Verzerrungs- und Rauschfreiheit so wichtige Empfindlichkeit der Mikrofonstufe) nachzustellen. Eine manuelle Aussteuerung fehlt jedoch.

Zusammenfassend ist festzustellen, daß es gelungen ist, für nur rund 100 bzw. 140 Euro zwei komplette Stereo-Digitalrecorder anzubieten und darin auf engstem Platz neben der Software (*.wav >< *.wma in 4 Kompressionsraten) nicht nur zwei Mikrofone, eine in der Empfindlichkeit schaltbare 2-kanalige Mikrofonvorstufe, einen A/D- und D/A-Wandler, einen Kopfhörerausgang, eine Digitaluhr, ein Zählwerk, einen Flash-Speicher, ein Batteriefach und ein schnelles USB-Dateninterface unterzubringen. Es steht außer Frage, daß mit diesen Geräten die empirische Sprach- und Sozialforschung neue Anreize bekommen wird.

Wird ergänzt. (c) W. Näser, Marburg, 10.2k6 ff. - Stand: 2.4.2k7