Anhang 1 zu: Schöne (?),
teure DOS-Welt
oder: der Kampf um Bits und Bytes
10.9.1988
DIE INSTALLATION EINES ZUSÄTZLICHEN
3,5-ZOLL-LAUFWERKES
(c) W. Näser
Ein mit bereits zwei Diskettenlaufwerken und einer Festplatte ausgerüsteter PC/XT soll mit einem zusätzlichen 3,5-Zoll-Laufwerk bestückt werden, damit auch im 720 kB-Format Disketten- und Informationsaustausch möglich wird. Oberhalb der rechts unten montierten Festplatte befindet sich noch genug Einbauplatz für ein normgerechtes 5,25"-Laufwerk. Zunächst wird die frontseitige Abdeckung, ein schwarzes Plastik-Rechteck, entfernt. Das 3,5"-TEAC-Laufwerk wird von vorn eingeschoben und rechts am Einbaurahmen mit zwei Schrauben M3 u. Unterlegscheiben befestigt. Dann werden vom Laufwerk A> die beiden Stecker abgezogen; es handelt sich hier um den 4-poligen Stromversorgungs-Stecker mit dickeren Kabeln und eine 34-polige Flach-Steckverbindung, wobei auf seitenrichtiges Einstecken zu achten ist. Der vielpolige Flachkabelanschluß geht vom Controller zum Laufwerk B>, zweigt hier ab zum Laufwerk A>; die Anschlüsse 10 bis 18 sind spiegelbildlich verdreht in den Stecker geführt, damit Drive/Motor Select A die richtigen Kontakte an A> erreichen. Laufwerk A> wird durch Abziehen der beiden Steckverbindungen zunächst "totgelegt" und soll später reaktiviert werden.
Nach dem Einbau und Anschluß des 3,5"-Alternativlaufwerkes A> muß dieses als 720-kB-Laufwerk in der CONFIG.SYS festgeschrieben werden. Dies geschieht (bei DOS 3.3) mit der Zusatz-Zeile
device=c:\dos\driver.sys/d:0/f:2/c ,
wobei "d" das neu anzusprechende logische Laufwerk D> bedeutet, die Zahl 0 steht für "Diskettenlaufwerk 1" (damit wird D> als alternativ zu A> angesprochen); "f" bedeutet "Laufwerkstyp nach Speicherkapazität", der folgende Parameter "2" steht für ein 3,5"-Diskettenlaufwerk mit 720 kB Kapazität. "/c" steht für einen Laufwerkstyp mit Verriegelungstaste. Die somit erweiterte CONFIG.SYS wird als "+r" attribuiert und der PC per Warmstart probegebootet. Auf dem Bildschirm erscheint die Zusatz-Zeile "externer Treiber für Laufwerk D> geladen". Sodann wird eine 3,5"-Diskette eingeschoben und, nach dem Systemprompt, D> angewählt. "Bitte eine Diskette in Laufwerk D> einlegen und eine Taste betätigen". Danach kann FORMAT D: eingegeben werden, der PC reagiert wie vorher beim Formatieren der 360-kB-Laufwerke A> und B>, außer daß er 80 Spuren anlegt und die 730-kB-Meldung ausgibt; die Diskette ist somit für 730 kB formatiert. Sie kann entsprechend beschrieben und gelesen werden. Wird das 3,5"-Laufwerk mit A> angesprochen, so wird es, trotz der veränderten CONFIG.SYS, wie ein 360-kB-Laufwerk behandelt und formatiert. Dennoch kann eine mit 730 KB (ggf. auf anderem PC/XT formatierte und) beschriebene Diskette in dieser Betriebsart gelesen und sogar beschrieben werden, jedoch speichert ein auf dem mit A> angesprochenen Laufwerk arbeitendes WORD 4.0 (das zum Aufbau sehr lange Zeit benötigt) einen erstellten Text automatisch auf dem Laufwerk B> ab, überhaupt wird ständig zwischen A> und B> hin- und hergeschaltet. Es ist also ganz wichtig, das 3,5"-Laufwerk, soll es im 730-kB-Format betrieben werden, als logisches Laufwerk mit D> anzusprechen. Nur so arbeitet es autonom, ohne daß (wie vor) B> alternierend hinzugezogen wird.
Vorgesehen ist ein alternativer Gebrauch der unter A> "firmierenden" 5,25"- und 3,5"-Laufwerke mittels Umschaltung von Drive Select A/B und Motor Enable A/B. Der Laufwerkscontroller kann außer der Festplatte nur zwei Disketten-Drives steuern es sind nur je weils zwei Select-Leitungen (s.o.) vorhanden; ein Parallelbetrieb von a>(alt) und a>(neu) ist unmöglich wegen der gleichzeitigen Ansprache der Schreib-/Leseköpfe in beiden Drives (der "leerlaufende" würde "Schrott" in den Datenbus hineinlesen). Das Brummen bzw. Sägen in den Diskettenlaufwerken während der Abtastvorgänge ist (nach Ansicht von Fachleuten) auf die Steppermotoren zurückzuführen, nicht auf schlechte Siebung der Gleichstromversorgung; allerdings arbeitet das 5,25"-Laufwerk in den Siemens-PCD-2 sehr leise. Das 3.5"-Teac-Laufwerk "sägt" im IBM-kompatiblen PC/XT ebenso wie sein Pendant im IBM PS/2 Mod. 50.
8.9.88am Laufwerk A>(alt) und Laufwerk D>(3.5") sind inzwischen umschaltbar. Das 34pol. Flachkabel zwischen Controller und Laufwerken wurde vor Laufwerk B> aufgetrennt und hier eine VERO-Platine eingesetzt; alle Erdanschlsse (1...33) wurden unten auf gemeinsamer (quer verlaufender) Masseschiene verlötet, die Steuerleitungen auf der Oberseite; sodann wurden Leitungen (12) und (16) zwischen erstem (nachträglich angeklemmt) und zweitem Laufwerksstecker (B>) aufgetrennt und an dem zu B> führenden Ende mit (12) und (16) an die Controller-Seite gelötet. Die Controller-Leitungen (10) und (14) wurden nun jeweils umschaltbar gemacht, zum einen von (10) an (10) und (16), zum anderen von (14) an (14) und (12). Es handelt sich hier um MOTOR ENABLE A/D und DRIVE SELECT A/D. Diese Steueranschlüsse belegen auf den Laufwerken A> und D> jeweils die Pins 16 und 12, an A> mit 100 kOhm und an D> mit etwa 100 Ohm gemessenem Innenwiderstand. Die überkreuzte Leitungsführung von (10...16) zwischen B> und A> (s.o.) war hierbei zu berücksichtigen. Als Umschalter dient eine 2-Ebenen-Ausführung in Miniaturbauweise von EBC, Verbindung von hier zur Zwischen-Platine ist ein (vom 34-poligen abgetrenntes) 6-adriges Computer-Flachkabel. Der Schalter sitzt links seitlich in der Mitte zwischen den Laufwerken A> und B>.
14./22.9.1988
DAS ERSTELLEN KOMPRIMIERTER
"UNFORMAT"-TEXTE
(o) Wolfgang Näser (Marburg)
Solche Texte können mit Hilfe eines Word -Prozessors erstellt werden; es sind nur einige kleine Regeln zu beachten. Zunächst muß darauf geachtet werden, daß keinerlei WORD- o.ä. Formatierung in die Texterstellung eingeht; dieser muß auch bei unformatiert erfolgender Kopie (s.WORD-Handbuch) noch dasselbe Aussehen haben wie innerhalb des WORD-Schreibfeldes.Blocksatz ist durchaus auch ohne die WORD-Option herzustellen: der CURSOR in einer freien Stelle oder am Wortanfang schiebt den nachfolgenden Block nach rechts, während in Blanks vorgenommenes DELETE rechtsseitige Ausreißer korrigierend einzieht. Man muß hierbei natürlich besser aufpassen als beim fortlaufenden Schreiben in der WORD-"Maske"; dennoch gelingt es, bei einiger Übung, einen solchen blocksatzformatierten Hand-Text auf das Papier bzw.die Festplatte zu bekommen; manchmal, so auch hier, muß allerdings ein Zwischenraum (Blank) geopfert werden. Der VORTEIL solcher "Unformat"-Texte besteht im geringeren Speicherbedarf. Bei einem mit WORD (4.0) erstellten Text von 132 kB entfallen beispielsweise 12 kB allein auf die WORD-Formatierung,das sind etwa 9%. Diese 12 kB belegen 6 Speicherblöcke auf der Festplatte. Besonders bei Kurz-Texten von rund 2 kB rentiert sich dieses Verfahren, weil durch die Formatierung sich der Speicherbedarf verdoppeln würde. Unformatiert erstellte Texte lassen sich genauso problemlos ausdrucken wie COPY-CON-Dateien; danach stoppt der Walzentransport des NEC P-6), anstatt, wie nach "WORD"-Ausdrucken, bis zum Seiten-Ende (Perforation) durchzulaufen. Dies ist besonders vorteilhaft beim Drucken von ADRESSEN und LABELS. Diese können, durch Wiederholen des DOS-Befehls, fortlaufend hintereinander gedruckt und daher unnötiger Papierverschleiß vermieden werden.
(Nur) unformatiert gesetzte Texte lassen sich mit COPY *.TXT xxxxx.TXT zu einer Sammel-Textdatei verschmelzen; je nach Länge (bzw. Cluster-Zuordnung) wird dabei u.U. Speicherplatz gewonnen. Die Einzeltexte werden durch Zwischenraum voneinander abgetrennt, was das SCROLLING erleichtert.
In Diskettenlaufwerken wird nach Blöcken von 1024 Bytes eingeteilt. Kurztexte von ca. 1 kByte benötigen hier einen solchen Speicherblock, daher können auf 362 kBytes Speicherplatz insgesamt fast 360 Kurztexte (z.B. Labels) zu 1 kB untergebracht werden; dieselben 360 Kurztexte benötigen auf einer FESTPLATTE jedoch 734,400 kBytes, also den doppelten Speicherumfang, weil in diesem Falle jeder Einzel-Datei 2,048 kB zugewiesen werden. Deshalb sollte man auch darüber nachdenken, ob es sich lohnt, allzuviele Kurzdateien wie z.B.wenig benötigte Batch-Files auf einer Festplatte zu speichern oder ob es nicht besser wäre, sie auf einer Diskette abzulegen: das gilt natürlich noch eher für KURZBRIEFE, (Arbeits)NOTIZEN oder per Textverarbeitung erstellte PROGRAMME.
Bereits (z.B. mit WORD 4.0) formatierte Texte können in eine unformatierte Version umkopiert werden; beim Ausdruck auf DOS-Ebene erscheint der ganze Text als gleichmäßiger Blocksatz mit unsystematischen Wort-Trennungen, während ein erneutes Hineinladen in und Drucken durch die Textverarbeitung einen leserlichen Flatter-Satz mit ordentlichen Wort-Trennungen ergibt (sofern mit Trennhilfe formatiert wurde). Auch unformatierte, möglicherweise "eng" gesetzte Texte lassen sich mit dem PKARC-Utility bis auf etwa 50% komprimieren; solchermaßen "gepackt" läßt sich etwa eine Dissertation mittlerer Größe (d.h.200 Seiten Engdruck) auf einer einzigen 5,25-Zoll-Diskette im 362-kB-IBM-Format unterbringen, somit passen nicht weniger als vier solcher Dissertationen auf eine 3,5-Zoll-Dis-kette im 1,4-Megabyte-AT-Format.
17./19.9.1988
KOMPRIMIERENDES BACKUP MIT DEM
PKARC-UTILITY
Das Utility PKARC.COM ist in der Lage, Dateien beliebiger Länge und Anzahl zu einer sog. "Archivdatei" zusammenzupacken. Es muß hierzu der Befehl PKARC/A [Laufwerk] [Filename.ARC] eingegeben werden. Hierdurch werden alle in einem Directory vorhandenen Files erfaßt und zu einer Archiv-File zusammengefaßt.
Soll diese ARC-File auf einem Ziel-Laufwerk erstellt werden, so ist dieses
in den Befehl einzubeziehen.
[1] Angenommen, das Anwendungsprogramm WORD 4.0 soll komprimiert
auf das Laufwerk D>(730 kB) übertragen werden:
pkarc a d:\word-ge[.arc] <RETURN>
[2] Aus einem sehr umfangreichen Sub-Directory,
z.B.VENTURA[-PUBLISHER], sollen bes. spezifizierte
Dateien zu einer ARCHIV-Datei auf ein Ziel-Laufwerk a>
komprimiert werden:
pkarc a a:sys *.sys
Es kann also auch mit WILDCARDs gearbeitet werden. Im letzten Falle wird in a> eine Archiv-File SYS.ARC angelegt aus allen in P:\VENTURA vorhandenen individuellen *.SYS-Dateien. Besonders kürzere Files, vor allem aber BATCH-Dateien, können so in erstaunlich kleine Archiv-Files verwandelt werden; Batch-Files beanspruchen so nur die von der Bytes-Belegung tatsächlich angezeigte Länge,z.B. 20 *.BAT-Files = 3.071 Bytes [statt den auf der Festplatte beanspruchten 41.960 kB infolge der Zuweisung von einem Block à 2048 Bytes pro Datei]. Unformatierte Texte können auf ca. 50 % komprimiert werden, Befehlsdateien (*.COM, *.EXE) auf bis zu 35 %,Druckertreiber wie z.B. TTY.DBS bis ca. 90 % (!). "LIB"-Dateien wie SPELL-GE.LEX liegen meist bei 7-9 %, Batch-Files werden bei 0 % Kompression anreihend übernommen("stored"). Je nach Packungsdichte und -art unterscheidet man PACKING, SQUEEZING, CRUNCHING und SQUASHING; Art und Prozentsatz der Kompression werden bei der Prozedur auf dem Bildschirm protokolliert und können durch <CTRL PRINT> per Drucker festgehalten werden, vor allem wenn man auf diese Weise ein "Inhaltsverzeichnis" der *.ARC-File gewinnen möchte. Am 16./17.9.88 wurde eine mit ca. 11 MByte belegte Festplatte durch Packing/Unpacking einem Sicherungs-Backup und neuordnenden Restore unterzogen; als Datenträger fungierten mit 730 kB formatierte 3,5-Zoll-Disketten "Professional" (hergestellt von der BASF, Preis 3,95 DM/Stck.).Beim RESTORE (unpack d:\*.*) gab es nur einen Lesefehler: ausgerechnet beim Programm NU.EXE der Norton Utilities, doch existierten zum Glück davon noch 2 unkomprimierte Kopien. Auch das umfassende Subdirectory mit allen DOS-Befehlen und BIN-Programmen sowie die BETRIEBSSYSTEM-Files (IBMBIO/DOS.COM etc.) wurden komprimierend übertragen, letztere natürlich ohne "Attribute" (sonst kann sie das PKARC-Programm nicht finden).
In der Datei PK36.EXE sind alle relevanten Dienstprogramme des Pack-/Unpack-Systems enthalten.Zu PKARC und PKXARC gibt es etwas kürzere, eingeschränktere Versionen namens PK(X)ARCJR. Das zum "Auspacken"bestens geeignete Utility UNPACK.COM stammt eigentlich aus dem Programm TURBO PASCAL und dient dort zur Aufdröselung der Datei GREXAMPL.ARC. Mit gleicher Wirkung arbeiten PKXARC.COM und PKXARCJR.COM. Im ganzen darf die Rolle der von PKWARE angebotenen Hilfsmittel nicht unterschätzt werden; ein PC/XT/AT, gleich welchen Umfangs, kann all seine Möglichkeiten nur dann voll entfalten, werden die Datei-VERWALTUNG und File-ORDNUNG optimal betrieben.
24.9.1988
COMPRESS, SPEED
DISK UND VOPT
(c) Dr. Wolfgang Näser, Marburg /L.
Die Geschwindigkeit des Festplatten-Zugriffs läßt sich steigern mit speziellen Optimierungs-Programmen, die als "Tools" oder "Utilities" angeboten werden. Die bekanntesten sind
1. COMPRESS (im Paket der PC-TOOLS, Foto
rechts),
2. SPEED DISK (im Paket der Norton
Utilities),
3. VOPT (im Programm der V-Features von Golden Bow).
Alle drei erheben den Anspruch, auf der Festplatte unzusammenhängend, vor allem aber "fragmentiert" verstreute Dateien zu vereinigen und die Platte so aufzuräumen,daß Lücken fortfallen und der Daten-Zugriff beschleunigt wird; dies ist besonders wichtig bei Festplattenlaufwerken in älteren PC/XTs. Glaubt man der Literatur [1], so arbeitet Nortons SPEED DISK am zuverlässigsten und gründlichsten.Tatsächlich trifft dies nur zu für die entsetzliche, nervtötende Langsamkeit von SD; überprüft man dessen Ergebnis mittels VOPT oder COMPRESS(Option 1), so zeigen sich verbliebene "fragmented areas", die es ja gerade zu beseitigen galt. COMPRESS arbeitet deutlich schneller und gründlicher, außerdem wird jeder Lese- und (Neu-)Schreibvorgang am Bildschirm dokumentiert, so daß man die Dateien-Umorganisation genauestens verfolgen und überprüfen kann; außerdem bietet COMPRESS drei Optionen: a) unfragment only, b) full compression und und c) full compression + clearing free clusters;das Zusatzprogramm MIRROR erstellt anschließend eine Sicherungs-Datei zur Festplatten-Neuorganisation, anhand derer im Falle unabsichtlicher Löschungen alle verlorenen Files zu regenerieren sind. Das COMPRESS-Utility enthält zudem einige Prüfoptionen, die sehr nützlich sind. VOPT von Golden Bow arbeitet am schnellsten, allerdings nur auf PC-ATs mit schnellen Prozessoren und Festplatten; ältere XTs kommen mit VOPT nicht so gut zurecht, hier scheint es etwas "widerwillig" abzulaufen,allerdings werden auch hier die "fragmented areas" sämtlich beseitigt,was mit VMAP bzw. COMPRESS zu verifizieren ist. VOPT entspricht der Option 5,1 in COMPRESS: es erfolgt also keine "full compression".VOPT bietet ebenso wie VMAP die Zusatz-Anzeigefunktion "mixed areas" durch farbliche Hervorhebung der betroffenen Cluster-Rechtecke.
Fazit: VOPT ist gut für den schnellen Platten-Putz zwischendurch,
COMPRESS optimal für die gründliche Plattenreinigung;
SPEED DISK ist sowohl auf XTs wie ATs zu langsam
in Arbeit + Ergebnis, mithin überflüssig; ein Beweis mehr dafür,
daß die in bestimmten Programm-Paketen (wie Norton-Utilities) angebotenen
Tools nicht alle gleichermaßen effektiv und nützlich sind.
COMPRESS, VOPT, MIRROR und das schnelle
Monitor-Utility VMAP sollten auf C:\UTILS abgelegt
und von hier aus über PATH=C:\UTILS direkt abrufbar
gemacht werden. Eine Geschwindigkeits´-Kontrolle "danach" bietet X-Tree,vor
allem Version 1.02, deren Datei-Zählvorgang - auch auf ATs - recht langsam
abläuft und durch komprimierendes Disk-Management beschleunigt wird.
---------------
[1] SCHMIDT, Uwe: Daten retten mit NORTON
UTILITIES, 2., üb. u. erw. Aufl.Haar b.München 1987,
S.169; 224-228. Die angegebenen "knapp zehn Minuten" für das Aufräumen
einer zu 50 % belegten 30-MB-Platte erscheinen mir stark untertrieben. Stand:
18.9.2k5
24.9.1988
NEUERES DOS OHNE
FESTPLATTENLÖSCHUNG *)
(c) Wolfgang Näser, Marburg
Auch auf einer nicht gelöschten, mit ca. 60% durch Anwendungsprogramme
belegten FESTPLATTE kann ein älteres DOS durch eine
spätere, umfangreichere Version ersetzt werden, so z.B. DOS 3.1 durch
DOS 3.21 (20.8.88) und DOS 3.21 durch DOS 3.30 (26.8.88). Zweck einer solchen
Operation ist, das aufwendige BACKUP / RESTORE der
immerhin 12 (bzw. 14) MB Plattenbelegung, die
Festplatten-NEUFORMATIERUNG und andere in den Handbüchern
vorgeschriebene Arbeitsschritte zu umgehen. Hier das nötige Vorgehen:
Eine derartige Operation birgt in jedem Falle gewisse RISIKEN, da die BOOT AREA (der aktive Bereich) eines älteren DOS-Systems um mehrere Cluster ( 2048 kB) kleiner ist [2]. Nur mit Hilfe von COMPRESS, VOPT und XTREE läßt sich eine vorübergehend des Betriebssystems beraubte Festplatte umstrukturieren (neueditieren). Vorher sind alle benötigten Hilfsmittel (Utilities) auf eine bootfähige Diskette zu übertragen. Das neu zu installierende DOS sollte im zweiten Diskettenlaufwerk vollständig bereitliegen. Es sind nicht unbedingt zwei Diskettenlaufwerke nötig (s. oben 2). Beim Einkopieren in eine zu kurze Boot Area wird die zweite System-BASISDATEI IBMDOS.COM fragmentiert; sie kann nur dann "defragmentiert" werden, wenn die File-Attribute [a,h,r,s] außer Funktion sind. Nach dieser Kompression muß ein autonomer Festplatten-Probestart erfolgen; ist er erfolgreich, kann daraufhin das UPDATING der DOS-Befehle (im Subdirectory DOS oder BIN) erfolgen; zuvor sind auch hier alle FILE-Attribute auf MINUS zu setzen; danach wird, ebenfalls mit XTREE, jede Einzeldatei durch ihre Nachfolgerin überschrieben. Klappt ein auszugweiser Probelauf der neuen DOS-Befehle (z.B. FORMAT, CHKDSK), so ist nun die Festplatte mit einem 2. COMPRESS-Durchlauf (Option "F" oder "C") endgültig zu ordnen [Kontrolle mit VMAP]; nach dem Updating ist das neue C:\DOS- mittels "attrib +r *.*" zu si-chern.
Nachträge zu verschiedenen DOS-Versionen
--------------------
*) ohne komplette Systemlöschung und Sys-Befehl
[1] Das hier beschriebene Updating ist ein wenig gewagt, da zwischendurch
die Festplatte ihre Autonomie verliert. Im Falle von weitergehenden
Komplikationen ist daher mindestens eine bootfähige Diskette mit allen
DOS-System- und Befehlsdateien bereitzuhalten, und auch die durch
Übertragen des alten DOS von C> auf A> entstehende, auf jeden
Fall aufzubewahrende Diskette sollte den PC booten können. Das Kopieren
per XTREE in der Folge
IBMBIO.COM -> IBMDOS.COM ersetzt
den Befehl SYS A:, falls sich dieser aus irgendeinem
Grunde nicht in C:\DOS befindet.
[2] Die Belegung des Boot-Bereichs kann überprüft werden mit dem
Norton-Utilities-Hauptprogramm NU.EXE, "Disc &
Special Functions", Option "Map"; -> Data-Becker-Führer PCTOOLS,
Düsseldorf 1988, 75-79
[3] Hierzu Handbuch zum NEC P 6, Kapitel 9, S. 9-1 ff.;
OCKENFELDS, Das große PC-Drucker-Buch, Düsseldorf
1988, bes. S.90-136. Das auf der Begleit-Diskette vorhandene Utility
DRUCKER.EXE sollte in C:\DOS eingebunden und
über PATH=C:\DOS von überall her aufrufbar
sein.
28.9.1988
AUTOMATISCHES
GENERIEREN VON
WORTHÄUFIGKEITSLISTEN
(o) Wolfgang Näser (Marburg)
Mit dem Utility WORDFREQ.COM [z.Zt. in C:\UTILS] kann ein mit WORD-Formatierung versehener [nur ein solchermaßen bearbeiteter!] Text auf folgende Kriterien hin untersucht werden:
Alle diese Arbeitsschritte werden automatisch durchgeführt, sobald der
Befehl
WORDFREQ <Dateiname>
eingegeben wird. Das Programm, das für MS-WORD 2.1 konzipiert wurde,
liest nur Texte ein, die sich auf einem DISKETTENLAUFWERK
befinden, also "außerhalb" der z.B. in
C:\TEXT\WORD4 eingebundenen Textverarbeitung.
WORDFREQ.COM sollte auch von diesem Laufwerk aus per
PATH-Befehl (->
AUTOEXEC.BAT) aus C:\DOS oder C:\UTILS aufgerufen werden
können. Dasselbe gilt für das einfache, nur die Wörter eines
Textes zählende Utility WC.COM, das ebenfalls
[auf dem unter DOS 2.11 laufenden Siemens-PCD] im Subdirectory
C:\ANW\WORD zu finden war.
WORDFREQ.COM zählt als Wörter alle
zusammenhängend vorgefundenen Lautkombinationen, also auch abgetrennte
Silben; deshalb sollten nur ohne Trennhilfe per Block- oder Flattersatz
aufbereitete Texte mit WORDFREQ analysiert werden;
das Resultat ist dann eine automatisch generierte, absteigend nach
Worthäufigkeiten geordnete Liste aller im Text vorkommenden Lexeme;
der Analysevorgang erforderte für einen 45-kB-Text nur ca. 3 Minuten:
eine große Hilfe für die wissenschaftl. Sprachstatistik.
Wie schon gesagt, werden "COPY-CON"-Texte, also ohne Hilfe von "WORD" bzw. mit WORD unformatiert erstellte Textdateien, von WORDFREQ "abgelehnt": "can`t read ...file". Dem kann folgendermaßen abgeholfen werden:
Sicherheitshalber sollte man den so "bearbeiteten" Text auch im WORD-Subdirectory abspeichern. Er wird nun problemlos von WORDFREQ eingelesen und in der geschilderten Weise analysiert.
29.12.1988
Der Word-Prozessor von PC-TOOLs de Luxe als
Editor
VORBEMERKUNG: "WP" ist nur in der Version 4
("de Luxe") verfügbar. Speicherung der mit WP erarbeiteten Textfiles
automatisch im TOOLS-Directory, wenn keine andere Provenienz oder Vereinbarung!
Ich habe - gestern - mittels einer Reihe von Versuchen [Aufn.Label-Erstellung] herausgefunden, wie man mit WORD 4.0 erarbeitete Textdateien durch "PCT" von den überflüssigen STEUERZEICHEN befreit. Diese Steuerzeichen können nämlich ein PCT-Programm zum Absturz bringen, wenn man etwa Zwischenzeilen einfügen will und in eine Schreibzone hineingerät, die bereits von irgendwelcher WORD-Formatierung erfaßt, in diese einbezogen ist. Dann gerät das Ganze plötzlich "aus den Fugen", die Befehlszeile füllt sich mit Steuerzeichen und fängt an zu blinken; da hilft dann nur noch ein NEUBOOTEN. Man muß mit PCT die Steuerzeichen löschen, indem man den Cursor auf den Zeilenanfang zurücksetzt und dann mit DELETE die Zeile von hinten nach vorn "einzieht": das ist der einzig gefahrlose Weg. "Von rückwärts" per BACKSPACE zu löschen hat wenig Sinn; hierdurch kann das Ganze abstürzen, und alle bis dahin gemachten Änderungen werden hinfällig! - Das ERSETZEN von Buchstaben in PCT geht nur per DELETE und dann EINFÜGEN; einen ÜBERSCHREIB-Modus wie in WORD gibt es nicht; die CAPSLOCK-Funktion wird unterhalb der INSERT-Meldung angezeigt. Die Schreibbreite von PCT ist wesentlich extensiver als bei WORD; unter Ausnutzung der vollen ZEILENBREITE erstellte PCT-Texte lassen sich nur mit FONT 1 per NEC P 6 ausdrucken. END und HOME funktionieren genau wie bei WORD. Zusätzlich gibt es die TABULATOR-Funktion. Mit <F 10> werden alle ENDE-MARKEN sichtbar. Diese sollten am Ende jeder Zeile durch <RETURN> gesetzt werden, sofern man beabsichtigt, diesen TEXT nicht etwa [per WORD 4.0] weiterzubearbeiten, sondern auf DOS-EBENE auszudrucken. Im anderen Falle wird auch von PCT ein automatischer Zeilen-Umbruch durchgeführt: solche Texte lassen sich jedoch nicht problemlos als ASCII-File listen oder ausdrucken: -> das gilt bes. für die Erstellung von README-TEXTEN. Also: VORSICHT beim LADEN und BEARBEITEN von WORD-TEXTEN mit dem PC-TOOLS WORDPROCESSOR! ENDEMARKEN beachten! Auf DOS-Ebene können dann SORT und FIND für PCT-Textfiles angewandt werden.
HANDSATZ ist natürlich problemlos machbar, sofern das Augenmerk beständig auf die gerade eingegebene Zeile gerichtet und eventuelle LÜCKEN geschlossen oder vergrößert werden. Die ENDEMARKEN-FUNKTION hilft, da alle Endemarken rechtsbündig eine vertikal durchgezoge ne LINIE ergeben. So lassen sich auch AUFNAHME-LABELS ausgezeichnet mit dem TOOLS-WP erstellen. Mit WORD gezeichnete Linien und KÄSTEN müssen im WP-Mode äußerst vorsichtig behandelt werden. Einmal gelöschte Linien gehen verloren und lassen sich nicht regenerieren. Doch gibt es auch den ASCII-"Linienbaukasten"; er umfaßt die Zeichen 169, 170, 179-218 und 219-223. ¦_______¦ <- eine solche einfache "Badewanne" zeichnet man mit 219 und 220. Auch Sonderzeichen wie das /ê/ in fenêtre lassen sich (hier mit 136) erzeugen, auch das /æ/ wie in Cædmon (145) oder CÆDMON (146) bzw. das /Å/ wie in Ångström (143).
Voranstehende Aufzeichnungen dienen als - jederzeit abrufbares - MEMO. Speziellere Ausführungen müssen als ABSÄTZE von- bzw. gegeneinander abgegrenzt werden, damit sie per LIST aus eigenständige Passagen abgedruckt werden können ohne den Einbezug unerwünschter Textelemente. Das gilt zum Beispiel für die zu WP gemachten Ausführungen. Für LIST gilt, daß beim Datei-ENDE (EOF) die SCHLUSS-ZEILE nur dann ausgedruckt wird, wenn anschließend mindestens eine Freizeile gelassen wird.
KEYBOARD-TREIBER UND PC-DOS.
Die [deutsche, s. Hans H. GERHARDT, PC-DOS/MS-DOS, Haar: M&T
1987, S.27u.] Tastatur meines PC/XT akzeptiert n i c h t den KEYBxx-Befehl
des DOS 3.30 i.V. mit dem KEYBOARD.SYS und
KEYB.COM, jedoch den Befehl
KEYBGR i.V. mit dem alten Tastaturtreiber
KEYBGR.COM von DOS 3.20 oder 3.21. Vermutl. hängt
diese Akzeptanz ab davon, ab eine XT- oder AT-Tastatur verwandt wird, weniger
vom tatsächlichen BIOS oder CONTROLLER
bzw. PC-TYP (AT oder XT).
Juni 1991
BEOBACHTUNGEN UND ANALYSEN ZU
"HAPPY TEXT"
UND "POST"
1. Neue Erkenntnisse zum Programm HAPPY TEXT
(HT)
Mit HT lassen sich auf komfortable Weise strukturbetonte Dokumente erstellen
und reformatieren, sogar in DOS-(ASCII-)Blocksatz; dies ist für eine
so kleine Textverarbeitung ein Novum. Sehr von Vorteil ist auch, daß
die HT-eigenen Druckerbefehle mit den Standard-Escape-Sequenzen gemischt
werden können, wie HT.BAT beweist. Im Gegensatz
zu größeren Textverarbeitungen (WORD, Word für
Windows etc.) ist ein platzsparender Mehrfach-Druck möglich, auch als
Rechtsspaltendruck: besonders wichtig für LABELs. Auf diese Weise kann
Endlospapier optimal genutzt werden, es wird nicht für jeden Ausdruck
eine neue Seite begonnen.
Das
SCHRIFT-INVENTAR ist im Drucker-Treiber definiert;
hier finden sich die z.B. für Nadeldrucker standardisierten
Escape-Sequenzen. Jedem Drucker-Code (z.B. Fettdruck) ist eine Zeile zugewiesen;
diese ist editierbar, also in ihrer Funktion veränderbar. Hierin liegt
die Chance, eine Reihe individueller Druckertreiber zu erstellen, die in
Form sog. Errorlevels als wählbare Varianten für
DRUCKER.TRB verfügbar sind. Nicht nur Schriftarten,
sondern auch Zeilen-Abstände u.a. sind hier vorgegeben. Der geringe
ProgrammUmfang von HT läßt es nicht zu,
DRUCKER.TRB um weitere Zeilen zu ergänzen.
Happy Text ist re-konfigurierbar: Voraussetzung ist genaue Kenntnis der
SCAN-Codes sowie der Initialisierungs-Datei
DATUM.TXT, die zuvor gesichert werden sollte. In
DATUM.TXT ist jeder Funktionstaste ein dreistelliger
Scancode zugewiesen. Scan 0;021 für Alt-Y erscheint in
DATUM.TXT als "021". Dort nicht genutzte Codes können
ggf. für die Belegung sog. Floskel-Tasten genutzt werden, z.B. Alt-g
für "mit freundlichen Grüßen"; sinnvoller wäre es, als
Floskeln schwierige, bei der Eingabe "fehlerträchtige" Zeichen-Strings
zu nutzen.
Sehr komfortabel in HT ist die ab Cursor wirkende, blitzschnell
rückgängig zu machende Blocksatz-Funktion; auch im Blocksatz liegt
reiner ASCII-Text vor.
2. Das (aus "Post" testweise abgeleitete) Programm "Wenker" und seine
Nachteile gegenüber der reinen ASCII- Datenaufnahme. Eine Studie
Das erste Wochenende des Juni 1991 wurde genutzt, um das Programm "Post-Auskunft"
des Rossipaul-Verlags München zu testen. Es handelt sich dabei
offensichtlich um ein sog. relationales Datenbank-System mit vier Eingabefeldern:
Der VORTEIL dieses Systems liegt darin, daß in den Feldern
[2] bis [4] listenweise gesucht werden kann. Das heißt, wird z.B. in
[3] B eingegeben, kann mit <PgUp> bzw. <PgDn> von Bxxxxx bis
Zxxxxx geblättert werden, dasselbe gilt numerisch für [2] und -
im Sinne alphanumerischer Strings - für [4]. Für dieses Blättern
braucht die Datenbank (ORTSDAT.DAT,
ORTSDAT.IDX) nicht vorbereitend umsortiert zu werden.
NACHTEILE des Systems sind die aufgrund der relationalen Struktur
ständig notwendig werdenden ZUGRIFFE auf den Massenspeicher:
in der Regel die FESTPLATTE. Dabei ist der alphabetisch sortierte
Zugriff auf Ortsnamen am arbeitsintensivsten: bei jedem neuen Ortsnamen muß
auf die Platte zugegriffen werden. Wird <F5> gedrückt, so können
innerhalb der gerade angezeigten Postleitzahl alle Ortsnamen (alphabetisch)
abgefragt werden, und mit <F9> kehrt man innerhalb dieser Anfrage stets
zum alphabet. ersten Ort der PLZ zurück. Diese PLZ-Query arbeitet
größtenteils RAM-orientiert, also festplattenschonend. Die beiden
letztgenannten Funktionen sind nicht dokumentiert.
Wird eine Datenbank neu aufgebaut, läßt sich WENKER
zunächst zwar auch auf DISKETTE betreiben. Dann bauen
sich die beiden Daten-Files *.DAT und
*.IDX automatisch neu auf. Pro Daten-Satz werden etwa
70-100 Bytes in *.DAT addiert,
*.IDX erreicht etwa den 1,3-fachen Umfang von *.DAT.
Doch kann es - wie in einem konkreten Fall vom 3.6.91, dazu kommen, daß
durch die ständigen Leseund Schreibvorgänge auf der Diskette in
den Daten-Files ein FEHLER entsteht und es möglicherweise
zu einem RECOVERY ERROR kommt, der in seinem Gefolge die FAT
der Diskette zerschießt und damit die Diskette unlesbar werden
läßt. Ganz allgemein gilt: je weniger Datenträger-Zugriffe,
desto mehr SCHONUNG für Diskette bzw. Festplatte und
desto geringer die Wahrscheinlichkeit von Schreib- bzw. Lesefehlern. Sind
ständige Festplatten-Zugriffe wie im Programm POST unumgänglich,
so bleibt nur der technische Kunstgriff, Programm und Datenbank vor Arbeitsbeginn
auf eine sog. RAM-DISK zu kopieren, wofür
in unserem Fall jedoch mindestens 3,5 MB an zusätzlich installiertem
Speicher anfallen würden (wobei noch zu klären ist, ob nicht noch
mehr an Speicher benötigt wird für sog. SWAPPING!).
Die DATENBANK-Struktur von WENKER (bzw. POST) ist noch nicht ganz offengelegt. Das Programm wurde in COBOL geschrieben. Der Rossipaul-Verlag hat die Funktionen bzw. den Leistungsumfang weder dokumentiert noch bietet er einen Support an. Es gibt keinen Hinweis darauf, inwieweit die entstandene Datenbank über die im Menü angedeuteten Funktionen hinaus genutzt werden kann, d.h. ob z.B. POSTDAT oder Teile daraus in Listenform ausgedruckt oder weitere Sortierungen vorgenommen werden können. Es wäre sehr hilfreich zu wissen, nach welchen Kriterien die Index-Datei POSTDAT.IDX aufgebaut wird und inwieweit sich deren Modifikation auf den Programm-Ablauf auswirkt. Ferner ist nicht klar, warum das Eingabefeld "Vorwahl-Nummer" im Gegensatz zu "PLZ" alphanumerische Strings (incl. Sonderzeichen wie Apostroph) und deren Abfrage zuläßt. Die Datendateien sind dBase-inkompatibel; die bei der Einrichtung entstehende Zwischendatei POSTDAT.TXT (ca. 1MB) kann allerdings mit SPLIT 4.9 in Untereinheiten geteilt werden; die Teil-Dateien lassen sich mit einem leistungsfähigen Editor wie Q-Edit Advanced soweit bearbeiten, daß z.B. unnötige Leerzeichen gelöscht werden, wodurch sich der Dateiumfang mehr als halbiert. Aus solchen "kondensierten" Files lassen sich mit WORD alphabetische ORTSLISTEN gewinnen, aus denen mit GREP oder FIND von DOS aus bestimmte Namen gesucht werden können.
3. Ausweg: Orts-Datenbank als lineare ASCII-File
Ein Ausweg aus o.a. Dilemma besteht darin, die Orts-Daten sowie die
zugehörigen Parameter als "lineare ASCII-Daten" einzugeben und
abzuspeichern. Vorteile sind:
(c) Dr. W. Näser, Marburg, August 2005 ff.