Discussion:
Kann man mit Tex / LateX Wörter zählen?
(zu alt für eine Antwort)
Stefan
2003-09-25 15:28:34 UTC
Permalink
Hallo,

gibt es ein Packet / Funktion mit dem/der man die Wörter in einem Dokument
zählen kann?
Also nicht die Wörter in meinem Script sondern die in meiner Ausgabe.

Bye and THX,
Stefan
Ulrich Schwarz
2003-09-25 15:57:26 UTC
Permalink
Post by Stefan
Hallo,
gibt es ein Packet / Funktion mit dem/der man die Wörter in einem Dokument
zählen kann?
Also nicht die Wörter in meinem Script sondern die in meiner Ausgabe.
Hmm... zumindest unter Linux gibt es Programme, die dvi wieder in Text
zurückumwandeln, auf den kann man dann Programme wie wc (word count,
heißt echt so!) loslassen. (detex? Bin aber nicht sicher.)

Das hilft Dir jetzt aber wahrscheinlich wenig?

Ulrich
--
Wind comes from the south
In early cold of winter
*BLAM* *BLAM* *BLAM* *FRUITCAKE*.
-- AJR
Marc Olschok
2003-09-25 16:12:48 UTC
Permalink
Post by Ulrich Schwarz
Post by Stefan
Hallo,
gibt es ein Packet / Funktion mit dem/der man die Woerter in einem Dokument
zaehlen kann?
Also nicht die Woerter in meinem Script sondern die in meiner Ausgabe.
Hmm... zumindest unter Linux gibt es Programme, die dvi wieder in Text
zurueckumwandeln, auf den kann man dann Programme wie wc (word count,
hei3t echt so!) loslassen. (detex? Bin aber nicht sicher.)
Nicht ganz. Detex zeigt die TeX Quelldatei ohne die Makros an.
Siehe etwa die TeX-Eingabe

Das Lied begann mit: \def\zeile{alle meine Entchen} \zeile \bye

Dvi2tty stellt eine dvi-Datei auf einem Textterminal dar.
Die Frage ist allerdings was man alles zaehlen will; im obigen
Beispiel liefert etwa dvi2tty -q <datei>.dvi |wc -w
das Ergebnis 8, weil die Seitenzahl am unteren Rand natuerlich mitgezaehlt
wird.

Marc
Ralf Angeli
2003-09-25 15:45:39 UTC
Permalink
Post by Stefan
gibt es ein Packet / Funktion mit dem/der man die Wörter in einem Dokument
zählen kann?
Ja, siehe

http://groups.google.com/groups?q=w%F6rter+z%E4hlen+group%3Ade.comp.text.tex

Gruß,
Ralf
--
Einführung in dctt: <news:8t-***@v-li.fqdn.th-h.de>
Deutsche TeX-FAQ: <URL:http://www.dante.de/faq/de-tex-faq/>
Englische TeX-FAQ: <URL:http://www.tex.ac.uk/cgi-bin/texfaq2html>
Stefan
2003-09-25 16:41:45 UTC
Permalink
hmmm... ok danke erst mal für eure Hilfe.
Es gibt im Prinzip als keine Möglichkeit gleich in das Dokument die
Wortanzahl einzubinden, oder?
Also sowas wie /tableofcontents für die Wortanzahl?!

Kennt jemand ein Programm mit dem man das LaTeX Dok. in ein Html
Dok. umwandelt kann, was aber kein Perl Script ist und unter Windows
läuft?

Bye and THX,
Stefan
Post by Stefan
Hallo,
gibt es ein Packet / Funktion mit dem/der man die Wörter in einem Dokument
zählen kann?
Also nicht die Wörter in meinem Script sondern die in meiner Ausgabe.
Bye and THX,
Stefan
Thomas Stein
2003-09-25 17:58:20 UTC
Permalink
Post by Stefan
Kennt jemand ein Programm mit dem man das LaTeX Dok. in ein Html
Dok. umwandelt kann, was aber kein Perl Script ist und unter Windows
läuft?
Das dürfte wohl eine FAQ sein. Falls Du MiKTeX installiert hast, verfügst Du
höchstwahrscheinlich sogar schon über TeX4HT, das dafür gemacht ist. Es gibt
noch zahlreiche andere Programme, die das können.

Gruß
Thomas
Juergen Fenn
2003-09-25 18:10:21 UTC
Permalink
Post by Stefan
Kennt jemand ein Programm mit dem man das LaTeX Dok. in ein Html
Dok. umwandelt kann, was aber kein Perl Script ist und unter Windows
läuft?
Aus der UK TeX FAQ 3.9 von Robin Fairbairns:

| 66 How many words have you written?
|
|[...]
|
| The simplest method is to strip out the (L A )T E X markup, and to
| count what.s left. On a Unix-like system, this may be done using
| detex and the built-in wc: detex <filename> | wc -w
|
| The latexcount script does the same sort of job, in one "step";
| being a perl script, it is in principle rather easily configured
| (see documentation inside the script). Winedt (see question 56)
| provides this functionality direct in the Windows environment.
|
| Simply stripping (L A )T E X markup isn.t entirely reliable,
| however: that markup itself may contribute typeset words, and this
| could be a problem. The wordcount package contains a Bourne shell
| (i.e., typically Unix) script for running a L A T E X file with a
| special piece of supporting T E X code, and then counting word
| indications in the log file. This is probably as accurate automatic
| counting as you can get.

Jürgen.
Marc Olschok
2003-09-26 12:59:25 UTC
Permalink
hmmm... ok danke erst mal fuer eure Hilfe.
Es gibt im Prinzip als keine Moeglichkeit gleich in das Dokument die
Wortanzahl einzubinden, oder?
Also sowas wie /tableofcontents fuer die Wortanzahl?!
Das Einbinden ist an sich kein Problem, wenn man erst einmal die
Daten ermittelt hat. Fuer Inhaltsverzeichnis oder andere Verweise
werden ja ebenfalls beim ersten Durchlauf Daten in einer Hilfsdatei
gespeichert und in einem zweiten Durchlauf verwertet.

Dabei kann es beim Auswerten der Daten egal sein, wie sie erzeugt wurden.

Wenn es unbedingt sein muss, dass die Wortzahl innerhalb des TeX-Laufes
ermittelt wird faellt mir leider nichts vernuenftiges ein.

Die folgende Holzhammermethode

(1) Am Anfang der Datei die folgenden Definitionen
%---------------------------------
\newcount\wc
\def\9{\advance\wc by 1\ }
%---------------------------------

(2) Im eigentlichen Text alle Leerzeichen und Zeilenenden durch \9
ersetzen

Ist zwar in der Lage, die offensichtlichen Wortenden zu zaehlen,
zaehlt aber leider auch mehrfache Leerzeichen und Absaetze.
Ausserdem versaut es die Formatierung.

Marc

Loading...