Discussion:
Umlaute in biblatex
(zu alt für eine Antwort)
Mathias Lindner
2009-08-04 12:50:35 UTC
Permalink
Hallo,

eine Frage zur Unterstützung von Umlauten in biblatex (das gleiche
Problem trat auch bei bibtex auf):

Ich habe einen Eintrag in der .bib-Datei, der folgendermaßen aussieht:

@book{mller_berechnung_2007,
edition = {6. v\"{o}llig neu bearbeitete Auflage.},
title = {Berechnung elektrischer Maschinen: Elektrische Maschinen 2},
isbn = {3527405259},
location = {{ZN} 8200 mue},
shorttitle = {Berechnung elektrischer Maschinen},
publisher = {{Wiley-Vch}},
author = {Germar M\"{u}ller and Karl Vogt and Bernd Ponick},
month = oct,
year = {2007}
},

Läuft biblatex mit dem Stil alphabetic-verb darüber, wird dieser Eintrag
in der .bbl-Datei erzeugt:

\entry{mller_elektrische_1990}{book}{}
\name{author}{1}{%
{{M\"{u}ller}{M.}%
{Germar}{G.}%
{}{}%
{}{}}%
}
\list{publisher}{1}{%
{{VEB} Verlag Technik Berlin}%
}
\strng{namehash}{MG1}
\strng{fullhash}{MG1}
\field{labelalpha}{M\"90}
\field{sortinit}{M}
\field{edition}{2. durchges. Aufl.}
\field{isbn}{3341008268}
\field{title}{Elektrische Maschinen - Betriebsverhalten rotierender
elektrischer Maschinen}
\field{year}{1990}
\endentry

Hier ist bereits zu erkennen, dass das Label falsch sein wird. Es heißt
{M\"90}. Also ein M, dann eine 9 mit zwei Punkten darüber und eine 0.
Biblatex scheint das ü nicht zu erkennen. Es müsste entweder den Rest
vom ü (also das {u}) auch mit ins Label ziehen, oder alles weglassen und
nur {M90} ausgeben.

Wie kann ich dieses Verhalten unterbinden?

Vielen Dank und beste Grüße,
Mathias
Dominik Waßenhoven
2009-08-04 13:20:58 UTC
Permalink
Hallo Mathias,
Post by Mathias Lindner
eine Frage zur Unterstützung von Umlauten in biblatex (das gleiche
Problem trat auch bei bibtex auf): [...]
\name{author}{1}{%
{{M\"{u}ller}{M.}%
[...]
\field{labelalpha}{M\"90}
[...]
Hier ist bereits zu erkennen, dass das Label falsch sein wird. Es heißt
{M\"90}. Also ein M, dann eine 9 mit zwei Punkten darüber und eine 0.
Biblatex scheint das ü nicht zu erkennen. Es müsste entweder den Rest
vom ü (also das {u}) auch mit ins Label ziehen, oder alles weglassen und
nur {M90} ausgeben.
Wie kann ich dieses Verhalten unterbinden?
Ohne es getestet zu haben: geht es mit

M{\"u}ller

? Abgesehen davon, warum gibst du den Umlaut nicht direkt ein?

Gruß,
Dominik.-
--
über diese Gruppe: http://www.latex-einfuehrung.de
deutsche TeX-FAQ: http://www.dante.de/faq/de-tex-faq
biblatex-Stile: http://biblatex.dominik-wassenhoven.de
Mathias Lindner
2009-08-04 15:43:38 UTC
Permalink
Post by Dominik Waßenhoven
Hallo Mathias,
Post by Mathias Lindner
eine Frage zur Unterstützung von Umlauten in biblatex (das gleiche
Problem trat auch bei bibtex auf): [...]
\name{author}{1}{%
{{M\"{u}ller}{M.}%
[...]
\field{labelalpha}{M\"90}
[...]
Hier ist bereits zu erkennen, dass das Label falsch sein wird. Es heißt
{M\"90}. Also ein M, dann eine 9 mit zwei Punkten darüber und eine 0.
Biblatex scheint das ü nicht zu erkennen. Es müsste entweder den Rest
vom ü (also das {u}) auch mit ins Label ziehen, oder alles weglassen und
nur {M90} ausgeben.
Wie kann ich dieses Verhalten unterbinden?
Ohne es getestet zu haben: geht es mit
M{\"u}ller
? Abgesehen davon, warum gibst du den Umlaut nicht direkt ein?
Gruß,
Dominik.-
Hmm, die Bib-Datei wird direkt von Zotero erzeugt (Encoding
ISO-8859-15). Dort habe ich wahrscheinlich wenig Einfluss darauf. Oder
könnte ein anderes Encoding Abhilfe schaffen?

Gruß,
Mathias
Philipp Stephani
2009-08-04 13:35:05 UTC
Permalink
Post by Mathias Lindner
eine Frage zur Unterstützung von Umlauten in biblatex (das gleiche
Ja, denn biblatex basiert auf bibtex, außer du verwendest biber statt
bibtex. Siehe § 2.4.3 der biblatex-Anleitung, dort wird das Problem
recht gut beschrieben.
--
Replace “READ-MY-SIG” by “tcalveu” to answer by mail.
Mathias Lindner
2009-08-04 17:06:09 UTC
Permalink
Post by Philipp Stephani
Post by Mathias Lindner
eine Frage zur Unterstützung von Umlauten in biblatex (das gleiche
Ja, denn biblatex basiert auf bibtex, außer du verwendest biber statt
bibtex. Siehe § 2.4.3 der biblatex-Anleitung, dort wird das Problem
recht gut beschrieben.
Danke für den Hinweis. Ich habe jetzt eine Lösung gefunden. Aber diese
gefällt mir ganz und gar nicht.

1. Export der bib-Datei aus Zotero mit UTF8-Encoding. Dann werden
Umlaute nicht dekodiert.
2. In der tex-Datei \usepackage[utf8]{inputenc} verwenden (latin1 gibt
Fehler).

Nur:
1. Ich dachte, BibTeX kann gar kein UTF8? Wieso steht das überall, wenn
es das dann doch kann?
2. Ich wollte eigentlich alle Dateien auf ISO-8859-15 belassen, damit
ich ohne Probleme zwischen Linux und Windows und verschiedenen Editoren
wechseln kann...
3. Wieso muss ich auf einmal ein anderes Encoding der TeX-Datei angeben,
wenn ich nur das Encoding der bib-Datei geändert habe?

Also Hinweise sind nach wie willkommen :)
Mathias
Philipp Stephani
2009-08-04 17:13:17 UTC
Permalink
Post by Mathias Lindner
Post by Philipp Stephani
Post by Mathias Lindner
eine Frage zur Unterstützung von Umlauten in biblatex (das gleiche
Ja, denn biblatex basiert auf bibtex, außer du verwendest biber statt
bibtex. Siehe § 2.4.3 der biblatex-Anleitung, dort wird das Problem
recht gut beschrieben.
Danke für den Hinweis. Ich habe jetzt eine Lösung gefunden. Aber diese
gefällt mir ganz und gar nicht.
1. Export der bib-Datei aus Zotero mit UTF8-Encoding. Dann werden
Umlaute nicht dekodiert.
2. In der tex-Datei \usepackage[utf8]{inputenc} verwenden (latin1 gibt
Fehler).
Latin-1 funktioniert, wenn im Dokument nur Latin-1-Zeichen (also die
Unicodezeichen bix 0xFF) auftauchen und alle Dateien tatsächlich
Latin-1-kodiert sind.
Post by Mathias Lindner
1. Ich dachte, BibTeX kann gar kein UTF8? Wieso steht das überall, wenn
es das dann doch kann?
Kann es nicht. Es sortiert falsch und schneidet Zeichen, die mit
mehreren Codeeinheiten dargestellt werden, auseinander. Nur manchmal
fällt das nicht auf.
Post by Mathias Lindner
2. Ich wollte eigentlich alle Dateien auf ISO-8859-15 belassen, damit
ich ohne Probleme zwischen Linux und Windows und verschiedenen Editoren
wechseln kann...
Ja, dann mach das doch. Solange es von inputenc und von bibtex8 in Form
einer csf-Datei unterstützt wird, sollte es unproblematisch sein, bis
auf die auch mit bibtex8 nicht lösbaren Sortierungsprobleme, die
aufgrund der auf einzelnen Zeichenvergleichen basierenden Sortierung von
bibtex(8) beruhen.
Post by Mathias Lindner
3. Wieso muss ich auf einmal ein anderes Encoding der TeX-Datei angeben,
wenn ich nur das Encoding der bib-Datei geändert habe?
Musst du nicht. Die Kodierung der TeX-Datei wird wie gewohnt als
Argument fürs inputenc-Paket angegeben. biblatex unterstützt zusätzlich
die Verwendung einer anderen Kodierung für die Bibliographie. Diese muss
als Option dem biblatex-Paket übergeben werden.
Eine Alternative ist biber, das tatsächlich UTF-8 beherrscht.
--
Replace “READ-MY-SIG” by “tcalveu” to answer by mail.
Philipp Lehman
2009-08-04 19:10:27 UTC
Permalink
Post by Mathias Lindner
1. Ich dachte, BibTeX kann gar kein UTF8?
Kann es auch nicht. Die Probleme mitunter subtil: Schau dir das
Alpha-Label von z.B. "Müller 1995" mit UTF-8 an, daraus wird "Mü95"
statt "Mül95". Versuch auch mal "Krüger" oder einen anderen Namen mit
Umlaut an der dritten Stelle.

Die ersten 128 Zeichen in Unicode/UTF-8 sind mit Ascii identisch. Wenn
man sich auf diesen Zeichenbereich beschränkt, gibt es natürlich
keine Probleme, weshalb immer mal wieder der Eindruck entsteht, es
sei doch möglich.
Post by Mathias Lindner
2. Ich wollte eigentlich alle Dateien auf ISO-8859-15 belassen,
damit ich ohne Probleme zwischen Linux und Windows und verschiedenen
Editoren wechseln kann...
Wenn du dich auf westeuropäische Zeichen beschränkst, kannst du
verlustfrei umkodieren:

recode UTF-8..ISO-8859-15 <alt.bib >neu.bib
Post by Mathias Lindner
3. Wieso muss ich auf einmal ein anderes Encoding der TeX-Datei
angeben, wenn ich nur das Encoding der bib-Datei geändert habe?
Ist nicht erforderlich, wie Philipp Stefani schon schreibt.

Alternativ könntest du auch Biber verwenden und den ganzen Workflow
auf UTF-8 umstellen. Recht viel Aufwand für einen eklatanten
Zotero-Bug.

PS: Ein Bug-Report wäre sicherlich sinnvoll. Die Kovention mit
geklammerten Umlauten steht in der BibTeX-Benuterdokumentation
(btxdoc.bib/.pdf, § 2.1, Punkt 4).

Man beachte auch das Datum: Februar 1988. Diese Konvention gilt seit
geschlagenen 21 Jahren. Da fragt man sich schon, wer diese
Export-Filter schreibt...
--
Sender address blackholed; do not reply to From: address.
You can still reach me by email at: lehman gmx net.
Susanne Wunsch
2009-08-04 22:41:37 UTC
Permalink
On Tue, 04 Aug 2009 21:10:27 +0200
Post by Philipp Lehman
Post by Mathias Lindner
2. Ich wollte eigentlich alle Dateien auf ISO-8859-15 belassen,
damit ich ohne Probleme zwischen Linux und Windows und verschiedenen
Editoren wechseln kann...
Wenn du dich auf westeuropäische Zeichen beschränkst, kannst du
recode UTF-8..ISO-8859-15 <alt.bib >neu.bib
Leider habe ich damit schlechte Erfahrungen gemacht. recode
"verschluckt" sich nach einer fixen buffer-size (255 Zeichen oder so
ähnlich). Dabei treten ähnlich unscheinbare Zeichenverschiebungen auf,
wie für bibtex beschrieben. Es ist nur noch subtiler und kaum zu
finden.

Ich habe stattdessen folgendes verwendet:

ptrans -i "utf-8-file" -o "latin-1-file"


Liebe Grüße ...
Susanne
Mathias Lindner
2009-08-05 18:31:27 UTC
Permalink
Post by Philipp Lehman
Alternativ könntest du auch Biber verwenden und den ganzen Workflow
auf UTF-8 umstellen. Recht viel Aufwand für einen eklatanten
Zotero-Bug.
PS: Ein Bug-Report wäre sicherlich sinnvoll. Die Kovention mit
geklammerten Umlauten steht in der BibTeX-Benuterdokumentation
(btxdoc.bib/.pdf, § 2.1, Punkt 4).
Man beachte auch das Datum: Februar 1988. Diese Konvention gilt seit
geschlagenen 21 Jahren. Da fragt man sich schon, wer diese
Export-Filter schreibt...
Guter Hinweis. Ich habe den Bug gemeldet. Hier der Forums-Thread dazu:
http://forums.zotero.org/discussion/8165/german-umlauts-in-bibtex-export

Nein, wie gesagt, auf UTF8 will ich eigentlich nicht umstellen. Sonst
gibt das nur wieder Probleme, wenn ich zwischen Betriebssystemen und
Editoren umher wechsle.

Im Moment bleibt mir wohl nichts anderes übrig, als manuell in der
bib-Datei die Schreibweisen zu ändern. und auf einen Bugfix zu hoffen.

Danke für die Hilfe!
Mathias
Philipp Stephani
2009-08-05 19:36:39 UTC
Permalink
Post by Mathias Lindner
Post by Philipp Lehman
Alternativ könntest du auch Biber verwenden und den ganzen Workflow
auf UTF-8 umstellen. Recht viel Aufwand für einen eklatanten
Zotero-Bug.
PS: Ein Bug-Report wäre sicherlich sinnvoll. Die Kovention mit
geklammerten Umlauten steht in der BibTeX-Benuterdokumentation
(btxdoc.bib/.pdf, § 2.1, Punkt 4).
Man beachte auch das Datum: Februar 1988. Diese Konvention gilt seit
geschlagenen 21 Jahren. Da fragt man sich schon, wer diese
Export-Filter schreibt...
http://forums.zotero.org/discussion/8165/german-umlauts-in-bibtex-export
Interessant wäre auch zu erfahren, warum Zotero auch bei der Kodierung
ISO-8859-15 die ASCII-Notation verwendet, denn die Umlaute sind in
dieser Kodierung durchaus darstellbar und für bibtex8 auch benutzbar.
Die ASCII-Notation solltest du aus den in der Anleitung genannten
Gründen nur als kleinsten gemeinsamen Nenner in Betracht ziehen, wenn
unbedingte ASCII-Kompatibilität nötig ist. Biber dürfte letztendlich die
beste Lösung darstellen, da es (hoffentlich) fortgeschrittene
Sortierungsfunktionen benutzt, die auch das ß korrekt sortieren können.
Post by Mathias Lindner
Nein, wie gesagt, auf UTF8 will ich eigentlich nicht umstellen. Sonst
gibt das nur wieder Probleme, wenn ich zwischen Betriebssystemen und
Editoren umher wechsle.
Ich wüsste ehrlich gesagt nicht, welche Probleme das verursachen könnte.
Der einzige Editor, von dem ich weiß, das er in der Vergangenheit nicht
auf Unicode basierte, war TeXnicCenter. Ist das etwa immer noch so?

Vielmehr ist die Kodierung der Bibliographiedatenbank ja abhängig vom
Backend. Bibtex kann nur ASCII, Bibtex8 kann zusätzlich verschiedene
Einzelbytekodierungen, Biber kann alles.
--
Replace “READ-MY-SIG” by “tcalveu” to answer by mail.
Mathias Lindner
2009-08-06 15:22:58 UTC
Permalink
Post by Philipp Stephani
Post by Mathias Lindner
Post by Philipp Lehman
Alternativ könntest du auch Biber verwenden und den ganzen Workflow
auf UTF-8 umstellen. Recht viel Aufwand für einen eklatanten
Zotero-Bug.
PS: Ein Bug-Report wäre sicherlich sinnvoll. Die Kovention mit
geklammerten Umlauten steht in der BibTeX-Benuterdokumentation
(btxdoc.bib/.pdf, § 2.1, Punkt 4).
Man beachte auch das Datum: Februar 1988. Diese Konvention gilt seit
geschlagenen 21 Jahren. Da fragt man sich schon, wer diese
Export-Filter schreibt...
http://forums.zotero.org/discussion/8165/german-umlauts-in-bibtex-export
Interessant wäre auch zu erfahren, warum Zotero auch bei der Kodierung
ISO-8859-15 die ASCII-Notation verwendet, denn die Umlaute sind in
dieser Kodierung durchaus darstellbar und für bibtex8 auch benutzbar.
Die ASCII-Notation solltest du aus den in der Anleitung genannten
Gründen nur als kleinsten gemeinsamen Nenner in Betracht ziehen, wenn
unbedingte ASCII-Kompatibilität nötig ist. Biber dürfte letztendlich die
beste Lösung darstellen, da es (hoffentlich) fortgeschrittene
Sortierungsfunktionen benutzt, die auch das ß korrekt sortieren können.
Der Grund, oder die Ausrede, oder wie auch immer, ist hier zu lesen:
http://forums.zotero.org/discussion/8165/german-umlauts-in-bibtex-export
Post by Philipp Stephani
Post by Mathias Lindner
Nein, wie gesagt, auf UTF8 will ich eigentlich nicht umstellen. Sonst
gibt das nur wieder Probleme, wenn ich zwischen Betriebssystemen und
Editoren umher wechsle.
Ich wüsste ehrlich gesagt nicht, welche Probleme das verursachen könnte.
Der einzige Editor, von dem ich weiß, das er in der Vergangenheit nicht
auf Unicode basierte, war TeXnicCenter. Ist das etwa immer noch so?
Meines Wissens nach ja. Und was ist mit Windows Notepad, Mailprogrammen,
ICQ Clienten und ähnlicher Software? Ich möchte es mir nicht verbauen,
mal eben ein Codeschnipsel unkompliziert verschicken zu können, nur weil
im Moment UTF-8 mal leichter umzusetzen wäre.
Post by Philipp Stephani
Vielmehr ist die Kodierung der Bibliographiedatenbank ja abhängig vom
Backend. Bibtex kann nur ASCII, Bibtex8 kann zusätzlich verschiedene
Einzelbytekodierungen, Biber kann alles.
Ich bin nun auf Bibtex8 umgestiegen. Das hat viele Dinge erleichtert. Da
aber die ASCII-Ausgabe von Zotero buggy ist und sonst nur UTF-8 möglich
ist, muss ich auch hier einen Umweg gehen. Export aus Zotero mit UFT-8,
Import in JabRef, Export mit ISO-8859-15. Danach habe ich meine Datei
so, wie ich sie will.
Echt schade, dass die Zotero-Leute das nicht hinbekommen. Ich verstehe
nicht, wieso die sich sträuben. Vielleicht werdet ihr ja aus dem Thread
oben schlau.

Der Umweg über JabRef hat auch noch einen Vorteil: beim Import gehen
alle Notizen verloren, die von Zotero an jeden Eintrag angehängt werden,
aber im bib-file überhaupt nicht gebraucht werden. Ich nutze die
Notizfunktion sehr ausgiebig, die Einträge können auch mal recht lang
sein. Und dann gab es immer einen Fehler in Bibtex wegen zu langen
Zeilen. Das kommt nun nicht mehr vor :)

Also letztlich: alles ein bisschen tricky und umständlich, aber es läuft
jetzt.

Danke an alle!
Mathias
Philipp Stephani
2009-08-06 15:51:20 UTC
Permalink
Post by Mathias Lindner
Post by Philipp Stephani
Ich wüsste ehrlich gesagt nicht, welche Probleme das verursachen könnte.
Der einzige Editor, von dem ich weiß, das er in der Vergangenheit nicht
auf Unicode basierte, war TeXnicCenter. Ist das etwa immer noch so?
Meines Wissens nach ja. Und was ist mit Windows Notepad, Mailprogrammen,
ICQ Clienten und ähnlicher Software? Ich möchte es mir nicht verbauen,
mal eben ein Codeschnipsel unkompliziert verschicken zu können, nur weil
im Moment UTF-8 mal leichter umzusetzen wäre.
Notepad unterstützt Unicode und UTF-8 mindestens seit Windows 2000, und
auch bei Mailprogrammen kann ich mir nicht vorstellen, dass moderne
Programme damit nicht zurechtkommen. Ich kann natürlich nicht für alle
Programme sprechen. Eventuell wäre es einfacher und unkritischer, wenn
du einfach mit einer Textersetzung über die exportierte Bibliographie gehst.
Post by Mathias Lindner
Echt schade, dass die Zotero-Leute das nicht hinbekommen. Ich verstehe
nicht, wieso die sich sträuben. Vielleicht werdet ihr ja aus dem Thread
oben schlau.
Die Begründung, dass es für alle Kodierungen separate Tabellen geben
müsste, ist einigermaßen nachvollziehbar. Ich weiß nichts über Zotero,
insbesondere nicht, ob beispielsweise die eingesetzte Plattform in der
Lage ist, beim Kodieren nicht dargestellte Zeichen irgendwie zu melden
oder gesondert zu behandeln. Die Java-Bibliothek stellt entsprechende
Klassen zur Verfügung, was der Grund sein könnte, dass JabRef damit
keine Probleme hat.

Relativ einfach wäre es hingegen mit ISO-8859-1, da dieser Zeichensatz
exakt die ersten 256 Unicode-Zeichen an denselben Positionen enthält.
Bei einem ISO-8859-1-Export wäre deshalb nur die Fallunterscheidung
"Codepunkt kleiner als 256 oder nicht" nötig, jedoch keine
Übersetzungstabellen.

Andererseits wäre die Implementation entsprechender Tabellen wohl kein
großes Hexenwerk. Das Unicode-Konsortium stellt entsprechende
maschinenlesbare Tabellen für die meisten Kodierungen zur Verfügung.
--
Replace “READ-MY-SIG” by “tcalveu” to answer by mail.
Axel Berger
2009-08-07 23:54:00 UTC
Permalink
Notepad unterst?Pilctzt Unicode und UTF-8 mindestens seit Windows 2000, und
auch bei Mailprogrammen kann ich mir nicht vorstellen, dass moderne
Programme damit nicht zurechtkommen.
Ich kenne kein "modernes Usenet" (es sei denn die ubiquitären,
langsamen, unbenutzbaren Foren, von denen ich mich fernhalte) das aus
irgendwelchehn Gründen ein "modernes Mailprogramm" erforderte oder
sinnvoll erscheinen ließe.

Das meiste "moderne" ist einfach nur hirntot und unterstützt nicht
einmal MIDs und References.

Ich habe immer Leute bewundert, die in Nicht-TeX-Gruppen konsequent
siebenbittig schrieben und Umlaute als \"a oder "a TeX-codierten. Was
ich von denen halte, die jeden neunmodischen Schnulli sofort begeistert
mitmachen, auch und gerade dann, wenn kein Vorteil erkennbar ist, ist
in höflichen Gruppen nicht druckreif.
Bernhard Tempel
2009-08-08 17:57:22 UTC
Permalink
Post by Axel Berger
Ich kenne kein "modernes Usenet" (es sei denn die ubiquitären,
langsamen, unbenutzbaren Foren, von denen ich mich fernhalte) das aus
irgendwelchehn Gründen ein "modernes Mailprogramm" erforderte oder
sinnvoll erscheinen ließe.
Das meiste "moderne" ist einfach nur hirntot und unterstützt nicht
einmal MIDs und References.
Ich habe immer Leute bewundert, die in Nicht-TeX-Gruppen konsequent
siebenbittig schrieben und Umlaute als \"a oder "a TeX-codierten. Was
ich von denen halte, die jeden neunmodischen Schnulli sofort begeistert
mitmachen, auch und gerade dann, wenn kein Vorteil erkennbar ist, ist
in höflichen Gruppen nicht druckreif.
Zwischen "jedem neumodischen Schnulli" und der konsequenten Nutzung von
7-Bit-Zeichenkodierung liegt noch viel Raum für Vernünftiges. Die Nutzung von
8-Bit-Zeichenkodierungen und UTF-8 würde ich dazu zählen (soviel Ärger man
sich damit auch einhandeln kann, wenn man nicht aufpaßt und eine Datei mit der
falschen Kodierung öffnet, bearbeitet und speichert). Wenn es noch nötig
gewesen wäre, deutsche Umlaute als "a oder \"a etc. einzugeben, hätte ich vor
vier Jahren ziemlich sicher nicht mit LaTeX angefangen. In E-Mails finde ich
es, ehrlich gesagt, weniger bewundernswert als lächerlich, Umlaute in dieser
Form zu schreiben. Dann schon lieber "ae" etc.

SCNR,

Bernhard
--
http://www.tempelb.de
Axel Berger
2009-08-09 11:02:00 UTC
Permalink
Wenn es noch n÷tig gewesen wSigmre, deutsche Umlaute als "a oder \"a etc.
einzugeben, hSigmtte ich vor vier Jahren ziemlich sicher nicht mit LaTeX
angefangen.
Gerade wir TeX-Nutzer sollten doch im Gegensatz zur Wordjüngern gute
leistungsfähige Editoren gewohnt sein und voraussetzen. In jedem
anständigen Editor, der den Namen verdient, lassen sich Tasten belegen.
Eine Möglichkeit wäre <ä> mit '\"a' und <Ctrl><ä> mit "ä". Oder man
fügt bei jedem Compileraufruf vorher automatisch ein Search and Replace
ein. Beides nichts, was es nicht schon zu MS-DOS 5.0 Zeiten längst
gegeben hätte.
Ulrike Fischer
2009-08-09 18:24:13 UTC
Permalink
Post by Axel Berger
Wenn es noch n÷tig gewesen wSigmre, deutsche Umlaute als "a oder \"a etc.
einzugeben, hSigmtte ich vor vier Jahren ziemlich sicher nicht mit LaTeX
angefangen.
Gerade wir TeX-Nutzer sollten doch im Gegensatz zur Wordjüngern gute
leistungsfähige Editoren gewohnt sein und voraussetzen. In jedem
anständigen Editor, der den Namen verdient, lassen sich Tasten belegen.
Eine Möglichkeit wäre <ä> mit '\"a' und <Ctrl><ä> mit "ä". Oder man
fügt bei jedem Compileraufruf vorher automatisch ein Search and Replace
ein. Beides nichts, was es nicht schon zu MS-DOS 5.0 Zeiten längst
gegeben hätte.
Wundervoll. Möchtest du ernsthaft den Eindruck erwecken, während
alle modernen Programme Richtung Unicode gehen, wären TeX-Nutzer in
der MS-DOS-Zeit stehengeblieben, könnten immer noch nicht sowas
simples wie ein "ä" direkt benutzen, sondern müssten dafür auf
leistungsfähige Editoren und diverse Skripte zurückgreifen?
--
Ulrike Fischer
Axel Berger
2009-08-10 11:09:00 UTC
Permalink
Post by Ulrike Fischer
Möchtest du ernsthaft den Eindruck erwecken
Möglich. Ich will vor allem zeigen, daß den von Dir selbst genannten
Problemen mit UTF in der TeX-Welt keine echten Vorteile gegenüberstehen
und außerhalb davon meist auch nicht. Im übrigen existiert inputenc.sty
schon sehr lange. Wenn ich also zeige, daß man selbst ohne das und
siebenbittig problemlos und komfortabel arbeiten könnte, dient das vor
allem der Verdeutlichung.

Trotzdem lese ich hier immer wieder von Bibtex, das selbst mit
achtbittigen Zeichsätzen nicht immer problemlos ist, und kenne das
Problem, achtbittige Sourcen lauffähig über das Usenet zu
transportieren. Also ganz abwegig ist selbst die Extremposition
offenbar (noch) nicht.

Die Idee, alles was neu ist müsse auch gut sein, ist weit verbreitet
aber hat noch nie gestimmt.
Ulrike Fischer
2009-08-10 12:48:24 UTC
Permalink
Post by Axel Berger
Post by Ulrike Fischer
Möchtest du ernsthaft den Eindruck erwecken
Möglich. Ich will vor allem zeigen, daß den von Dir selbst genannten
Problemen mit UTF in der TeX-Welt keine echten Vorteile gegenüberstehen
und außerhalb davon meist auch nicht.
"Die Welt" ist nicht Deutschland. Hier mag es reichen vier Shortcuts
für ä, ö, ü und ß zu definieren. Aber schon die Franzosen haben mehr
Akzente, und es gibt auch Leute, die wollen in Griechisch, Arabisch
oder in Chinesisch schreiben, oder sogar mehrere Sprachen mischen.
Post by Axel Berger
Die Idee, alles was neu ist müsse auch gut sein, ist weit verbreitet
aber hat noch nie gestimmt.
Da kenne ich bessere Sprüche:

Tradition ist eine Laterne, der Dumme hält sich an ihr fest, dem
Klugen leuchtet sie den Weg.

Folgten wir nur der Tradition, lebten wir noch immer in Höhlen,
folgten wir nur dem Fortschritt, wäre dies bald wieder der Fall.
--
Ulrike Fischer
Ulrike Fischer
2009-08-06 16:16:42 UTC
Permalink
Post by Philipp Stephani
Post by Mathias Lindner
Nein, wie gesagt, auf UTF8 will ich eigentlich nicht umstellen. Sonst
gibt das nur wieder Probleme, wenn ich zwischen Betriebssystemen und
Editoren umher wechsle.
Ich wüsste ehrlich gesagt nicht, welche Probleme das verursachen könnte.
Der einzige Editor, von dem ich weiß, das er in der Vergangenheit nicht
auf Unicode basierte, war TeXnicCenter. Ist das etwa immer noch so?
Nun, winedt kann utf8 nur halb. Abgesehen davon ist pdftex nun mal
eine 8-Bit-Anwendung und eine 8-Bit-Kodierung ist viel natürlich und
einfacher zu handhaben. utf8 ist zB. problematisch in Zusammenhang
mit Paketen, die den Input "tokenweise" abarbeiten, wie listings,
soul (dafür gibt es soulutf8), url.
--
Ulrike Fischer
Loading...