Mit Umlauten ins 21.Jahrhundert

Im Gegensatz zu den Befürchtungen in meinem letzten Post hat es nicht viele Nächte benötigt, bis ich mein Umlautproblem lösen konnte, sondern um genau zu sein 45 Minuten.

Es war wie bereits vermutet, eine skurril einfache Lösung.

Aber ganz von vorn. Wie üblich publiziere ich meine Blogposts auch auf Twitter, weil das eben bei solchen Problemen ein optimaler Kanal ist, nur manchmal zu kurz zur Problembeschreibung, daher die Zwitterlösung mit diesem Blog.

Und binnen zehn Minuten bekam ich auch eine Antwort von @martinpictures. Unerwartet, weil ich ihm nicht folge (ein Hoch auf asynchrone soziale Netzwerke \o/)


Und das war es auch.

Hintergrund ist, dass ich die bereits geschriebenen Texte aus meinem Portfolio-PDF herauskopiert habe. Wie gesagt wir haben das 21. Jahrhundert, wozu soll ich das denn nochmal abtippen!?

Dabei kommt es zu eben dem skurillem Verhalten, weil die Umlaute in dem PDF offenbar nicht direkt als Umlaut (was z.B. bei einem 'ä' U+00E4 wäre) hinterlegt sind, sondern als 'a' (Unicode: U+0061) mit Trema (Unicode: U+0308). Dieses Verhalten nennt man decomposed. Das Trema wiederum ist in der schönen PT Sans nicht hinterlegt, in der Helvetica schon.

Das bestätigt auch meine Erinnerung, dass ich in irgendeinem meiner Browsertest auch den Eindruck hatte, dass das Trema nicht korrekt sitzt, das Verhalten von Firefox hingegen kann ich mir damit nicht erklären.

In aller Fülle wird das Problem auch in der Wikipedia in dem Artikel über Umlaute erklärt.

Hier habe ich die Ergebnisse aufgelistet, zu denen ich bei der Untersuchung der Minuskel kam (decomposed in kursiv, und echte Umlaute in fett):

ä Unicode: U+0061 U+0308, UTF-8: 61 CC 88

ä LATIN SMALL LETTER A WITH DIAERESIS Unicode: U+00E4, UTF-8: C3 A4

ü Unicode: U+0075 U+0308, UTF-8: 75 CC 88

ü LATIN SMALL LETTER U WITH DIAERESIS Unicode: U+00FC, UTF-8: C3 BC

ö Unicode: U+006F U+0308, UTF-8: 6F CC 88

ö LATIN SMALL LETTER O WITH DIAERESIS Unicode: U+00F6, UTF-8: C3 B6

Mein besonderer Dank gilt Martin für den entscheidenden Tipp, der mir nur eine einzige lange Nacht einbrachte und zwar auch nur um die Problemlösung hier niederzuschreiben.

This article is my 7th oldest. It is 363 words long.