Umlautdomain und Punycode: was hinter klimageräte.de wirklich steckt

Umlautdomain und Punycode: was hinter klimageräte.de wirklich steckt

Deutsche Umlautdomains wie klimageräte.de gibt es seit 2004. Technisch ist das kein Zufall, sondern ein Aufsatz: Das Domain Name System kennt bis heute nur ASCII, deshalb wird jede Umlautdomain vor dem Speichern im DNS in eine ASCII-Form umgewandelt. Aus klimageräte.de wird xn--klimagerte-x5a.de. Das Verfahren heißt Punycode, der offizielle Sammelbegriff für solche Domains ist IDN - Internationalized Domain Name.

Der Konverter unten macht beide Richtungen: Umlautform in Punycode und zurück. Danach folgt die Einordnung - warum es das gibt, wo es hakt und was du bei Registrierung, E-Mail und SEO beachten musst.

Konverter: Umlautdomain und Punycode umwandeln

IDN- und Punycode-Konverter

Gib die Domain in einer der beiden Formen ein - das andere Feld befüllt sich automatisch.

Was ist eine Umlautdomain?

Eine Umlautdomain ist eine Sonderform der IDN, eingeschränkt auf die deutschen Sonderzeichen ä, ö, ü und ß. Sie wurden von der DENIC am 1. März 2004 für die Registrierung freigegeben. Vorher waren Domains auf reines ASCII beschränkt - also die 26 Buchstaben, Ziffern und den Bindestrich. Wer bücher.de haben wollte, bekam buecher.de.

Rein optisch sieht die Umlautform aus wie jede andere Domain: klimageräte.de tippt sich im Browser wie jede .de. Unter der Haube läuft aber vor jeder DNS-Anfrage eine Umwandlung: Der Browser wandelt klimageräte.de in xn--klimagerte-x5a.de um und schickt diese ASCII-Version ans DNS. Der Rest des Systems bleibt so, wie er seit den 1980ern ist.

Wie funktioniert Punycode?

Punycode ist in RFC 3492 definiert. Der Algorithmus macht drei Dinge:

  1. Basic-Zeichen extrahieren. Alle ASCII-Zeichen der Domain werden erst mal so übernommen: aus klimageräte wird klimagerte. Das ä fällt raus.
  2. Non-Basic-Zeichen kodieren. Danach folgt ein Bindestrich als Trenner, dann eine kompakte Kodierung, die zwei Informationen speichert: welches Unicode-Zeichen fehlt und an welcher Position es eingefügt gehört. Für klimageräte ergibt das xhb.
  3. Präfix davor. Ein Punycode-Label bekommt das ACE-Präfix xn-- vorangestellt, damit der Rest des Systems weiß: hier steckt eine Umwandlung dahinter. ACE steht für ASCII Compatible Encoding.

Am Ende steht xn--klimagerte-x5a. Zusammen mit der TLD ergibt das xn--klimagerte-x5a.de. Die TLD selbst - hier .de - wird nicht kodiert, weil sie schon ASCII ist.

Das Praktische an Punycode: Der Algorithmus ist verlustfrei und deterministisch. Aus jeder Unicode-Domain wird genau eine Punycode-Form und wieder zurück. Was in einem Editor als klimageräte.de steht und was im DNS als xn--klimagerte-x5a.de gespeichert ist, sind exakt dieselbe Adresse.

xn-- als Erkennungszeichen

Das Präfix xn-- ist der klarste Hinweis darauf, dass eine Domain ursprünglich Sonderzeichen enthält. Vier Zeichen, unverwechselbar, tauchen in normalen ASCII-Domains praktisch nie auf. Wo immer du xn-- in einer URL siehst, gehört sie technisch zu einer Umlautdomain oder allgemeiner zu einer IDN.

Auch pro Label. In einer mehrteiligen Domain wie shop.köln.beispiel.de würde nur das eine Label mit Umlaut kodiert werden: shop.xn--kln-sna.beispiel.de. Die restlichen Labels bleiben unverändert.

IDN und die Erweiterung IDNA2008

Der Standard hat zwei Versionen: IDNA2003 (die ursprüngliche Fassung) und IDNA2008 (Update von 2010). Der Unterschied ist im Alltag zu spüren, wenn du das deutsche ß registrieren willst. Unter IDNA2003 wurde straße.de vor der Kodierung zu strasse.de normalisiert, das ß fiel raus. Seit IDNA2008 bleibt das ß erhalten und wird zu xn--strae-oqa.de.

Für die DENIC ist der Praxis-Umstieg 2010 passiert: Seitdem gibt es echte ß-Domains, davor gab es sie nicht. Ähnliches gilt für das griechische Endsigma. Alte Software, die noch nach IDNA2003 arbeitet, kann bei diesen Zeichen unerwartete Ergebnisse liefern - was bei Legacy-Systemen der häufigste IDN-Bug ist.

Registrierung bei der DENIC

Die DENIC lässt seit 2004 diese Zusatzzeichen für .de-Domains zu: ä, ö, ü, ß plus 89 weitere Zeichen aus europäischen Sprachen (unter anderem á, é, í, ó, ú, à, è, ç, ñ, ø, æ, œ). Registrieren lässt sich eine Umlautdomain bei jedem gängigen Provider genauso wie eine normale .de. Im Preis gibt es keinen Unterschied.

Was du wissen solltest:

  • Doppelregistrierung ist üblich. Wer klimageräte.de registriert, sichert sich in aller Regel auch klimagerate.de. Zum einen um Tippfehler abzufangen, zum anderen für die Zeiten, in denen ein Kunde den Namen ohne Umlaut in eine Suchmaschine tippt.
  • Punycode-Form ist reserviert. Registrierst du klimageräte.de, gehört dir automatisch auch die ASCII-Form xn--klimagerte-x5a.de. Beide zeigen auf denselben Eintrag im DNS - eine separate Registrierung ist nicht möglich.
  • WHOIS zeigt Punycode. In den WHOIS-Antworten und in den offiziellen DENIC-Datenbanken taucht die Domain nur in Punycode-Form auf. Das ist ein Zeichen, dass der Backend-Betrieb rein ASCII bleibt.

E-Mail-Adressen mit Umlaut

Hier liegt der häufigste Stolperstein. Umlautdomains funktionieren technisch für E-Mail, aber viele Systeme können mit ihnen bis heute schlecht umgehen. Formulare, die auf strenge E-Mail-Regex prüfen, akzeptieren info@klimageräte.de oft nicht. Alte Mail-Clients senden aus - kommen dann aber am Ziel als kaputte Absender-Adresse an, weil irgendwo unterwegs die Umwandlung nicht sauber lief.

Faustregeln:

  • Wer eine Umlautdomain für E-Mail nutzt, richtet fast immer parallel eine ASCII-Domain für die Postfächer ein und leitet nur die Webseite auf die Umlautform um.
  • Vollständig internationalisierte Mail (SMTPUTF8, RFC 6531) wird nicht überall unterstützt. Der Absenderteil vor dem @ - also müller@... - ist noch problematischer als der Domain-Teil.
  • Wenn du Kundenkommunikation planst, teste vorher: Sendet der eigene Provider ordentlich? Kommt die Mail bei Gmail, Outlook.com, GMX ohne Warnungen an? Bounces sind bei Umlaut-Adressen nicht selten.

SEO: was Google mit Umlautdomains macht

Google behandelt Umlautdomain und Punycode-Form als identisch. Beide URLs zeigen auf denselben Inhalt, es gibt keinen Duplicate-Content-Konflikt zwischen klimageräte.de und xn--klimagerte-x5a.de. In den Suchergebnissen wird meistens die Umlautform angezeigt, weil sie besser lesbar ist.

Aus reiner Ranking-Sicht gibt es weder Bonus noch Malus. Was du beachten solltest:

  1. Kanonische URL festlegen. Setze das <link rel="canonical"> und alle internen Verlinkungen auf eine Form. Meistens die Umlautform, weil sie für Menschen besser lesbar ist. Der Browser rechnet sie ohnehin in Punycode um, bevor sie ans DNS geht.
  2. Property in der GSC anlegen. Google Search Console kennt IDNs. Du kannst wahlweise die Umlautform eintragen (die Konsole zeigt sie an), intern wird auf die Punycode-Form gemappt.
  3. Backlinks in ASCII. Viele externe Systeme (Foren, Wikis, alte CMS) zeigen und speichern nur die xn---Form. Beim Aufbauen von Backlinks kann es sein, dass die Punycode-Version verlinkt wird. SEO-technisch ist das egal - Google konsolidiert beide Formen.
  4. hreflang und Sitemaps. In XML-Sitemaps und im hreflang funktioniert beides. Konsistenz ist wichtiger als die Wahl der Form.

Wer aus einer Umlautdomain auf eine ASCII-Variante umziehen will oder umgekehrt: das ist ein klassischer Domain-Umzug mit 301-Weiterleitung, Change of Address in der GSC, dem üblichen Programm.

Sicherheit: Homograph-Angriffe

Der eleganteste Angriff mit IDN heißt Homograph-Angriff. Er nutzt aus, dass viele Unicode-Zeichen visuell identisch aussehen. Das kyrillische а (U+0430) sieht in vielen Schriftarten genauso aus wie das lateinische a (U+0061). Wer eine Domain wie аpple.com registriert - mit kyrillischem a - kann sie in Phishing-Mails einsetzen, und ohne genaues Hinschauen fällt der Betrug nicht auf.

Zwei Schutzmechanismen greifen:

  • Browser zeigen bei gemischten Schriften Punycode. Firefox und Chrome haben eine Heuristik: Wenn eine Domain Zeichen aus mehreren Schriftsystemen mischt oder wenn kein passendes Sprachprofil zu dem Zeichensatz passt, wird statt der Unicode-Form die xn---Version in der Adressleiste angezeigt. Dann sieht der Nutzer sofort, dass hier etwas nicht stimmt.
  • Registries limitieren. Die DENIC lässt für .de-Domains nur einen definierten Zeichensatz zu (deutsche Umlaute plus westeuropäische Diakritika). Kyrillisch ist ausgeschlossen. Das bringt gemischt-lateinisch-kyrillische Fake-Domains unter .de nicht durch. Andere TLDs sind großzügiger.

Als Nutzer helfen zwei Angewohnheiten: Immer auf das xn---Präfix in der Adressleiste achten - unerwartete Punycode-Anzeige ist ein Warnsignal. Bei sensiblen Aktionen (Login, Zahlung) die Domain händisch eintippen statt Links aus Mails oder Nachrichten anzuklicken.

Praktische Beispiele

Ein paar bekannte deutsche Umlautdomains und ihre Punycode-Form:

Umlautform Punycode-Form
klimageräte.dexn--klimagerte-x5a.de
müller.dexn--mller-kva.de
bücher.dexn--bcher-kva.de
straße.dexn--strae-oqa.de
österreich.atxn--sterreich-z7a.at
café.frxn--caf-dma.fr

Auffällig: Die kodierte Endung nach dem Trenn-Bindestrich ist immer relativ kurz. Auch bei mehreren Umlauten in einem Label. Der Punycode-Algorithmus komprimiert die Position und den Zeichentyp in wenigen Zeichen aus dem Alphabet a-z und 0-9.

Umlaut auf der Kommandozeile

Wenn du mit curl, wget, dig oder anderen CLI-Tools arbeitest, kann es je nach Terminal-Encoding zu Problemen kommen. Die sichere Variante ist immer die Punycode-Form:

curl -I https://xn--klimagerte-x5a.de/
dig xn--klimagerte-x5a.de +short
whois xn--klimagerte-x5a.de

Für Python steht domain.encode('idna') zur Verfügung. Für PHP idn_to_ascii() (Bestandteil der intl-Erweiterung, in fast allen Hoster-Umgebungen aktiv). Beide arbeiten sauber IDNA2008-konform, wenn die Bibliothek aktuell ist.

FAQ

Ist eine Umlautdomain SEO-technisch schlechter als eine ASCII-Domain?

Nein. Google behandelt beide gleich. Ranking-Faktoren wie Backlinks, Content-Qualität und User-Signale zählen unabhängig von der Domain-Form. In den SERPs wird meistens die lesbare Umlautform angezeigt.

Muss ich immer beide Formen registrieren, Umlaut und ASCII?

Die Punycode-Form bekommst du automatisch mit der Umlautform - eine parallele Registrierung ist nicht möglich. Zusätzlich sinnvoll ist die Umlaut-freie Schreibweise ohne Punycode, also klimagerate.de statt klimageräte.de. Damit fängst du Tippfehler und Nutzer ab, die den Umlaut nicht eingeben können.

Kann ich mit Umlautdomains SSL-Zertifikate ausstellen?

Ja. Alle größeren Zertifizierungsstellen (Let's Encrypt, Sectigo, DigiCert) unterstützen IDNs. Das Zertifikat wird auf die Punycode-Form ausgestellt, gilt aber technisch für beide Formen. Beim Beantragen kannst du die Umlautform oder die xn---Form angeben - die Tools rechnen um.

Warum sieht die Adressleiste manchmal die Umlaut- und manchmal die Punycode-Form?

Das ist ein Sicherheitsfeature. Der Browser zeigt Punycode, wenn er die Zeichensatz-Mischung als potenziell irreführend einstuft (Homograph-Angriff). Bei einer reinen deutschen Umlautdomain unter .de zeigt er die Umlautform - bei einer Domain mit kyrillischen Zeichen unter .com die Punycode-Form.

Kann ich Emojis in eine Domain packen?

Grundsätzlich ja - Punycode kann alle Unicode-Zeichen kodieren. In der Praxis lassen nur wenige TLDs Emoji-Domains zu (zum Beispiel .ws, .to). Bei .de, .com und den meisten anderen sind Emojis explizit ausgeschlossen. Auch technisch machen sie mehr Probleme als Nutzen, weil viele Systeme mit ihnen nicht klarkommen.

Was passiert, wenn ich eine Umlautdomain in einen älteren Browser eintippe?

Alle aktuellen Browser (Chrome, Firefox, Safari, Edge, Opera) rechnen die Umlautform automatisch in Punycode um. Der Internet Explorer ab Version 7 konnte das auch. In sehr alten Systemen kann die Umwandlung schiefgehen - dort funktioniert die direkt eingegebene Punycode-Form xn--... immer.

Wie unterscheidet sich Umlautdomain von IDN?

Umlautdomain ist der deutsche Begriff und meint IDNs mit ä, ö, ü, ß. IDN (Internationalized Domain Name) ist der Oberbegriff für alle Domains mit Nicht-ASCII-Zeichen weltweit - also auch chinesische, arabische, kyrillische Domains. Punycode ist das technische Kodierungs-Verfahren, das aus beiden eine ASCII-kompatible Form macht.

Quellen

Verwandte Artikel