Allgemeine Fragen und Antworten
Global-Whois
Neue TLDs
.de-Domains
.eu-Domains
Generische Domains
Gesponsorte Domains
Länderdomains
Sonderformen
ENUM
Domain-Typen
Übersicht
Kunde werden
Fragen und Antworten
Formulare generieren
Dokumentation
Domain-Registrierungs-System
Knipp RRI Toolkit
Unified Registry Announcements
Open Source Software
Fragen und Antworten
Teilnahmeantrag
Premium-Partner-Programm (P3)
Fragen zu Weiterleitungen
Leistungspaket
Internationalisierte Domainnamen
Fragen und Antworten
Technische Hintergründe
Länderübersicht
Arabisch
Armenisch
Griechisch
Hebräisch
Kyrillisch
Latin
Zeichensätze
Konvertieren
Muster-Website
Preisübersicht
Glossar
Support
Domain-Management
ironDNS
TANGO REGISTRY SERVICES

Grünzeug und Kochrezepte aus der Küche
für Buchstabensuppen

Sonderzeichen und Umlaute, wie der Buchstabe »ü« in »grün.info«, sind inzwischen bei immer mehr Top-Level-Domains möglich geworden.
Auf dieser Seite geben wir einen kurzen Einblick in die zugrundeliegende Technik der Internationalisierten Domainnamen. Für die Nutzung der Domainnamen müssen Sie in der Regel nur moderne Programme, wie die Browser Mozilla 1.4 oder Netscape 7.1, verwenden. Dort ist alles bereits vorkonfiguriert.
Einige Browser müssen sich noch entwickeln

Browser

Um Domainnamen mit Umlauten verwenden zu können, muß Ihr Browser die Konvertierung zu Punycode unterstützen. (Was Punycode ist, wird weiter unten auf dieser Seite erklärt.) Im Gegensatz zu den oben genannten Browsern verfügt der Microsoft Internet Explorer zur Zeit noch nicht über diese Fähigkeit, sondern muß mit Zusatzsoftware, sogenannten Plugins, aufgerüstet werden. Das bekannteste ist VeriSigns I-Nav-Plugin.
Testen Sie einfach, ob bei Ihnen alles konfiguriert ist. Folgen Sie unserem Beispiellink zur Testseite grün.knipp.de. Wenn sich eine neues Fenster mit einer grünen Musterseite öffnet, sind Sie startklar, um Internationalisierte Domainnamen zu nutzen.
Falls die Testseite in Ihrem Browser nicht angezeigt wird, können Sie den Domainnamen »grün.knipp.de« auch selbst in Punycode umwandeln, indem Sie unser Konvertierungs-Tool verwenden. Den so ermittelten Zeichencode können Sie dann einfach in die Adresszeile ihres Browsers kopieren und so die Seite laden.
Bei der Einführung von Umlauten und sonstigen Sonderzeichen geht es hier ausschließlich um Domainnamen. Die Inhalte der Websites können schon immer Sonderzeichen darstellen. Knipp hat beispielsweise für einen Kunden die japanische Website »Germany Shop« erstellt, auf der typisch deutsche Produkte in Japan vertrieben wurden.
Am Anfang waren nur ASCII-Zeichen

Am Anfang

Das Internet fand seine erste Verbreitung in den USA. Die englische Sprache verwendet kaum Sonderzeichen. Daher wurden in den Anfängen auch die komplette technische Infrastruktur sowie das Domainnamensystem nur auf die Buchstaben »a« bis »z«, die Ziffern »0« bis »9« sowie den Bindestrich aufgebaut. Diese Domainnamen werden häufig auch als LDH-Namen bezeichnet (Letter, Digits, Hyphen).
Um diese Beschränkung aufzuheben, müßte man nun alle Geräte und Software, inklusive der Vermittlungsstellen für beispielsweise E-Mails, WWW-Proxys, Firewalls ersetzen. Das ist sehr aufwendig, teuer und praktisch unmöglich.
Power On für Erweiterungen

Die Lösung

Wissenschaftler, darunter Techniker, Informatiker und auch Linguisten, haben daher eine andere Lösung ersonnen. Nicht die komplette Infrastruktur muß getauscht werden, sondern nur die Endgeräte, genauer die »Endsoftware«. Mit anderen Worten, nur der Browser oder das E-Mail-Programm muß Sonderzeichen verstehen (fachchinesisch: IDN-aware sein).
Die Endsoftware wandelt dabei jeden Domainnamen mit Sonderzeichen eindeutig in einen neuen Namen um, der jedoch wieder nur aus den bislang erlaubten Zeichen »a« bis »z«, den Ziffern »0« bis »9« sowie der Bindestrich besteht.
Welche Zeichen weltweit überhaupt definiert sind, wird vom Unicode Konsortium festgelegt. Zur Zeit sind das etwa 70.000 Zeichen. Aus dieser großen Fülle können die Registries dann eine Teilmenge für die jeweilige Top-Level-Domain bestimmen. So hat Afilias, die Registry für .info-Domains, zunächst nur die Umlaute »ä«, »ö«, »ü« sowie das »ß« zugelassen.
Den Hinterausgang genutzt, um Probleme zu umgehen

Punycode

Die in der Endsoftware aufgenommene Umwandlung wird auch Punycode-Wandlung genannt. Sie ist in einer Art Norm im RFC 3492 festgelegt. Es wurde Wert darauf gelegt, daß man nach der Kodierung den Originalnamen noch halbwegs erkennen kann. Beispiele:
Originalname
Punycode-Form
müller.de
xn--mller-kva.de
müller-bier.de
xn--mller-bier-9db.de
rotkäppchen.info
xn--rotkppchen-t5a.info
äöü-buchstaben.net
xn---buchstaben-k8a8u4c.net
xn--4ca0bs.net
café.net
xn--caf-dma.net
schloßallee.info
schlossallee.info
 
Auf unserer Konvertierungsseite können Sie selbst weitere Umwandlungen vornehmen. Übrigens kann aus einer Punycode-Form eindeutig auch wieder die Originalschreibweise rück-konvertiert werden.
Bei der Konvertierung wird übrigens jede Zeichenkette zwischen den Punkten einzeln konvertiert. So wird die Subleveldomain »käse.müller.info« zu »xn--kse-qla.xn--mller-kva.info« gewandelt. Man spricht dabei auch von einzelner Label-Wandlung.
Jedes Punycode-Label besteht dabei aus bis zu 3 Teilen:
Teil
Beispiel
Erklärung
Präfix
xn--
Der Präfix besteht immer aus dieser Zeichenkette. Daran kann man erkennen, daß das Label eine Punycode-Form ist. Viele Registries haben deshalb die normale Registrierung von Domainnamen ausgeschlossen, die mit dieser, für den Alltag auch sicherlich unnützen Zeichenkette, beginnen.
Wortstamm
mller
Das sind alle Zeichen des Labels, die übrig bleiben, wenn man die Sonderzeichen wegstreicht. Wenn im Originalnamen keine herkömmlichen Zeichen vorhanden sind, bleibt dieser Teil leer, wie im obigen Beispiel ersichtlich.
Kodierung
-kva
Legt fest, welche Sonderzeichen wo im Originalnamen vorhanden sind. Die Kodierung erfolgt nach einer sehr komplizierten Formel. Wenn kein Wortstamm vorhanden ist, dann entfällt sogar das Trennzeichen »-«, welches normalerweise den Wortstamm und die Kodierung trennt.
Äpfel statt Aepfel

Die Länge ist doch entscheidend

In den technischen Richtlinien für das Domainnamensystem ist festgelegt, daß jedes Label maximal 63 Zeichen lang sein kann. In der Praxis spielt diese Beschränkung bislang keine große Rolle.
Da in aller Regel die Punycode-Form eines Domainnamens länger ist als die Originalform, sollte man diesen Umstand bei der Auswahl eines Namens immer berücksichtigen, um die Länge von 63 Zeichen nicht zu überschreiten. Je nach Anzahl der Sonderzeichen kann sich die Länge der Punycode-Form leicht verdoppeln.
Sie ist übrigens nicht einfach vorhersehbar, wie die nachfolgenden Beispiele zeigen. Trotz gleicher Länge des Originalnames können sich unterschiedliche Punycode-Längen ergeben:
Original
Länge
Punycode
Länge
mücke
5
xn--mcke-0ra
12
äpfel
5
xn--pfel-koa
12
ölscheich
9
xn--lscheich-m4a
16
übeltäter
9
xn--beltter-8wa5s
17
Sonderbare Zeichen

Sonderfall ß

Der Buchstabe »ß« nimmt bei der Umwandlung eine Sonderrolle ein. Er führt nämlich nicht zu einem Namen, der mit dem Präfix »xn--« anfängt. Vielmehr wird ein »ß« einfach in Doppel-S »ss« gewandelt. Siehe auch das Beispiel oben in der Tabelle.
Das liegt darin begründet, daß ein »ß« sprachwissenschaftlich nicht in die Kategorie Sonderzeichen, sondern in die Kategorie Ligatur fällt. Ligaturen sind Zeichen, die aus mehreren normalen Zeichen verschmolzen sind. Ein »ß« ist aus »s« und »z« zusammengsetzt. Weniger bekannte und heute kaum noch bekannte Ligaturen sind »fi« und »ffi«.
Manche Früchte hängen eng beieinander: Bundles

Varianten, Bundles und Sprachen

Neben der Konvertierung der Namen gibt es noch ein zweites Problem zu lösen. Unterschiedliche Schreibweisen von Worten meinen trotzdem den selben Begriff. Wenn ein normaler Buchstabe »e« eine Variante von »è« ist, dann kann man beispielsweise im Französischen den Schweizer Domainnamen der Stadt Genf auf zwei Arten schreiben:
  • geneve.ch
  • genève.ch
Daher muß die jeweilige Registry festlegen, wie sie mit solchen Varianten umgeht. Prinzipiell gibt es dabei verschiedenen Möglichkeiten:
  • Wenn ein Registrant eine Variante registriert hat, dann hat er gleichzeitig alle anderen Varianten auch registriert.
  • Wenn ein Registrant eine Variante registriert hat, so sind für ihn alle weiteren Varianten reserviert. Will er die anderen Varianten auch nutzen, muß er aber für jeden Namen erneut bezahlen.
  • Nur jeweils die exakt registrierte Variante ist für den Registranten belegt. Die anderen Varianten können von anderen Registranten registriert werden.
Die automatische Registrierung von weiteren Varianten durch die Registrierung einer Variante wird auch mit »Bundle« (Bündel) bezeichnet.
Da die Bündelung hochgradig von der Sprache abhängt, ist bei der Registrierung von Internationalisierten Domainnamen immer auch die Sprache mit anzugeben. Das ist international so vorgeschrieben. Bei .de-Domains wird es keine Bündel geben. Daher wird die Sprache dort immer automatisch auf »ger« beziehungsweise »de« vorbelegt. Bei Domains aus dem sogenannten CJK-Bereich (China, Japan, Korea) ist das Bündeln aufgrund der hohen Zahl von Schriftzeichen mit gleichzeitiger und unterschiedlicher Nutzung in unterschiedlichen Sprachen ein recht komplexes Thema und führt immer wieder zu juristischen Auseinandersetzungen.
Dokumente
Software
Impressum|Datenschutzerklärung
drucken (c) 1996-2012 Knipp Medien und Kommunikation GmbH|webmaster@knipp.de