Wissenschaftler, darunter Techniker, Informatiker und auch Linguisten,
haben daher eine andere Lösung ersonnen.
Nicht die komplette Infrastruktur muß getauscht werden, sondern nur die
Endgeräte, genauer die »Endsoftware«. Mit anderen Worten, nur der Browser
oder das E-Mail-Programm muß Sonderzeichen verstehen (fachchinesisch: IDN-aware sein).
Die Endsoftware wandelt dabei jeden Domainnamen mit Sonderzeichen
eindeutig in einen neuen Namen um, der jedoch wieder nur aus den bislang
erlaubten Zeichen »a« bis »z«,
den Ziffern »0« bis »9« sowie der Bindestrich besteht.
Welche Zeichen weltweit überhaupt definiert sind, wird
vom
Unicode Konsortium
festgelegt. Zur Zeit sind das etwa 70.000 Zeichen.
Aus dieser großen Fülle können die Registries dann eine Teilmenge für die
jeweilige Top-Level-Domain bestimmen. So hat Afilias, die Registry für
.info-Domains, zunächst nur die Umlaute
»ä«,
»ö«,
»ü«
sowie das
»ß«
zugelassen.
 |
Den Hinterausgang genutzt, um Probleme zu umgehen
|

Die in der Endsoftware aufgenommene Umwandlung wird auch Punycode-Wandlung genannt.
Sie ist in einer
Art Norm im
RFC 3492
festgelegt. Es wurde Wert darauf gelegt, daß man nach der Kodierung
den Originalnamen noch halbwegs erkennen kann. Beispiele:
Originalname |
Punycode-Form |
müller.de |
xn--mller-kva.de |
müller-bier.de |
xn--mller-bier-9db.de |
rotkäppchen.info |
xn--rotkppchen-t5a.info |
äöü-buchstaben.net |
xn---buchstaben-k8a8u4c.net |
|
xn--4ca0bs.net |
café.net |
xn--caf-dma.net |
|
schlossallee.info |
Auf unserer
Konvertierungsseite
können Sie selbst weitere Umwandlungen vornehmen. Übrigens kann
aus einer Punycode-Form eindeutig auch wieder die Originalschreibweise
rück-konvertiert werden.
Bei der Konvertierung wird übrigens jede Zeichenkette zwischen
den Punkten einzeln konvertiert. So wird die Subleveldomain
»käse.müller.info« zu
»xn--kse-qla.xn--mller-kva.info«
gewandelt. Man spricht dabei auch von einzelner Label-Wandlung.
Jedes Punycode-Label besteht dabei aus bis zu 3 Teilen:
Teil |
Beispiel |
Erklärung |
Präfix |
xn-- |
Der Präfix besteht immer aus dieser Zeichenkette.
Daran kann man erkennen, daß das Label eine Punycode-Form
ist. Viele Registries haben deshalb die normale Registrierung
von Domainnamen ausgeschlossen, die mit dieser, für den Alltag
auch sicherlich unnützen Zeichenkette, beginnen.
|
Wortstamm |
mller |
Das sind alle Zeichen des Labels, die übrig bleiben,
wenn man die Sonderzeichen wegstreicht. Wenn im Originalnamen
keine herkömmlichen Zeichen vorhanden sind, bleibt dieser
Teil leer, wie im
obigen Beispiel
ersichtlich.
|
Kodierung |
-kva |
Legt fest, welche Sonderzeichen wo im Originalnamen
vorhanden sind. Die Kodierung erfolgt nach einer sehr
komplizierten Formel. Wenn kein Wortstamm vorhanden
ist, dann entfällt sogar das Trennzeichen »-«, welches
normalerweise den Wortstamm und die Kodierung trennt.
|
 |
Äpfel statt Aepfel
|

In den technischen Richtlinien für das Domainnamensystem ist festgelegt,
daß jedes Label maximal 63 Zeichen lang sein kann. In der Praxis spielt
diese Beschränkung bislang keine große Rolle.
Da in aller Regel die Punycode-Form eines Domainnamens länger ist
als die Originalform, sollte man diesen Umstand bei der Auswahl
eines Namens immer berücksichtigen, um die Länge von 63 Zeichen
nicht zu überschreiten. Je nach Anzahl der Sonderzeichen kann sich die Länge
der Punycode-Form leicht verdoppeln.
Sie ist übrigens
nicht einfach vorhersehbar, wie die nachfolgenden Beispiele zeigen. Trotz
gleicher Länge des Originalnames können sich unterschiedliche
Punycode-Längen ergeben:
Original |
Länge |
Punycode |
Länge |
mücke |
5 |
xn--mcke-0ra |
12 |
äpfel |
5 |
xn--pfel-koa |
12 |
ölscheich |
9 |
xn--lscheich-m4a |
16 |
übeltäter |
9 |
xn--beltter-8wa5s |
17 |
 |
Sonderbare Zeichen
|

Der Buchstabe »ß« nimmt bei der Umwandlung eine Sonderrolle ein.
Er führt nämlich nicht zu einem Namen, der mit dem Präfix
»xn--« anfängt. Vielmehr wird ein »ß« einfach in Doppel-S »ss«
gewandelt. Siehe auch das
Beispiel
oben in der Tabelle.
Das liegt darin begründet, daß ein »ß« sprachwissenschaftlich
nicht in die Kategorie Sonderzeichen, sondern in die Kategorie Ligatur fällt.
Ligaturen sind Zeichen, die aus mehreren normalen Zeichen verschmolzen sind.
Ein »ß« ist aus »s« und »z« zusammengsetzt. Weniger bekannte und heute
kaum noch bekannte Ligaturen sind »fi« und »ffi«.
 |
Manche Früchte hängen eng beieinander: Bundles
|

Neben der Konvertierung der Namen gibt es noch ein zweites Problem zu lösen.
Unterschiedliche Schreibweisen von Worten meinen trotzdem den selben Begriff.
Wenn ein normaler Buchstabe »e« eine Variante von »è« ist, dann kann man
beispielsweise
im Französischen den Schweizer Domainnamen der Stadt Genf auf zwei Arten schreiben:
Daher muß die jeweilige Registry festlegen, wie sie mit solchen Varianten
umgeht. Prinzipiell gibt es dabei verschiedenen Möglichkeiten:
- Wenn ein Registrant eine Variante registriert hat,
dann hat er gleichzeitig alle anderen Varianten auch registriert.
- Wenn ein Registrant eine Variante registriert hat,
so sind für ihn alle weiteren Varianten reserviert. Will er die
anderen Varianten auch nutzen, muß er aber für jeden Namen erneut
bezahlen.
- Nur jeweils die exakt registrierte Variante ist für den
Registranten belegt. Die anderen Varianten können von anderen
Registranten registriert werden.
Die automatische Registrierung von weiteren Varianten durch die Registrierung
einer Variante wird auch mit »Bundle« (Bündel) bezeichnet.
Da die Bündelung hochgradig von der Sprache abhängt, ist bei der Registrierung
von Internationalisierten Domainnamen immer auch die Sprache mit anzugeben.
Das ist international so vorgeschrieben.
Bei .de-Domains wird es keine Bündel geben. Daher wird die Sprache dort immer
automatisch auf »ger« beziehungsweise »de« vorbelegt.
Bei Domains aus dem sogenannten CJK-Bereich (China, Japan, Korea) ist das Bündeln
aufgrund der hohen Zahl von Schriftzeichen mit gleichzeitiger und
unterschiedlicher Nutzung in unterschiedlichen Sprachen
ein recht komplexes Thema
und führt immer wieder zu juristischen Auseinandersetzungen.
|