Diese Zusammenstellung listet alle Fragen auf,
die uns in den letzten Monaten von Kunden
zum Thema der Internationalisierten Domainnamen gestellt
wurden. Da sich das Thema rasant weiterentwickelt, aktualisieren wir den
Fragenkatalog ständig.
Darunter versteht man Domainnamen, die auch »Sonderzeichen« enthalten.
Was für uns normal ist, ist für andere ein Rätsel: Umlaute wie »ä«,
»ö« und »ü« zum Beispiel, sind für andere nichts mehr als
Hieroglyphen, weil diese
Zeichen in deren Alphabet nicht vorkommen.
Vor der IDN-Einführung waren in Domainnamen nur die Buchstaben »a« bis »z«,
die Ziffern »0« bis »9« sowie der Bindestrich erlaubt. Das hat
vornehmlich historische Gründe. Mittlerweile erweitern immer mehr Registries
den erlaubten Zeichensatz, wobei Art und Anzahl der zusäzlichen Zeichen
stark variieren. Wir haben die IDN-Erweiterungen für die verschiedenen
Top-Level-Domains für Sie in
einer Übersicht zusammengefaßt.
Auf Ihrem Computer lassen sich auch heute schon Sonderzeichen in die
Eingabefelder von Internetadressen eingeben. Allerdings kennt die
Infrastruktur, das komplette Domainnamesystem, diese Zeichen noch nicht.
Daher werden diese z.T. ignoriert oder führen sogar zu Fehlverhalten.
Bislang muß beispielsweise die Firma »Müller-Bier« den Domainnamen
»mueller-bier.de« verwenden. Da aber Namensrechte immer auf die wirkliche
Zeichenkette mit dem Buchstaben »Ü« registriert werden, führt die
vereinfachte Umlautschreibung immer wieder zu Auseinandersetzungen.
Darüber hinaus ist es in anderen Sprachen nicht immer möglich, Umlaute
durch andere Zeichen zu ersetzen oder Akzente einfach wegzulassen, da sich
dann die Bedeutung der Worte ändert. Beispielsweise bedeutet im Türkischen
das Wort »Sürat« Schnelligkeit, Geschwindigkeit.
Das Wort »Surat« hingegen (also ohne die Ü-Punkte) bedeutet Gesicht.
Wieder andere Sprachen haben teilweise gar nicht die Möglichkeit, Sonderzeichen
zu umschreiben und sind somit in der Nutzung des Internets eingeschränkt. Dabei
denke man nur an den asiatischen Raum, bei dem oft tausende von Zeichen
vorhanden sind.
Die überwiegende Mehrheit, rund 3/4 der Internetnutzer,
stammen aus dem Nicht-Amerikanischen Raum.
Auch diese Nutzer sollen in ihrer natürlichen Sprache Domainnamen
registrieren können.
Die Verwendung ist nur ab der zweiten Ebene möglich. In »köln.de«
kommt das »ö« links vom ersten Punkt, also in der zweiten Ebene, vor.
Endungen, sogenannte
Top-Level-Domains (in unserem Beispiel also »de«), werden in absehbarer
Zeit noch nicht internationalisiert.
Domainnamen werden nicht nur beim Surfen verwendet,
sondern auch bei vielen anderen Diensten und Programmen.
Auch E-Mail-Programme, Nameserver usw. sind
davon betroffen.
Zum Teil sind diese Dienste
für den normalen Benutzer gar nicht sichtbar und laufen still
im Hintergrund ab, sind aber für das
Internet lebensnotwendig.
All diese Dinge müssen umgestellt werden. Das erzeugt einen enorm hohen
Umstellungsaufwand. Daher hat sich die Internetgemeinschaft auch auf ein
bestimmtes technisches Verfahren geeinigt, was zwar einige Nachteile
aufweist, aber leichter umsetzbar ist.
Mit der Zusammenstellung von weltweit allen Zeichen beschäftigt sich das
Unicode Konsortium.
Je nach Zählweise kommt man auf etwa 70.000 unterschiedliche Zeichen.
Zeichen können dabei
Buchstaben oder auch ganze Worte sein, die in einem Zeichen dargestellt sind.
Wenn man schon »alle« Zeichen verwendet, also beispielsweise auch arabische, dann
ist es eigentlich unumgänglich, auch die Schreibrichtung zu berücksichtigen.
Nicht wenige Sprachen werden nämlich von rechts nach links geschrieben. Das
stellt ein nicht zu unterschätzendes Problem dar.
Großbuchstaben werden auch in Zukunft auf die entsprechenden
Kleinbuchstaben abgebildet, so daß zwischen Groß- und Kleinschreibung
nicht unterschieden wird.
Häufig werden Zeichen in unterschiedlichen Alphabeten verwendet. Auch das kann,
zumindest beim normalen Internetbenutzer, zu Verwirrung führen. Beispielsweise
hat ein großer amerikanischer Internetprovider den Domainnamen »AOL.COM« (häufig
bewußt groß geschrieben).
Die optisch völlig gleich aussehenden Buchstaben werden auch im griechischen
Alphabet verwendet, haben also im UNICODE eine andere Kodierung und somit
ist auch ein anderer Domainname registriert. Benutzer werden die Begriffe
aber häufig verwechseln.
Diese Verwechslungsgefahr kann natürlich leicht mißbraucht werden, um
beispielsweise Websites zu kopieren. Wenn auf der Site auch noch
ein Shop mit Kreditkartenzahlung vorhanden ist, kann dieser leicht zum Sammeln
von Kreditkartennummern mißbraucht werden.
Hier kommt es häufig vor, daß ein Wort mit unterschiedlichen Zeichen (»Grafiken«)
dargestellt
werden kann. Streng genommen müßten dann alle unterschiedlichen Grafiken
registriert werden. Das können aber z.T. bis zu 20 Stück sein und kann somit
schon von den Registrierungskosten teuer werden.
Die Registries gehen daher häufig den Weg, daß die Registrierung einer
Variante zur Blockade der anderen Varianten für andere Registranten wird.
Auf Wunsch kann der erste Registrant dann freiwillig die anderen
Varianten zusätzlich registrieren.
Bei den Internetbrowsern Mozilla 1.4 bzw. Netscape 7.1 sowie
Opera 7.2 sind
die Fähigkeiten bereits eingebaut. Für den Microsoft IE gibt es
Plugins, die die notwendigen Funktionen nachrüsten. (Siehe
Technik.)
Der Browser nimmt die Zeichen und wandelt diese in eine neue Zeichenkette
um. Die neue Zeichenkette besteht nur noch aus den Buchstaben
»a« bis »z«, Ziffern und dem Bindestrich. Durch diese
trickreiche Kodierung müssen weitestgehend
nur auf Client-Seite (z.B. Browser, E-Mail-Programm)
Änderungen gemacht werden.
Die neu enstandene Kodierung nennt sich Punycode oder auch AMC-ACE-Z.
Der Name »Müller-Bier.de« wird somit als »xn--mller-bier-9db.de« kodiert.
Alle so kodierten Domainnamen
fangen mit der Zeichenkette »xn--« an.
Umwandlungen können
Sie auf unserer
Konvertierungsseite
selbst durchführen.
Als sich die Techniker des Internets noch nicht auf Punycode geeinigt hatten,
hat eine große Registry einen höchst fragwürdigen Test gestartet. Dabei wurde
die sogenannte RACE-Kodierung verwendet. Alle kodierten Domainnamen
fangen dort mit
»bq--« an.
Es stand von Anfang an fest, daß diese Zeichenketten nach der endgültigen Einigung
nicht verwendet werden können. Trotzdem standen bei dieser Registry geschäftliche
Interessen im Vordergrund und so wurden diese Fehlkodierungen verkauft.
Das hängt ganz von den Registries ab, die für die jeweiligen Top-Level-Domains
zuständig sind. Für .com- und .net-Domains sind
seit dem 14.12.2003 IDN-Registrierungen möglich. Die DENIC, zuständig für
.de-Domains, erlaubt seit dem 1. März 2004 Internationalisierte Domainnamen,
und bei Afilias (.info-Domains) sind seit dem 16. März 2004 auch Umlaute möglich.
Die Zeitpläne der IDN-Erweiterungen für die verschiedenen Top-Level-Domains
können Sie - soweit bekannt - in
unserer Übersicht nachschlagen.
Wir haben für unseren Kunden im Vorfeld der IDN-Einführungen bei
.de- und .info-Domains jeweils Vormerkungssysteme eingerichtet.
Damit war es zwar nicht möglich, die Zuteilung der Wunschnamen zu garantieren.
Da wir aber unmittelbar nach der Öffnung der Registry die gesammelten Anträge
automatisch verschickt haben, erhöhte sich die Wahrscheinlichkeit der
Registrierung deutlich. Das Eintragen von Wunschdomains in unsere Warteschlange
war kostenlos, berechnet wurden nur die erfolgreichen Anträge.
Wir werden für unsere Kunden auch zukünftig Vormerkungssysteme anbieten, wenn
bei bestehenden Top-Level-Domains zusätzliche Zeichen erlaubt werden oder wenn
neue Top-Level-Domains hinzukommen (wie etwa »eu«).
Bei anderen Registries fehlen noch wichtige Informationen, wie
z.B. die Menge der erlaubten Zeichen. Jetzt schon Registrierungen
anzunehmen, wäre daher unseriös.