Allgemein:IDN-Umlaute-und-Akzente

Aus Fortinet Wiki
Zur Navigation springen Zur Suche springen


IDN - Akzente und Umlaute

Seit 1. März 2004 hat Switch die Domain-Name mit Akzente und Umlaute freigegeben dh. jeder der so eine Domain zB. http://www.häfliger.ch registrieren will hat nun die Möglichkeit dies bei Switch zu tun.

Weltweit hat sich für Domain-Namen mit Akzenten und Umlauten der Begriff "Internationalized Domain Names IDN" eingebürgert. Die Optik dieser Bezeichnung ist jedoch sehr amerikanisch. In Europa wäre der Begriff "Nationalized Domain Names" oder "Multi Character Domain Names" eigentlich treffender.

Der Standard

Das Internet mit seinen Millionen von Rechnern kann nur deshalb so gut funktionieren, weil sich alle Beteiligten an offene Standards halten, die sehr sorgfältig entwickelt und weiterentwickelt werden. Das Domain Name System (DNS) ist ein solcher Basis-Standard: Es stellt die Verbindung her zwischen einem menschenlesbaren Domainnamen wie http://www.comcept.ch und der IP-Adress 212.59.153.115, die der Browser braucht um tatsächlich auf die gewünschte Website zugreifen zu können.

Wieso IDN?

Da das Internet seinen Ursprung in den USA hat, erlaubt DNS nur ASCII-Zeichen in Domainnamen, genau genommen sogar nur eine bestimmte Untermenge davon. Doch das ist viel zu wenig für ein weltumspannendes Datennetz. Nun ist DNS einer der Grundpfeiler des Internet, und an diesem so radikal zu rütteln, wie es die Einbindung zigtausender neuer Zeichen erfordert, würde womöglich Erschütterung auslösen, die hie und da etwas einstürzen lassen. Die Arbeitsgruppe für Internationalized Domain Names (IDN) der Internet Enigeering Task Force (IETF) hat sich daher in dreijähriger Arbeit darauf verständigt, DNS und die anderen Basisprotokolle des Inernet nicht anzurühren, sondern Sonderzeichen in Domainnamen ausschliesslich Anwendungsebene einzuführen. Herausgekommen ist ein Standard namens IDNA (Internationalizing Domain Nems in Applications), veröffentlicht als RFC 3490. Danach ist es die Aufgabe von Anwendungsprogrammen wie Web-Browsern, einen Domainnamen mit Sonderzeichen nach einer bestimmten Vorschrift in eine nur aus erlaubten ASCII-Zeichen bestehende kodierte Form zu überführen. Alle tiefer liegenden Protokolle wie HTTP und DNS bekommen dann nur noch Domainnamen nach den alten Standards zu sehen, und man braucht an der Infrastruktur des Internet (DNS-Server, Web-Server, etc.) nichts zu verändern.

Punycode

Punycode,Wird ausgesprochen wie Unicode, und das ist kein Zufall. Der IDNA-Standard ist nämlich eine "grosse Lösung" und führt nicht nur die paar für Schweizerische interessanten Umlaute ein sondern den 95 221 Zeichen umfassenden Unicode-3.2-Zeichensatz der die Sprachen aller Herren Länder abdeckt.

Ursprünglich war Unicode ein 16-Bit-Code, was einen Vorrat von 65 536 Zeichen ermöglicht. Schon bevor alle Plätze mit Zeichen gefüllt waren, wurde aber klar, dass auch das nicht ausreichen würde, und so hat man bestimmte Wertebereiche unter 65 536 vorsorglich reserviert und den Code auf einen Zahlenbereich von zurzeit null bis 0x10FFFF erweitert, also praktisch einen 21-Bit-Code.

Der nachfolgende Link stellt Ihnen ein Tool zur Vefügung indem Sie eine Umlaut Domaine eingeben können und danach codiert Ihnen das Tool die Umlaut Domaine in den Punycode:

       http://idnaconv.phlymail.de/

Wie das Beispiel zeigt, beginnt ein kodiertes Domain Label mit der speziellen Zeichenfole "xn--", gefolgt von all jenen Zeichen des ursprünglichen Domainnamens, die in DNS legal sind. Nach einem "-" als Trennzeichen folgt eine magische Zeichenfolge, die sowohl die Codes als auch die Position der Sonderzeichen enthält. Das hat zwei Vorteile: Zum einen belegen alle bisher erlaubten Zeichen auch im Punycode nur ein Byte, zum anderen enthalten Domainnamen aus dem dem europäischen Sprachraum häufig nur realtiv wenige Sonderzeichen und sind daher auch in der kodierten Form halbwegs entzifferbar.

Zwar sollte in einer perfekten Welt der Anwender den Punycode nie zu Gesicht bekommen, weil der Browser etc. die schmutzigen Details vor seinen Augen versteckt, aber man kann ja nie wissen.

Die Browser und Mail Clients

DER IDNA-Standard wurde im 1. März 2003 fertig gestellt, lange von der Einführung entsprechender Domains. Genug Zeit also für die Browser-Entwickler, ihn zu implementieren. Mozilla und Opera haben das getan, nur Microsoft -wie kann es anders sein- hatte es nicht nötig. Dem Internet Explorer ist der DNS-Standard egal: Er schickt den Domainnamen mit unzulässigen 8-Bit-zeichen in die weite Welt, wie es ihm gerade passt.

Was ist dabei umbedingt zu beachten? Grundsätzlich muss sicher der Domainen Besitzer nur eines vor Augen führen und das wäre das es immer zwei Aspekte gibt innerhalb dieser Problematik und zwar den optischen Aspekt (www.häfliger.ch) und der technische Aspekt (www.xn--hfliger-5wa.ch).

Was bedeutet das?

Die vorhergehende Ausführung bedeutet, dass wenn ein kompatibler Browser (IDN Unterstützung) benutzt wird so muss mit dem effektiven Domainnamen gearbeitet werden dh. http://www.häfliger.ch. Wenn der Browser den IDN Standard nicht unterstützt nimuss mit dem Punycode gearbeitet werden htt://www.xn--hfliger-5wa.ch.