Punycode zu Unicode
Konvertiert Punycode in Unicode.
Punycode zu Unicode
Punycode zu Unicode ist ein nützliches Werkzeug, das Ihnen hilft, Punycode in Unicode zu konvertieren.
Punycode ist ein im RFC 3492 standardisiertes Kodierungsverfahren zum Umwandeln von Unicode-Zeichenketten in ASCII-kompatible Zeichenketten, die aus den Zeichen a bis z, 0 bis 9 und dem Bindestrich (-) bestehen. Punycode wurde entworfen, um internationalisierte Domainnamen aus Unicode-Zeichen eindeutig und umkehrbar durch ASCII-Zeichen darzustellen.
Der wichtigste Grund für die Einführung von Punycode war die Tatsache, dass in dem etablierten Domain Name System nur Namen zugelassen sind, die aus den 26 lateinischen Buchstaben, den Ziffern 0 bis 9, sowie einem Bindestrich-Minus („Tastatur-Bindestrich“) bestehen. Für die englische Sprache war dies ausreichend, doch die meisten anderen Sprachen enthalten weitere Zeichen – die deutsche Sprache beispielsweise die Umlautbuchstaben ä, ö und ü sowie das ß. Um beliebige Texte aus derartigen Sprachen verarbeiten zu können, wurde 2003 das Verfahren Internationalizing Domain Names in Applications (IDNA) eingeführt, das Punycode als Kodierungsverfahren einsetzt.
Soll ein Text an ein System übergeben werden, das nur ASCII beherrscht, so wird er zuvor per Punycode in ASCII umgesetzt. Zu beachten ist, dass sich in vielen Fällen der resultierende Text verlängert. Soll umgekehrt dieser Text aus dem ASCII-System entnommen werden, so wird er per Punycode in die ursprüngliche Form zurückübersetzt. Enthält ein Text keinerlei Sonderzeichen, so wird er durch dieses Verfahren nicht verändert.
Das Punycode-Konvertierungsverfahren wurde unter Wahrung folgender Gesichtspunkte festgelegt:
Vollständigkeit Jeder Name kann umgesetzt werden
Eindeutigkeit Jedem Namen ist genau eine Umsetzung zugeordnet
ReversibilitätJeder umgesetzte Name kann zurückkonvertiert werden
EffizienzDer umgesetzte Name ist nicht wesentlich länger als der Ausgangsname
EinfachheitDas Verfahren ist relativ einfach zu implementieren
LesbarkeitNamen aus im Wesentlichen lateinischen Buchstaben bleiben häufig lesbar, da die Zeichen a bis z nicht verändert werden
Ähnliche Tools
Contact
Missing something?
Feel free to request missing tools or give some feedback using our contact form.
Kontakt