タグ

unicodeに関するMasayukiのブックマーク (3)

  • Unicodeは文字集合か符号化方式か : 404 Blog Not Found

    2006年11月24日12:30 カテゴリLightweight Languages Unicodeは文字集合か符号化方式か 以下は、電脳で文字を扱う場合の基礎中の基礎なのだが、肝心の記事に重大な誤りがいくつもある。 文字コード規格の基礎:ITpro そろそろ具体的な説明に入ろう。最初にはっきりさせておく必要があるのは次の点だ。一般に「文字コード」と言う場合, 文字の集合 エンコード方法 という要素がある。この二つを区別して考えることが重要だ。もちろん大きな関連はあるのだが,ごちゃごちゃのままでは「わからなく」なる大きな要因となる。ここだ。 これによると、Unicodeは明らかに「エンコード方法」であるが、これは間違い。ここで書かれているものはUCS-2という名前のUnicodeが定めるいくつかの「エンコード方法」の一つであり、しかもUTF-16によって陳腐化した方式である。 まずUnic

    Unicodeは文字集合か符号化方式か : 404 Blog Not Found
  • 日本語と文字コード

    コンピュータは主にアメリカで発達してきたため、未だにアルファベットや数字などの1バイト(7/8ビット)を基単位として扱う前提で作られているものが中心です。そのなかで日語のように多くの文字を必要とする言語は、1文字を表わすのに2バイト以上を要するため、いろいろな困難が伴います。特にインターネットを通じて様々な環境の情報を交換するにあたって、思わぬ問題に遭遇するケースが増えてきました。ここでは、こうしたことを考えるために必要な、日語の文字コードに関する基を整理しておきます。 JIS漢字コード(情報交換用符号化漢字集合) 区点コード JISコード(符号化方式) シフトJISコード EUCコード ASCIIとJISローマ字 Unicode 主要コード規格のまとめ 参考文献、リソース 文字化けしたメールの復元 | The Web KANZAKI ホームページ JIS漢字コード(情報交換用符号

    Masayuki
    Masayuki 2007/08/12
    神崎氏のサイトでの解説。
  • Punycodeとは何? わかりやすく解説 Weblio辞書

    IT用語辞典バイナリ 索引トップ 用語の索引 ランキング 画像一覧 カテゴリー Punycode 読み方:ピュニコード Punycodeとは、国際化ドメイン名で利用される、文字列変換用のアルゴリズムである。RFC 3492として標準化されている。 Punycodeは、Unicodeで書かれた国際化ドメイン名の文字列をASCII文字に変換する。これによって、従来のDNSの仕組みで国際化ドメイン名を運用することが可能となっている。Punycodeで変換された国際化ドメイン名には、識別子として「xn--」という接頭辞が付くようになっている。 参照リンク 日語JPドメインのPunycode変換・逆変換 - (日語.jp) WWWのほかの用語一覧ドメイン:  OR.JPドメイン  OpenDNS  OSAKAドメイン  Punycode  レジストラ  レジストリ  リゾルバ>>ドメインカテゴリ

  • 1