タグ

unicodeに関するhiro-takのブックマーク (6)

  • 波ダッシュ・全角チルダ問題 - Wikipedia

    Unicode(ユニコード)とは、ユニコードコンソーシアムによって定められた文字コードの標準規格である。符号化文字集合や文字符号化方式などを定め、文字集合(文字セット)が単一の大規模文字セットであること(「Uni」という名はそれに由来する)などが特徴である。 従来、各国の標準化団体あるいは各コンピュータメーカーによって独自に開発されていた個々の文字コードの間には互換性がなかった[1]。ISO/IEC 2022のように複数の文字コードを共存させる方法も考案されたが、例えば日語の漢字と中国語の漢字のように、文字が重複する短所がある。一方Unicodeは、微細な差異はあっても質的に同じ文字であれば一つの番号を当てる方針で各国・各社の文字コードの統合を図った規格である[1]。1980年代に、Starワークステーションの日語化(J-Star)などを行ったゼロックスが提唱し、マイクロソフト、Ap

    波ダッシュ・全角チルダ問題 - Wikipedia
  • 文字コードの話

    稿は、1996年に筆者が大学の所属サークルの機関誌に寄稿した記事をもとに加筆訂正したものです。(最終更新 1999.7.31) 目次 はじめに 第1章 日語のコード体系 第2章 ASCIIと1バイト文字コード 第3章 JIS漢字コードとエンコーディング法 第4章 ISO 2022 第5章 ISO 2022の実例 第6章 中国語・韓国語の文字コード 第7章 ISO 10646とUnicode おわりに 参考文献 はじめに ASCIIだけで用が足りるアメリカと違って、 私たちは日語を扱わなくてはならないため、 より深く文字コードの問題と関わらざるをえません。 それでも、MS-DOS/WindowsMacを使う限りでは、 ASCIIとシフトJIS(たまにJIS)を知っていれば済みますが、 UNIXやインターネットを使い始めると、 JIS・EUC・シフトJISとさまざまな日語コードに頭を

  • サロゲートペア入門

    はじめに Windows VistaのJIS2004対応により、WindowsのUnicode環境で使用できる日語漢字の数が増えました。従来、12238字(Windows XP)だったのが13145字(Windows Vista)になり、907字追加されることになりました。これによって、JIS第3水準、JIS第4水準の漢字がすべてサポートされることになったのです(Windows XPまでは一部サポート)。 またWindows XPでも、パッチさえ当てれば、Windows Vistaと同じように追加907字を加えた13145字の漢字が使用できるようになりました。 ところが、この追加された907字の中には「サロゲートペア」という特殊な文字が304字あり、これらは今までのUnicodeの文字とは扱いが少し違います。この点について解説していきたいと思います。 対象読者 Unicodeでデータ処理

    サロゲートペア入門
  • これまでの勉強会などの資料

    UTF-7とクロスサイトスクリプティング [English version] 第1回ヌルい勉強会(仮称) 資料 2007.11.07 今さらながらのWSH再勉強 第 4 回 Admintech.jp コミュニティ勉強会 資料 2007.06.09 RSS Feed Reader へのスクリプトインジェクション 第10回まっちゃ139勉強会 目覚まし勉強会資料 2007.02.17 それ Unicode で 第08回セキュリティもみじ勉強会資料 2006.12.09 IPAへの脆弱性情報の届出 第06回まっちゃ139勉強会資料 2005.10.22 文字列検出ツール "istring" の使い方 セキュリティアカデミー勉強会資料 2005.07.09 Unicodeとセキュリティ 第02回まっちゃ139勉強会資料 2006.10.30 関連: 葉っぱ日記: Unicodeとセキ

  • Unicode

    Unicode のブロック名称と Unicode Code Charts へのリンクです。 右欄に、JIS X 0221-1 に掲載されている日語名称を掲げます。 この欄の (4.1.0) は Unicode 4.1.0 で追加されたブロックであることを示します。 リンク欄に(注)があるブロックは、ファイルサイズが大きいためコピーしたファイルを参照しています(2005-9-25)。 fromtoブロックの名称 および Unicode Code Charts へのリンクX 0221-1 付属書A A.2 より \u0000\u007F

  • Pythonインタプリタと日本語 - スコトプリゴニエフスク通信

  • 1