作業状況
- 字表:文字種別グリフ数詳細の33011まで完了(グリフがないためパスしたものも含む)
- 26400をスキップ(区点→GLに移行予定のため)
- 国字の字典、チェック
データ追加・変更希望
データはPerlの正規表現(置き換え)の形で記述しますが、慣れていない場合は「:グリフ名:変換結果」の具体例を記述してください。すでに作成したデータの記述内容の変更検討希望もこちらにお願いします。
例 abc12345 → 『ABC字典』 12345番 の場合
:abc12345:『ABC字典』 12345番
(以下にお願いします)
- “u(#)####-halfwidth”,“u(#)####-fullwidth”に対し,「(国際符号化文字集合・ユニコード U+(#)#### 半角形)」,「(国際符号化文字集合・ユニコード U+(#)#### 全角形)」という解説が出るとよいと思います。--spinda-kkmr 2013年1月27日(日) 10:07
- 半角全角の後置詞の議論が先ということで、ちょっと後回しにします。--kamichi 2013年2月11日(月) 13:05
- ほかの言語(英語など)での説明も実装できるようになると良いと思います。英語インターフェイスでGlyphWikiを利用する方にも役に立つと思います。たとえば、
- u(4d[c-f][0-9a-f])
- ja:"国際符号化文字集合・ユニコード U+".uc($1):en:"Universal Character Set (Unicode) U+".uc($1)
こうすると、日本語インターフェイスでは「国際符号化文字集合・ユニコード U+(#)####」が、英語インターフェイスではUniversal Character Set (Unicode) U+(#)####が表示されます。 --johotogoshinentai 2013年2月11日(月) 12:56
- 横に長くなりすぎるので以下のようなフォーマットの変更を考えています。--kamichi 2013年2月11日(月) 13:05
u(4d[c-f][0-9a-f])
- en
- "Universal Character Set (Unicode) U+".uc($1)
- ja
- "国際符号化文字集合・ユニコード U+".uc($1)
- kr
- ...
- zh-hk
- 國際通用字符集 (Unicode)
- zh-cn
- 国際通用字符集 (统一码)
- zh-tw
- 國際通用字符集 (萬國碼)
chanhenryfaihang 18:29, 6 April 2015
- Could the header for "hka-[0-9]{4}" glyphs be be added?
chanhenryfaihang 18:29, 6 April 2015
- 複数言語の対応をやらないといけませんね…--kamichi 2015年4月6日(月) 23:17
- A more comprehensive version is found at http://glyph.iso10646hk.net/chinese/hkcharacters_3.jsp which includes components for Simplified Chinese, Japanese and Korean characters. The code used should be the 序號 in document "按部件碼(Cc-Code)排序的部件總表 (包括日、韓及簡化部件)". Regular Expression could be hkgcg-[0-9]{3}. Traditional Chinese characters compose of 644 components while Simp/J/K consist of 47. The time of publication is around 2001-2002 so the coverage is only URO + Ext A + HKSCS characters. The nature of this is similar to "CNS 11643規格例示字形". chanhenryfaihang 18:43, 7 April 2015
- u(e[0-9a-f]{4})
- "国際符号化文字集合・ユニコード U+".uc($1)"
- u(1?[0-9a-f]{4})-parts-([0-9a-f]{3})
- "国際符号化文字集合・ユニコード U+".uc($1)部品($2)"
- unstable-nishiki-(f?[0-9]{4})
- "にしき的フォント外字 ".uc($1)"
- unstable-nishiki-(10[0-9]{4})
- "にしき的フォント外字 ".uc($1)"
- unstable-u([0-9a-f]{4})
- "国際符号化文字集合に提案されている文字 U+".uc($1)"
- unstable-u([0-9a-f]{5})
- "国際符号化文字集合に提案されている文字 U+".uc($1)"
- sawn-(f[0-9a-f]{4})
- "SAWN外字 ".uc($1)"
- sawno-(f[0-9a-f]{4})
- "旧フォントにおけるSAWN外字 ".uc($1)"
- negative-sandbox-(.+)
- "練習用グリフ"
- unstable-bsh-(f?[0-9]{4})
- "BabelStone Han PUAフォント外字 ".uc($1)"
- u(1?[0-9]{4})-fullwidth
- "国際符号化文字集合".uc($1)全角形"
- u(1?[0-9]{4})-halfwidth
- "国際符号化文字集合".uc($1)半角形"
これらの追加を提案します。
また、
- u((3[4-9a-f]|[4-9][0-9a-f]|2[0-9abc][0-9a-f])[0-9a-f]{2}|fa(0[ef]|1[134f]|2[134789]))
- "国際符号化文字集合・ユニコード統合漢字 U+".uc($1)."「".pack('U', eval('0x'.$1))."」"
- u((3[4-9a-f]|[4-9][0-9a-f]|2[0-9a-f]{2})[0-9a-f]{2}|fa(0[ef]|1[134f]|2[134789]))-[gthmjkvu]
- "国際符号化文字集合・ユニコード統合漢字 U+".uc($1)."「".pack('U', eval('0x'.$1))."」地域ソース字形"
- u((3[4-9a-f]|[4-9][0-9a-f]|2[0-9a-f]{2})[0-9a-f]{2}|fa(0[ef]|1[134f]|2[134789]))-(i|us)
- "国際符号化文字集合・ユニコード統合漢字 U+".uc($1)."「".pack('U', eval('0x'.$1))."」(旧)規格標準例示字形"
- u((3[4-9a-f]|[4-9][0-9a-f]|2[0-9a-f]{2})[0-9a-f]{2}|fa(0[ef]|1[134f]|2[134789]))-j[as]
- "国際符号化文字集合・ユニコード統合漢字 U+".uc($1)."「".pack('U', eval('0x'.$1))."」(旧)日本ソース字形"
- u((3[4-9a-f]|[4-9][0-9a-f]|2[0-9a-f]{2})[0-9a-f]{2}|fa(0[ef]|1[134f]|2[134789]))-jv
- "国際符号化文字集合・ユニコード統合漢字 U+".uc($1)."「".pack('U', eval('0x'.$1))."」(仮想)日本ソース字形"
- u((3[4-9a-f]|[4-9][0-9a-f]|2[0-9a-f]{2})[0-9a-f]{2}|fa(0[ef]|1[134f]|2[134789]))-[gthmjkvu]?[0-9]{2}
- "国際符号化文字集合・ユニコード統合漢字 U+".uc($1)."「".pack('U', eval('0x'.$1))."」偏化変形部品"
- u((3[4-9a-f]|[4-9][0-9a-f]|2[0-9abc][0-9a-f])[0-9a-f]{2}|fa(0[ef]|1[134f]|2[134789]))-u(e01[0-9a-f]{2})
- "国際符号化文字集合・ユニコード統合漢字 U+".uc($1)."「".pack('U', eval('0x'.$1))."」IVS異体字「".pack('U', eval('0x'.$1)).pack('U', eval('0x'.$4))."」"
- u((3[4-9a-f]|[4-9][0-9a-f]|2[0-9abc][0-9a-f])[0-9a-f]{2}|fa(0[ef]|1[134f]|2[134789]))-u(fe[0-9a-f]{2})
- "国際符号化文字集合・ユニコード統合漢字 U+".uc($1)."「".pack('U', eval('0x'.$1))."」VS異体字「".pack('U', eval('0x'.$1)).pack('U', eval('0x'.$4))."」"
これらの“2[0-9abc][0-9a-f]”を“2[0-9a-e][0-9a-f]”に変更してください。
以上。--kesuuko 2018年3月10日(土) 23:38
- 追加しました。--kesuuko 2018年4月15日(日) 10:59
康熙字典のフォーマットが“kx-ppppnnn”に変更になってからかなり経ちますが,このページの内容がまだ書き換えられておらず,“kx-ppppnnn”のグリフページを見ても説明が表示されません。対応をお願いいたします。--spinda-kkmr 2019年1月12日(土) 20:07
u20b36-jv01やu8fc7-jv08などの“u(#)####-jv##”に対し「国際符号化文字集合・ユニコード統合漢字 U+(x)xxxx「○」偏化変形部品」が表示されるよう,対応をお願いいたします。--spinda-kkmr 2019年7月3日(水) 22:08
u2d92a等のExt.Fやu30001等のExt.Gの無印グリフに対し解説が表示されません。対応をお願いいたします。--spinda-kkmr 2021年3月13日(土) 13:13
CNS 11643は24面(0x18)まで発展してきた様子です。https://www.cns11643.gov.tw/wordCount.jsp sz 2022年5月28日(土) 09:23