clreq
clreq copied to clipboard
列出中西文共用码位的标点符号
GB/T 15834—2011 中涉及的相关标点:
- 单引号(‘ 和 ’)、双引号(“ 和 ”),与西文引号共用码位
-
‘U+2018 -
’U+2019 -
“U+201C -
”U+201D
-
- 破折号(——) ,与西文 em dash 共用码位
-
—U+2014
-
- 省略号(……), 与西文省略号共用码位
-
…U+2026
-
- 短横线(- 或 –),与西文 hyphen 或 en dash 共用码位
-
-U+002D -
–U+2013
-
- 一字线(—),与西文 em dash 共用码位
-
—U+2014
-
- 间隔号(·),与西文 interpunct 共用码位
-
·U+00B7
-
这个可以更新到规范吗?
ctex宏包实作
ctex宏包涉及“中西文公用的标点符号”,它认为以下字符中西文共用,但认为其中标“💦”的不是CJKpunct。而标“➕”代表 https://github.com/w3c/clreq/issues/534#issuecomment-1488279345 没提到。
- 两对引号、省略号
- 破折号或一字线
-
—U+2014 Em Dash -
⸺U+2E3A Two-Em Dash💦➕
-
- 短横线
-
–U+2013 En Dash💦
-
- 间隔号
-
·U+00B7 Middle Dot -
‧U+2027 Hyphenation Point💦➕
-
- 谜之字符
-
‥U+2025 Two Dot Leader💦➕
-
《CTeX宏集手册》原文
版本:2022/07/14,v2.5.10。
CJKpunct 定义的标点符号是:
‘“「『〔([{〈《〖【
—…、。,.:;!?%〕)]}〉》〗】’”」』
注意顺序不能改变。
\seq_const_from_clist:Nn \c__ctex_punct_seq { "2018 , "201C , "300C , "300E , "3014 , "FF08 , "FF3B , "FF5B , "3008 , "300A , "3016 , "3010 , "2014 , "2026 , "3001 , "3002 , "FF0C , "FF0E , "FF1A , "FF1B , "FF01 , "FF1F , "FF05 , "3015 , "FF09 , "FF3D , "FF5D , "3009 , "300B , "3017 , "3011 , "2019 , "201D , "300D , "300F }
将间隔号、引号、破折号等中西文公用的标点符号归入字符范围 9,将他们设置为 JAchar。
\ltjdefcharrange{9}{% "00B7, "2018, "2019, "201C, "201D, "2013, "2014, "2025, "2026, "2027, "2E3A}
是不是应该还有分隔号(U+002F SOLIDUS [/])?
是不是应该还有分隔号(
U+002F SOLIDUS [/])?
~~可能中文应该用/ U+FF0F Fullwidth Solidus?~~ 不过现实中有不少 U+002F 前后加空格,例如 https://www.thetype.com/ 的标题文字 / 设计 / 文化。
仅就简体中文而言,根据国标5.1.9条,分隔号占半个字位置。