clreq icon indicating copy to clipboard operation
clreq copied to clipboard

列出中西文共用码位的标点符号

Open xfq opened this issue 2 years ago • 8 comments

根据昨天的会议讨论,我们可以在文档中列出中西文共用码位的标点。

我可以想到的有弯引号、破折号、省略号、连接号、间隔号和分隔号。

xfq avatar Mar 29 '23 07:03 xfq

GB/T 15834—2011 中涉及的相关标点:

  • 单引号(‘ 和 ’)、双引号(“ 和 ”),与西文引号共用码位
    • ‘‌ U+2018
    • U+2019
    • U+201C
    • U+201D
  • 破折号(——) ,与西文 em dash 共用码位
    • U+2014
  • 省略号(……), 与西文省略号共用码位
    • U+2026
  • 短横线(- 或 –),与西文 hyphen 或 en dash 共用码位
    • - U+002D
    • U+2013
  • 一字线(—),与西文 em dash 共用码位
    • U+2014
  • 间隔号(·),与西文 interpunct 共用码位
    • · U+00B7

realfish avatar Mar 29 '23 09:03 realfish

这个可以更新到规范吗?

yisibl avatar Oct 26 '23 07:10 yisibl

ctex宏包实作

ctex宏包涉及“中西文公用的标点符号”,它认为以下字符中西文共用,但认为其中标“💦”的不是CJKpunct。而标“➕”代表 https://github.com/w3c/clreq/issues/534#issuecomment-1488279345 没提到。

  • 两对引号、省略号
  • 破折号或一字线
    • U+2014 Em Dash
    • U+2E3A Two-Em Dash💦➕
  • 短横线
    • U+2013 En Dash💦
  • 间隔号
    • · U+00B7 Middle Dot
    • U+2027 Hyphenation Point💦➕
  • 谜之字符
    • U+2025 Two Dot Leader💦➕
《CTeX宏集手册》原文

版本:2022/07/14,v2.5.10

CJKpunct 定义的标点符号是:

‘“「『〔([{〈《〖【

—…、。,.:;!?%〕)]}〉》〗】’”」』

注意顺序不能改变。

\seq_const_from_clist:Nn \c__ctex_punct_seq
  {
    "2018 , "201C , "300C , "300E , "3014 , "FF08 , "FF3B , "FF5B ,
    "3008 , "300A , "3016 , "3010 ,
    "2014 , "2026 , "3001 , "3002 , "FF0C , "FF0E , "FF1A , "FF1B ,
    "FF01 , "FF1F , "FF05 , "3015 , "FF09 , "FF3D , "FF5D , "3009 ,
    "300B , "3017 , "3011 , "2019 , "201D , "300D , "300F
  }

将间隔号、引号、破折号等中西文公用的标点符号归入字符范围 9,将他们设置为 JAchar。

\ltjdefcharrange{9}{%
  "00B7, "2018, "2019, "201C, "201D, "2013, "2014, "2025, "2026, "2027, "2E3A}

YDX-2147483647 avatar Feb 22 '24 06:02 YDX-2147483647

是不是应该还有分隔号(U+002F SOLIDUS [/])?

xfq avatar Feb 28 '24 07:02 xfq

是不是应该还有分隔号(U+002F SOLIDUS [/])?

~~可能中文应该用 U+FF0F Fullwidth Solidus?~~ 不过现实中有不少 U+002F 前后加空格,例如 https://www.thetype.com/ 的标题文字 / 设计 / 文化

仅就简体中文而言,根据国标5.1.9条,分隔号占半个字位置。

YDX-2147483647 avatar Feb 28 '24 07:02 YDX-2147483647