OpenCC icon indicating copy to clipboard operation
OpenCC copied to clipboard

tw2sp.json中将"字母" -> "本母"

Open uuuidada opened this issue 1 year ago • 2 comments

tw2sp.json中将"字母" -> "本母" 想请教下为什么做这种转换,我没有找到相关的资料,谢谢!

uuuidada avatar Mar 01 '24 01:03 uuuidada

實際去試輸入「字母」,輸出也還是「字母」,並沒有什麼問題,所以這位同學的問題是錯的。以後問問題請精確點,否則大家無法重現問題可能不會重視。

不過我還是幫你調查了,這是因為中國/台灣的IT常用詞是「文本」/「文字」,因此在轉換時,「英文字母」就會因為切詞錯誤被誤轉成「英文本母」。

如果要用詞庫解決這類問題,大概得加上「英文字=>英文字」、「英文字母=>英文字母」、「法文字=>法文字」、「法文字母=>法文字母」、……把全世界各種語言都加進去,看各位大姥有沒有想做XD

我用自己的系統稍微測試了下,可以在簡繁祕書線上版測試各種轉換方案的效果。patch 的設定檔和詞典可以去翻 gh-pages 分支的歷史找到。

danny0838 avatar Apr 24 '24 11:04 danny0838

可以在 TWVariantsRevPhrases.txt 或者 TWPhrasesOther.txt添加 文字母 文字母 文字型 文字型 文字體 文字體 泰文字 泰文字 *國文字 *國文字 … 或许可能的解决办法是不同的领域挂载不同的phrase表,或者是指定不使用某个转换表,比如TWPhrasesIT.txt。

doubanchan avatar Oct 03 '24 04:10 doubanchan