OpenCC
OpenCC copied to clipboard
tw2sp.json中将"字母" -> "本母"
tw2sp.json中将"字母" -> "本母" 想请教下为什么做这种转换,我没有找到相关的资料,谢谢!
實際去試輸入「字母」,輸出也還是「字母」,並沒有什麼問題,所以這位同學的問題是錯的。以後問問題請精確點,否則大家無法重現問題可能不會重視。
不過我還是幫你調查了,這是因為中國/台灣的IT常用詞是「文本」/「文字」,因此在轉換時,「英文字母」就會因為切詞錯誤被誤轉成「英文本母」。
如果要用詞庫解決這類問題,大概得加上「英文字=>英文字」、「英文字母=>英文字母」、「法文字=>法文字」、「法文字母=>法文字母」、……把全世界各種語言都加進去,看各位大姥有沒有想做XD
我用自己的系統稍微測試了下,可以在簡繁祕書線上版測試各種轉換方案的效果。patch 的設定檔和詞典可以去翻 gh-pages 分支的歷史找到。
可以在 TWVariantsRevPhrases.txt 或者 TWPhrasesOther.txt添加
文字母 文字母
文字型 文字型
文字體 文字體
泰文字 泰文字
*國文字 *國文字
…
或许可能的解决办法是不同的领域挂载不同的phrase表,或者是指定不使用某个转换表,比如TWPhrasesIT.txt。