ngender
ngender copied to clipboard
根据姓名来判断性别
统计一个马尔科夫的语言模型概率吧,出现次数较多的这种可以解决
处理了胜男,招弟的名字。 添加了单元测试。
兩個字的姓名
兩個字的姓名有很高的比例被判定為男性....
下面是我在Linux命令行的输入: $ ng 无法 输入 然后是输出结果: ``` _Command 'ng' not found, but can be installed with: sudo apt install ng-common_ ``` 找不到`ng`命令,咋办? 在此之前我已经成功执行命令`pip install ngender`,提示安装成功了。
就是还是名字状态的数据,应该就是你说的「开房记录.avi」吧 😄
复姓的处理
目前算法仅能处理单字符的姓,是否考虑引入复姓的处理。
日文名能识别吗
野泽直子 出来是男的
可以提供下数据处理 以及贝叶斯的源代码吗 想对这个项目进行优化,想要您的源码借鉴参考下
有些字的分數似乎有點問題,名字包含「蕎」、「誠」、「緹」、「風」、「勝」、「騰」、「釩」、「釤」等字會直接100%男生(但是「偉」、「傑」、「豪」等字卻不會直接100%男生),而且這當中「蕎」跟「緹」根本不是男生用的字,另外名字包含「鶯」、「絲」、「鈮」等字會直接100%女生(但是女部的字如「婷」、「妍」、「娟」、「婕」卻不會直接100%女生),還有「麗」這個字的分數明顯有問題,居然比「英」的男生比例高很多,還有「綺」字居然會增加男生的比例?「群」字居然會增加女生的比例?很多字的分數明顯都有問題 另外,包含「鵲」、「魈」、「琋」、「燒」、「鋯」等字的名字會無法判定,建議改成直接忽略這些無法判定的字(把他們的分數當作是0分) 另外,你應該要讓輸入繁體字時要視同其對應的簡體字處理