soynlp
soynlp copied to clipboard
'ㅆㅡㄹㅐㄱㅣ' 로 입력된 글자를 '쓰래기' 로 정규하하여 처리
normalizer 에서 자음/모음이 분리된 sequence 를 한글로 고쳐서 처리하면 ㅆㅡㄹㅐㄱㅣ에 대해서도 품사 판별이 가능