ngrams icon indicating copy to clipboard operation
ngrams copied to clipboard

Extract Class

Open fernan0502 opened this issue 5 months ago • 0 comments

Problema: El método train() en la clase Bigram mezcla tokenización, conteo y actualización de vocabulario en una sola clase, dificultando mantenibilidad y pruebas.

Beneficios:

Mejor organización separando responsabilidades.

Facilita pruebas unitarias enfocadas y reduce acoplamientos.

Código más claro y fácil de extender.

Solución Aplicada: Se crearon clases especializadas (Tokenizer y BigramCounter). La clase Bigram delega responsabilidades, dejando train() limpio y enfocado en la orquestación.

fernan0502 avatar Aug 13 '25 04:08 fernan0502