WordTokenizerpublic class DefaultWordTokenizer extends AbstractWordTokenizer
CHANGE_SEQUENCE, DELETE_CHARS, INSERT_CHARS| Constructor | Description |
|---|---|
DefaultWordTokenizer() |
|
DefaultWordTokenizer(java.text.BreakIterator wordIterator) |
| Modifier and Type | Method | Description |
|---|---|---|
Word |
currentWord(int index) |
Obtiene la palabra actual sobre la que estbad_char_replaced index, si index
no estbad_char_replaced en medio de una palabra devolverbad_char_replaced null.
|
protected Word |
scanAfter(java.lang.CharSequence sequence,
int index) |
|
protected Word |
scanBefore(java.lang.CharSequence sequence,
int index) |
|
void |
updateCharSequence(int start,
int end,
int cause) |
Se llama cuando hay que actualizar la secuencia de carbad_char_replacedcteres actuales.
|
getCharSequence, isStartOfSentence, nextWord, previousWord, setCharSequencepublic DefaultWordTokenizer()
public DefaultWordTokenizer(java.text.BreakIterator wordIterator)
protected Word scanBefore(java.lang.CharSequence sequence, int index)
protected Word scanAfter(java.lang.CharSequence sequence, int index)
public Word currentWord(int index)
WordTokenizercurrentWord in interface WordTokenizercurrentWord in class AbstractWordTokenizerindex - El bad_char_replacedndice desde donde buscar.public void updateCharSequence(int start,
int end,
int cause)
WordTokenizerstart - El primer carbad_char_replacedcter desde donde se actualiza.end - El bad_char_replacedltimo carbad_char_replacedcter desde donde se actualiza.cause - La causa de la actualizacibad_char_replacedn. Puede ser cualquiera de las
constantes INSERT_CHARS, DELETE_CHARS, CHANGE_SEQUENCE