WordTokenizerpublic class MatcherWordTokenizer extends AbstractWordTokenizer
| Modifier and Type | Field | Description |
|---|---|---|
static java.lang.String |
SPACE_CHARS |
Represent all the space chars.
|
CHANGE_SEQUENCE, DELETE_CHARS, INSERT_CHARS| Constructor | Description |
|---|---|
MatcherWordTokenizer() |
|
MatcherWordTokenizer(java.util.regex.Matcher matcher) |
| Modifier and Type | Method | Description |
|---|---|---|
static MatcherWordTokenizer |
createExcludeMatcher(java.lang.String chars) |
Esta funcibad_char_replacedn crea un
para buscar las palabras dentro de la (
) dada. |
static MatcherWordTokenizer |
createMatcher(java.lang.String regexp) |
Esta funcibad_char_replacedn crea un
para buscar las palabras dentro de la (
) dada. |
static MatcherWordTokenizer |
createMatcher(java.lang.String regexp,
int flags) |
Esta funcibad_char_replacedn crea un
para buscar las palabras dentro de la (
) dada. |
Word |
currentWord(int index) |
Obtiene la palabra actual sobre la que estbad_char_replaced index, si index
no estbad_char_replaced en medio de una palabra devolverbad_char_replaced null.
|
protected java.util.regex.Matcher |
getMatcher() |
|
Word |
nextWord(int index) |
Para localizar bien los empieces de frases delega en la funcibad_char_replacedn isEndOfSentence.
|
void |
updateCharSequence(int start,
int end,
int cause) |
Se llama cuando hay que actualizar la secuencia de carbad_char_replacedcteres actuales.
|
getCharSequence, isStartOfSentence, previousWord, setCharSequencepublic static final java.lang.String SPACE_CHARS
public MatcherWordTokenizer(java.util.regex.Matcher matcher)
public MatcherWordTokenizer()
public static MatcherWordTokenizer createMatcher(java.lang.String regexp, int flags)
Matcher
para buscar las palabras dentro de la (
CharSequence) dada.regexp - La expresibad_char_replacedn regular a utilizar y que harbad_char_replaced que se salten los
espacios.flags - Los flags que se utilizan en
Pattern.compile.Matcher para
obtener las palabras.public static MatcherWordTokenizer createMatcher(java.lang.String regexp)
Matcher
para buscar las palabras dentro de la (
CharSequence) dada.regexp - La expresibad_char_replacedn regular a utilizar y que harbad_char_replaced que se salten los
espacios.Matcher para
obtener las palabras.public static MatcherWordTokenizer createExcludeMatcher(java.lang.String chars)
Matcher
para buscar las palabras dentro de la (
CharSequence) dada. Haciendo
que el texto que se le pasa sea el texto a excluir, es decir la expresbad_char_replacedn
deberbad_char_replacedan de ser los caracteres que forman los espacios entre las palabras.chars - La expresibad_char_replacedn regular a utilizar y que indica cuales son los
espacios entre las palabras. Es decir los carbad_char_replacedcteres que no forman
parte de una palabra.Matcher para
obtener las palabras.SPACE_CHARSprotected java.util.regex.Matcher getMatcher()
public Word nextWord(int index)
nextWord in interface WordTokenizernextWord in class AbstractWordTokenizerpublic Word currentWord(int index)
WordTokenizercurrentWord in interface WordTokenizercurrentWord in class AbstractWordTokenizerindex - El bad_char_replacedndice desde donde buscar.public void updateCharSequence(int start,
int end,
int cause)
WordTokenizerstart - El primer carbad_char_replacedcter desde donde se actualiza.end - El bad_char_replacedltimo carbad_char_replacedcter desde donde se actualiza.cause - La causa de la actualizacibad_char_replacedn. Puede ser cualquiera de las
constantes INSERT_CHARS, DELETE_CHARS, CHANGE_SEQUENCE