5 #include <Poco/UTF8String.h>
29 for ( _it=_mapStemmer.begin(); _it!=_mapStemmer.end(); ++_it )
30 sb_stemmer_delete(_it->second);
36 std::map<WORD_CONTENT_OFFSET, SSTRING>::const_iterator it;
37 std::string stemmerString;
39 sb_stemmer* stemmer = NULL;
43 stemmer = getStemmer( iso639_1 );
46 stemmerString = Poco::UTF8::toLower(it->second);
47 const sb_symbol * stemmed = sb_stemmer_stem( stemmer, (
const sb_symbol*)stemmerString.c_str(), stemmerString.size() );
60 std::map<WORD_CONTENT_OFFSET, WORD_LENGTH>::const_iterator it1;
61 std::cout <<
"token \t norm" <<
std::endl;
62 std::cout <<
"----- \t ----" <<
std::endl;
65 std::cout << lCData.
_mapTokens[it1->first] <<
'\t'
73 sb_stemmer* SnowballPlugin::getStemmer(
const SSTRING& iso639_1 )
75 _it=_mapStemmer.find( iso639_1 );
76 if ( _it==_mapStemmer.end() )
78 _stemmer = sb_stemmer_new((
char*)iso639_1.c_str(), NULL);
79 _mapStemmer[ iso639_1 ] = _stemmer;
83 _stemmer = _it->second;