Lucene.Net in Dexter

La settimana scorsa parlavo con Simone (qui trovate un suo post a riguardo) della possibilità di integrare il motore di Lucence.Net come search provier per il proprio blog engine (sia io che Simone siamo dev su due progetti differenti di BlogEngine).
Per chi non lo conoscesse Lucence.Net è il porting di un già ben noto Framework, presente nel mondo Java da diversi anni, che permette di effettuare ricerche full-text su un database proprietario basato su filesystem qiundi senza la necessità di dover installare nulla sul server.
Già in passato avevo avuto modo di utilizzarlo (vedi qui e qui), ma devo dire che l’ultima versione è parecchio migliorata in stabilità (la versione precedente al subentro di JBoss lamentava problemi di integrità del database).
La cosa brillante di questo Framework risiede nella sua velocità di ricerca a dir poco impressionate, come mostrato dallo screenshot seguente:

8-9-2009 1-32-16 PM

Oltre alla velocità di ricerca, ci sono diverse features che lo rendono appetibile, come la possibilità di avere un “Did you mean” stile google, gli Analyzer personalizzati per la lingua (es: cercando persona vengono cercati anche i termini comuni tipo persone) e la possibilità di effettuare ricerche per similarità, ossia creare una correlazione tra i contenuti.

8-10-2009 6-10-37 PM

Come potete vedere dagli screenshot precedenti, la prossima build di Dexter implementa già Lucence.Net v.2.4 sia come search engine che come correlatore di contenuti.

Purtroppo questo Framework è molto scarso dal lato della documentazione, sia per il porting .NET che per la versione Java, il che mi fa apprezzare ancor di più gli sforzi realizzati da Microsoft e da tutte le altre organizzazioni, che compiono per fornire agli sviluppatori una documentazione adeguata.
Speriamo che anche per Lucence si sforzino un po’ di più.

Ciauz


Comments