lucene_logo

Mucho del énfasis en Lucene 2.9 gira alrededor de mejoras en la performance, muchos de los cuales resultan de cambios de infraestructura interna de bajo nivel en la manera que Lucene maneja sus índices. La base de datos de índices está compuesta de un número de “segmentos” separados almacenados en archivos individuales.

Cuando añadimos documentos al índice, nuevos segmentos pueden crearse los cuales se agregan incrementalmente y pueden ser combinados. Lucene cachea el campo información ordenando en su FieldCache, pero el cargado del cache de campo en Lucene 2.4 y anteriores tenía una operación costosa en cuanto a performance, particularmente desde 2.4 regularmente recarga todo el cache.

Durante la preparación para el lanzamiento del release 2.9 el equipo de Lucene notó que los segmentos generalmente cambian de manera poco frecuente; cambian por ejemplo cuando combinamos o borramos, pero los segmentos tienden a permanecer estáticos. El caché ha sido modificado ahí de tal forma que sólo recarga partes del segmento que han cambiado.

Visto en InfoQ

Leave a Reply