Lucene

El Vikipedio, la libera enciklopedio

Apache Lucene estas libera/malfermfonta informserĉada softvarobiblioteko, origine kreita en Java fare de Doug Cutting. Ĝi estas apogita fare de la Apache Softvaro-Fonduso kaj estas distribuata sub la Apache-Softvarlicenco.

Lucene estis adaptita al aliaj programlingvoj inkluzive de Delfo, Perl, C++, Python, Ruby, kaj PHP.[1]

Historio[redakti | redakti fonton]

Lucene estis origine verkita fare de Doug Cutting en 1999.[2] Ĝi estis komence havebla por elŝuto de sia hejmo ĉe la SourceForge retejo. Ĝi aliĝis al la Jakarta familio de la Apache Softvaro-Fonduso de malfermfontaj Java produktoj en septembro 2001 kaj iĝis propra pintnivela Apache projekto en februaro 2005. Ĝis antaŭ nelonge, ĝi inkludis kelkajn sub-projektojn, kiel ekzemple Lucene.NET, Mahout, Solr kaj Nutch. Solr estis kunfandita en la Lucene-projekton mem kaj Mahout, Nutch, kaj Tika estis proponitaj kiel sendependaj pintnivelaj projektoj.

Ecoj kaj ĝenerala uzo[redakti | redakti fonton]

Taŭga por ajna aplikiĝo kiu postulas plenan tekstoindicigon kaj serĉadokapablecon, Lucene estis aparte rekonita[3][4] pro sia utileco en la realigo kaj efikigo de Interretaj serĉiloj , kaj ankaŭ por loka, unu-reteja serĉado.

En la kerno de la logika arkitekturo de Lucene estas la ideo de dokumento enhavanta kampojn de teksto. Tiu fleksebleco permesas la API de Lucene esti sendependa de la dosierformato. Dokumentoj en formatoj kiel PDF, HTML, Microsoft Word, kaj OpenDocument , same kiel multaj aliaj (krom bildoj), povas esti indeksitaj tiel longe kiel iliaj tekstaj informoj povas esti eltiritaj.[necesas citaĵo]

Lucene-bazitaj projektoj[redakti | redakti fonton]

Lucene mem estas nur biblioteko por indicigo kaj serĉado, kaj ne enhavas funkciecon de trolado kaj HTML analizado. Tamen, pluraj projektoj etendas la kapablecon de Lucene:

  • Apache Nutch - disponigas interretokrabladon kaj HTML-analizadon
  • Apache Solr - entreprena serĉoservilo
  • ElasticSearch - entreprena serĉoservilo
  • Compass (Kompaso)- Java Search Engine Framework
  • DocFetcher - multplatforma solkomputila serĉaplikaĵo

Lucene. NET[redakti | redakti fonton]

Lucene. NET estas faco de Lucene skribita en C no. kaj celas .NET uzantojn.[necesas citaĵo]

Uzantoj[redakti | redakti fonton]

Por listo de firmaoj kiuj uzas Lucene (prefere ol etendi), vidu la "Powered By" paĝon[5] de Lucene .[5] Ekzemple, Twitter uzas Lucene por sia realtempa serĉo.[6]

Vidu ankaŭ[redakti | redakti fonton]

Referencoj[redakti | redakti fonton]

  1. Lucene implementations
  2. Better Search with Apache Lucene and Solr (19 November 2007). Arkivita el la originalo je 2012-01-31. Alirita 2013-02-05. Arkivita kopio. Arkivita el la originalo je 2012-01-31. Alirita 2013-02-05.
  3. Perner, Petra. (2007) Machine Learning and Data Mining in Pattern Recognition: 5th International Conference. Springer, p. 387. ISBN 978-3-540-73498-7.
  4. GNU/Linux Semantic Storage System
  5. 5,0 5,1 PoweredBy
  6. Twitter uses Lucene

Bibliografio[redakti | redakti fonton]

  • Gospodnetic, Otis; Erik Hatcher, Michael McCandless. (2009-06-28) Lucene in Action, 2‑a eldono, Manning Publications, p. 475. ISBN 1-9339-8817-7.
  • Gospodnetic, Otis; Erik Hatcher. (2004-12-01) Lucene in Action, 1‑a eldono, Manning Publications, p. 456. ISBN 978-1-9323-9428-3.

Eksteraj ligiloj[redakti | redakti fonton]

Fonto[redakti | redakti fonton]

En tiu ĉi artikolo estas uzita maŝina traduko de WikiTrans de teksto el la artikolo Lucene en la angla Vikipedio.