Lucene

Apache Lucene estas libera/malfermfonta informserĉada softvarobiblioteko, origine kreita en Java fare de Doug Cutting. Ĝi estas apogita fare de la Apache Softvaro-Fonduso kaj estas distribuata sub la Apache-Softvarlicenco.

Lucene estis adaptita al aliaj programlingvoj inkluzive de Delfo, Perl, C++, Python, Ruby, kaj PHP.[1]

Historio

Lucene estis origine verkita fare de Doug Cutting en 1999.[2] Ĝi estis komence havebla por elŝuto de sia hejmo ĉe la SourceForge retejo. Ĝi aliĝis al la Jakarta familio de la Apache Softvaro-Fonduso de malfermfontaj Java produktoj en septembro 2001 kaj iĝis propra pintnivela Apache projekto en februaro 2005. Ĝis antaŭ nelonge, ĝi inkludis kelkajn sub-projektojn, kiel ekzemple Lucene.NET, Mahout, Solr kaj Nutch. Solr estis kunfandita en la Lucene-projekton mem kaj Mahout, Nutch, kaj Tika estis proponitaj kiel sendependaj pintnivelaj projektoj.

Ecoj kaj ĝenerala uzo

Taŭga por ajna aplikiĝo kiu postulas plenan tekstoindicigon kaj serĉadokapablecon, Lucene estis aparte rekonita[3][4] pro sia utileco en la realigo kaj efikigo de Interretaj serĉiloj , kaj ankaŭ por loka, unu-reteja serĉado.

En la kerno de la logika arkitekturo de Lucene estas la ideo de dokumento enhavanta kampojn de teksto. Tiu fleksebleco permesas la API de Lucene esti sendependa de la dosierformato. Dokumentoj en formatoj kiel PDF, HTML, Microsoft Word, kaj OpenDocument , same kiel multaj aliaj (krom bildoj), povas esti indeksitaj tiel longe kiel iliaj tekstaj informoj povas esti eltiritaj.[necesas citaĵo]

Lucene-bazitaj projektoj

Lucene mem estas nur biblioteko por indicigo kaj serĉado, kaj ne enhavas funkciecon de trolado kaj HTML analizado. Tamen, pluraj projektoj etendas la kapablecon de Lucene:

  • Apache Nutch - disponigas interretokrabladon kaj HTML-analizadon
  • Apache Solr - entreprena serĉoservilo
  • ElasticSearch - entreprena serĉoservilo
  • Compass (Kompaso)- Java Search Engine Framework
  • DocFetcher - multplatforma solkomputila serĉaplikaĵo

Lucene. NET

Lucene. NET estas faco de Lucene skribita en C no. kaj celas .NET uzantojn.[necesas citaĵo]

Uzantoj

Por listo de firmaoj kiuj uzas Lucene (prefere ol etendi), vidu la "Powered By" paĝon[5] de Lucene .[5] Ekzemple, Twitter uzas Lucene por sia realtempa serĉo.[6]

Vidu ankaŭ

  • Hadoop
  • Hibernate search
  • Xapian
  • Sphinx (serĉilo)
  • Listo de informserĉadaj bibliotekoj
  • LGTE
  • Informekstraktado
  • Tekstominado
  • eGranary Digital Library

Referencoj

Bibliografio

  • Gospodnetic, Otis; Erik Hatcher, Michael McCandless. (2009-06-28) Lucene in Action, 2‑a eldono, Manning Publications, p. 475. ISBN 1-9339-8817-7.
  • Gospodnetic, Otis; Erik Hatcher. (2004-12-01) Lucene in Action, 1‑a eldono, Manning Publications, p. 456. ISBN 978-1-9323-9428-3.

Eksteraj ligiloj

Fonto

En tiu ĉi artikolo estas uzita maŝina traduko de WikiTrans de teksto el la artikolo Lucene en la angla Vikipedio.