Beiträge getagged ‘Suchmaschine’

Anleitung: Dokumentensuche mit Apache Solr in Drupal mit Tika

27 Juni 2011

Dateianhänge durchsuchen wie PDF, DOC,… mit Tika auf einem Ubuntu Webserver

In Drupal können mit dem Modul Apache Solr Attachments auch Dateianhänge indiziert werden. Dies ist nützlich wenn man viele PDF´s,.. auf seinem Webserver hat. Mit Tika können Texte und Metadaten extrahiert werden und an Lucene zur Indizierung weitergegeben werden. Dies ist das perfekte Modul für jedes Intranet das mit Drupal erstellt wird.

Extrahierbare Dokumententypen:

  • PDF
  • DOC
  • DOCX
  • XLS
  • XLSX
  • VSD (Visio)
  • TXT
  • uvm.

» Weiterlesen: Anleitung: Dokumentensuche mit Apache Solr in Drupal mit Tika