Beiträge getagged ‘Apache Solr’

Anleitung: Dokumentensuche mit Apache Solr in Drupal mit Tika

27 Juni 2011

Dateianhänge durchsuchen wie PDF, DOC,… mit Tika auf einem Ubuntu Webserver

In Drupal können mit dem Modul Apache Solr Attachments auch Dateianhänge indiziert werden. Dies ist nützlich wenn man viele PDF´s,.. auf seinem Webserver hat. Mit Tika können Texte und Metadaten extrahiert werden und an Lucene zur Indizierung weitergegeben werden. Dies ist das perfekte Modul für jedes Intranet das mit Drupal erstellt wird.

Extrahierbare Dokumententypen:

  • PDF
  • DOC
  • DOCX
  • XLS
  • XLSX
  • VSD (Visio)
  • TXT
  • uvm.

» Weiterlesen: Anleitung: Dokumentensuche mit Apache Solr in Drupal mit Tika

Anleitung: Apache Solr UTF-8 aktivieren – Tomcat

27 Juni 2011

In dem vorherigen Beitrag habe ich euch gezeigt, wie Ihr Apache Solr für Drupal einrichtet. Apache Solr kann von Haus aus nicht mir Umlauten umgehen. Dies ist im deutschsprachigen Raum natürlich nicht vorteilhaft, denn er findet bei einem Wort mit einem Umlaut gar kein Ergebnis.

Abhilfe schafft das anpassen der server.xml Datei. Hier muss URIEncoding auf UTF-8 gesetzt werden.

» Weiterlesen: Anleitung: Apache Solr UTF-8 aktivieren – Tomcat

Anleitung: Apache Solr optimierte Suche für Drupal 6 auf einem Ubuntu 8.04 Server

27 Juni 2011

Mit Apache Solr können Sie eine intelligente Suchmaschine in Drupal integrieren. Apache Solr läuft mit einem Java Servlet Container. Wir verwenden hierzu Tomcat6.

Die Funktionen im Überblick:

  • Volltextsuche
  • Faceted Search
  • Filterung
  • Ähnliche Treffer
  • Relevanz
  • PDF, DOC, XLS,… Suche (Dokumentensuche mit Tika)
  • Indizierung
  • uvm.

» Weiterlesen: Anleitung: Apache Solr optimierte Suche für Drupal 6 auf einem Ubuntu 8.04 Server