# # Dies ist eine beispielhafte htdig.conf-Datei, bei der notwendige und hilfreiche Einstellungen verwendet werden. # Viele Attribute, die eine sinvolle Default-Einstellung besitzen, sind nicht aufgeführt. # # Das Datenbank-Verzeichnis database_dir: /opt/www/htdig/db # Das Verzeichniss, ab dem abwärts gespidert wird. start_url: http://www.myhome.de/documents/ # diese Urls werden nicht gespidert exclude_urls: /cgi-bin/ .cgi # auch die Urls mit diesen Extensions werden nicht gespeichert (wenn die Aufzählung in eine neue Zeile geht, wird das mit einem \ angezeigt bad_extensions: / .wav .gz .z .sit .au .zip .tar .hqx .exe .com .gif \ .jpg .jpeg .aiff .class .map .ram .tgz .bin .rpm .mpg .mov .avi .inc .txt maintainer: myname@myhome.de # Standardname der Index-Datei in jedem Verzeichnis local_default_doc: index.html # Der Dokumentenheader (in Bytes) max_head_length: 10000 # Der Name sagts schon max_doc_size: 2000000 # Die Metatags, deren Wörter auch in die Datenbank aufgenommen werden sollen keywords_meta_tag_names: keywords description author # Die Sprache (gewährleistet das Auffinden von ä, ö, ü, ß und von ä, ö, ü und ß) locale: de_DE # übersetzt & in & translate_amp: true # übersetzt < und > in < und > translate_lt_gt: true # übersetzt " in " translate_quot: true # Die Definition der Endungswörterbücher und -scripte, in denen die deutschen Wörter mit ihren möglichen # Endungen stehen bzw. generiert werden. Daraus mach htfuzzy die beiden Datenbanken r2wgerman.db und w2rgerman.db, # die im common-Verzeichnis stehen. Diese Zeilen werden bei der Suche in rein englischen Sites nicht benötigt, weil dort die # default-Einstellungen greifen. endings_affix_file: ${common_dir}/german.aff endings_dictionary: ${common_dir}/german.0 endings_root2word_db: ${common_dir}/r2wgerman.db endings_word2root_db: ${common_dir}/w2rgerman.db # Die oberen Zeilen des Dokumentenbodys werden nicht als Excerpt gezeigt no_excerpt_show_top: true # Die Länge der Beschreibung in der Ausgabe in Bytes (excerpt heißt hier nur die Ausgabe auf der Ergebnisseite) excerpt_length: 200 # Benutzt anstatt der oberen Zeilen der Artikel ("excerpt") die Description aus den Metatags zum Anzeigen in der Ausgabe (als "Excerpt") use_meta_description: true # Der Suchalgorithmus: Werte zwischen 0 und 1: So gewichtet htsearch die Suche. Ist ziemlich kryptisch, da auch bei der Gewichtung 0 das gesuchte Wort # mit allen möglichen Endungen gesucht und gefunden wird bzw. der Substring zu Wörtern vervollständigt wird search_algorithm: exact:1 endings:0 substring:0 # Das Template, das htsearch für die Ausgabe benutzt (steht in /opt/www/htdig/common, was wiederum in der Variablen ${common_dir} gespeichert ist) # Hier wird wie erwähnt davon ausgegangen, daß die Ausgabe über den Weg mit drei Dateien erzeugt wird. header.html, footer.html, nomatch.html und # syntax.html sind Default und brauchen nicht definiert zu werden. In der "Ein-File-Alternative" muß das Attribut search_results_wrapper gesetzt werden. template_map: Long long ${common_dir}/long.html # Das Template, wenn kein Ergebnis gefunden wird nothing_found_file: ${common_dir}/nomatch.html # Das Template, wenn ein Syntaxerror vom User eingegeben wird (bei Suche mit Booleschen Operatoren) syntax_error_file: ${common_dir}/syntax.html # Das Bildchen, das bei den Suchergebnissen angezeigt wird star_image: /htdig/geeko.gif # hier kommen jetzt die Zeichen, die in der Ausgabe unten angezeigt werden, wenn mehr als 10 Seiten gefunden werden. Hier stehen standardmäßig # etliche .gif-Bilder, die beim Laden natürlich viel länger brauchen als die reinen Zeichen, daher wird empfohlen, sie zu ersetzen. next_page_text: > no_next_page_text: prev_page_text: < no_prev_page_text: page_number_text: " 1 " " 2 " " 3 " " 4 " " 5 " " 6 " " 7 " " 8 " " 9 " " 10 " no_page_number_text: " 1 " " 2 " " 3 " " 4 " " 5 " " 6 " " 7 " " 8 " " 9 " " 10 "