[successivo] [precedente] [inizio] [fine] [indice generale] [indice ridotto] [translators] [docinfo] [indice analitico] [volume] [parte]
Quando si imposta un sito Internet con molte informazioni utili ai visitatori, può essere importante mettere a disposizione un sistema di ricerca in base a delle parole chiave o delle stringhe più articolate. In questo capitolo si affronta il problema mostrando il funzionamento di ht://Dig e di freeWAIS. Il secondo di questi due è il più difficile da usare e lo si può considerare ormai superato, ma le informazioni che lo riguardano vengono conservate ugualmente in questo capitolo.
ht://Dig (1) È un motore di ricerca vero e proprio, che ottiene i dati per la costruzione dei propri indici attraverso il protocollo HTTP. Pertanto, non si tratta di una scansione del file system pura e semplice.
L'installazione di ht://Dig richiede la preparazione di un file di configurazione, seguita immediatamente dalla preparazione di alcuni file, attraverso il programma htdigconfig; successivamente si passa alla scansione periodica degli indirizzi a cui si è interessati.
In generale, ht://Dig prevede una configurazione unica, in cui annotare tutti gli indirizzi da scandire, lasciando poi alla fase di ricerca l'onere di selezionare l'ambito del contesto cercato.
La configurazione di ht://Dig si definisce in un file di testo normale (le righe bianche e quelle vuote vengono ignorate; i commenti sono preceduti dal simbolo #), rappresentato normalmente da /etc/htdig/htdig.conf
. In generale, la directory che deve contenere il file di configurazione è stabilita in fase di compilazione dei sorgenti, mentre durante il funzionamento si possono indicare file di configurazione collocati altrove, ma solo in contesti particolari.
In ogni caso, secondo la filosofia di ht://Dig ci dovrebbe essere un solo file di configurazione, sotto il controllo dell'amministratore del sistema. Segue la descrizione di alcune direttive di questo file, che comunque viene fornito in modo predefinito con molti commenti esplicativi.
Oltre al file /etc/htdig/htdig.conf
esistono comunque altri file, collocati sempre nella directory /etc/htdig/
. In generale non conviene intervenire su questi file, anche se sono stati predisposti originariamente per la lingua inglese. Eventualmente, può essere conveniente in un secondo momento la traduzione dei file HTML di questa directory, che ht://Dig usa quando costruisce le sue risposte mostrate attraverso un programma CGI apposito.
Alcuni di questi file contenuti nella directory /etc/htdig/
servono per costruire una piccola base di dati iniziale che contiene informazioni su sinonini (generata dal file /etc/htdig/synonyms
) e sulle radici delle parole (generata dai file /etc/htdig/english.*
e /etc/htdig/bad_words
). Per questo si usa il programma htdigconfig:
#
htdigconfig
[Invio]
Terminata questa fase iniziale, si passa alla scansione periodica di quanto programmato nella configurazione. Per questo si usa normalmente il programma rundig (potrebbe essere uno script che si avvale di altri programmi di ht://Dig, ma questo non ha molta importanza). Conviene distinguere due possibilità:
#
rundig -a -i
[Invio]
#
rundig -a
[Invio]
Nel primo caso si tratta di una scansione in cui la base di dati precedente, se esiste, viene messa da parte senza cancellarla, ricostruendo comunque una base di dati nuova; nel secondo caso invece, la base di dati viene sì ricostruita, ma si tiene conto di quella precedente, aggiungendo soltanto le informazioni nuove e togliendo i riferimenti a file che non esistono più. Pertanto, conviene eseguire il primo comando con una periodicità che potrebbe essere settimanale, mentre il secondo va eseguito con una frequenza maggiore, anche giornaliera. Evidentemente, conviene usare per questo il sistema Cron.
È bene osservare che la scansione avviene attraverso il protocollo HTTP ed è possibile accumulare gli indici di un sito che si trova anche all'esterno del proprio elaboratore. Pertanto, quando si configura ht://Dig per raggiungere un elaboratore esterno, è bene considerare anche il traffico (il carico della rete) che l'aggiornamento degli indici può comportare. |
Teoricamente, ht://Dig può indicizzare anche il contenuto di file PDF, PostScript e di altri formati, purché siano disponibili alcuni programmi di conversione. In generale, non è conveniente abilitare questa funzionalità nella configurazione di ht://Dig, perché la scansione per l'accumulo delle informazioni diventa molto pesante, sia per la rete, sia per l'elaborazione che ha luogo; inoltre, i visitatori che trovano le informazioni contenute in file di questo tipo, possono trovarsi poi in difficoltà, mentre è auspicabile che le stesse notizie siano accessibili anche attraverso pagine HTML normali. Pertanto, è bene prendere in considerazione la direttiva di configurazione bad_extensions, aggiungendo tutte queste estensioni che non conviene prendere in considerazione.
Il programma con il quale si interroga la base di dati costruita da ht://Dig è htsearch, che si usa normalmente come programma CGI, ma si può utilizzare anche attraverso la riga di comando, tenendo conto però che la risposta è sempre in forma di pagina HTML. Data la sua natura, il programma viene installato normalmente all'interno della directory usata per i programmi CGI. Per esempio, potrebbe trattarsi dell'indirizzo http://dinkel.brot.dg/cgi-bin/htsearch
. Segue la figura di ciò che si vede la prima volta (senza l'indicazione di una stringa di ricerca):
|
Nella parte finale della pagina si ottiene un modulo da compilare per la ricerca. Ecco cosa si può ottenere quando si indica qualche parola chiave significativa:
|
Eventualmente, può essere conveniente realizzare una modulo HTML personalizzato, così da poter anche tradurre alcuni termini:(2)
|
Attraverso la modifica di alcuni campi nascosti è possibile limitare la ricerca a un solo sito o a una porzione di questo. Per esempio, per richiedere una ricerca limitata esclusivamente a ciò che si articola a partire da http://dinkel.brot.dg/a2/
(purché i dati relativi siano stati scanditi in precedenza), basta ritoccare la prima parte del modulo nel modo seguente:
|
Inoltre, è possibile escludere espressamente qualcosa; per esempio si potrebbe voler ignorare quanto si articola sotto http://dinkel.brot.dg/a2/pasticci/
:
|
È importante osservare che le stringhe di inclusione e quelle di esclusione vengono confrontate con una parte qualunque dell'indirizzo; per esempio è facile specificare delle estensioni, come in questo caso in cui si vogliono escludere i file che potrebbero essere in formato SGML:
|
Quando si inseriscono delle limitazioni, come in questi esempi, le pagine che mostrano il risultato della ricerca aggiungono un modulo per altre ricerche, in cui valgono le stesse limitazioni di partenza.
Gli esempi mostrano tutti dei moduli che usano un metodo GET per accedere al programma CGI. ht://Dig funziona perfettamente anche con l'uso di un metodo POST, ma in tal modo viene a mancare la possibilità di memorizzare nei file delle registrazioni del servente HTTP interrogato l'indirizzo referente con la stringa di richiesta. In pratica, in tal modo, programmi come Webalizer non hanno poi la possibilità di estrapolare le interrogazioni fatte per raggiungere le pagine del sito a cui si riferiscono. |
Anche se sconsigliabile secondo la filosofia di ht://Dig, è possibile gestire delle configurazioni multiple, ovvero più file di configurazione a cui si abbinano delle basi di dati differenti per gli indici. Tuttavia, è possibile collocare i file di configurazione alternativi solo nella stessa directory in cui è previsto quello normale, ovvero /etc/htdig/
, mantenendo l'estensione .conf
. Per esempio, si può definire un file di configurazione alternativo, corrispondente a /etc/htdig/prova.conf
, mentre non si può usare il file /etc/htdig/prova.configura
.
Una volta definita la configurazione alternativa, si deve procedere a generare la sua basi di dati con rundig, aggiungendo l'opzione -c, per esempio così:
#
rundig -a -i -c /etc/htdig/prova.conf
[Invio]
Successivamente, nel modulo usato per interrogare la basi di dati, si indica il riferimento alla configurazione prova (senza estensione e senza percorso):
|
freeWAIS (3) è la versione libera di WAIS (4) (Wide area information service), un servizio ideato per consentire l'indicizzazione dei dati e conseguentemente la ricerca in base a stringhe di interrogazione. Il servizio si estende attraverso la rete, per mezzo del protocollo Z39.50 (oppure WAIS, a seconda delle preferenze), che normalmente fa uso della porta 120 con il trasporto TCP. Attualmente, per evitare confusione tra le varie derivazioni di questo sistema, si fa riferimento normalmente a freeWAIS-sf, dove l'aggiunta «sf» rappresenta la caratteristica più importante di questa derivazione, costituita da un'estensione rispetto alla gestione degli indici. freeWAIS-sf può essere utilizzato perfettamente anche senza fare caso alle sue caratteristiche legate alla gestione della rete.
Il problema di freeWAIS-sf sta nel fatto che si trova difficilmente nelle distribuzioni GNU, probabilmente perché è stato dimenticato. In tal caso, si è costretti a procurarsi i sorgenti, provvedendo da soli alla loro compilazione. In questo capitolo viene mostrato un uso molto semplice di questo sistema, utilizzando caratteristiche essenziali e solo alcuni dei programmi che lo compongono, anche in considerazione del fatto che mancando un pacchetto predisposto appositamente per la propria distribuzione GNU si incontrano già molte difficoltà.
Se non si dispone di un pacchetto già pronto per la propria distribuzione GNU, oppure se quello che si ha è il risultato di una conversione, occorre prendersi cura di controllare e sistemare l'avvio del servizio. Per cominciare, dovrebbe essere previsto questo tipo di servizio almeno nel file /etc/services
, con le righe seguenti:
|
Successivamente occorre predisporre uno script adatto da inserire nella procedura di inizializzazione del sistema. Una versione molto semplice di questo, senza controlli, potrebbe essere simile all'esempio seguente; in particolare si potrebbe trattare del file /etc/init.d/waisserver
. Naturalmente, se per questo script si segue la politica della propria distribuzione, è meglio; inoltre, è bene verificare le opzioni passate a waisserver.
|
In alternativa, è possibile controllare waisserver attraverso il supervisore dei servizi di rete; in tal caso non si usa l'opzione -p, si fa riferimento all'alias waisserver.d e si inserisce la riga seguente nel file /etc/inetd.conf
(appare spezzata in due parti per motivi tipografici):
|
Ci può essere la necessità di sistemare anche alcuni piccoli dettagli. In particolare, è probabile che freeWAIS-sf cerchi di utilizzare il programma gzcat, inteso come un cat in grado di intervenire direttamente sui file compressi con gzip. È probabile che tale programma non esista e che al suo posto ci sia piuttosto un collegamento simbolico denominato zcat, che punta al solito gzip con il quale si ottiene lo stesso risultato. Se ciò accade, si può risolvere il problema con lo script che viene mostrato di seguito:
|
Se waisserver viene avviato con i privilegi di un utente comune, come nobody, bisogna provvedere in qualche modo al file utilizzato per la registrazione degli eventi. In pratica, se si pretende che waisserver funzioni con l'identità nobody, occorre fare in modo che possa creare il suo file. La soluzione a questo problema potrebbe essere quella di creare una sottodirectory all'interno di |
Segue il modello sintattico per l'avvio del demone:
waisserver [opzioni] |
waisserver.d [opzioni] |
waisserver e waisserver.d sono due nomi che fanno capo allo stesso eseguibile; di solito, uno dei due è un collegamento simbolico all'altro. La distinzione dei nomi serve a definirne il contesto: waisserver si utilizza per il funzionamento autonomo, mentre waisserver.d si usa quando deve essere sottoposto al controllo del supervisore dei servizi di rete.
Nella descrizione delle opzioni, si osservi in particolare il caso di -d, che serve a definire una directory come posizione predefinita per i file degli indici da utilizzare per le ricerche.
|
In precedenza sono stati mostrati alcuni esempi che adesso è il momento di descrivere. Nel caso dell'avvio di waisserver in modo indipendente dal supervisore dei servizi di rete, è stato mostrato il comando seguente:
waisserver -p -u nobody -l 10 -e /var/log/wais.log -d /var/lib/wais & |
Per sicurezza è stata usata l'opzione -p, in modo da rendere esplicito il fatto che si deve mettere in ascolto delle richieste attraverso la rete; viene utilizzata l'opzione -u in modo da limitare i privilegi a quelli dell'utente nobody; viene richiesto un livello diagnostico massimo, attraverso il file /var/log/wais.log
; infine, la directory iniziale per la ricerca degli indici è /var/lib/wais/
.
È importante osservare che in questo modo, waisserver deve essere messo esplicitamente in funzione sullo sfondo.
Per quanto riguarda la gestione del servizio attraverso il supervisore dei servizi di rete, è stato mostrato il caso seguente, che nella realtà deve apparire su una sola riga:
|
Viene usato il nome waisserver.d, per richiedere implicitamente l'utilizzo dei flussi di dati standard, invece di lasciare che si occupi da solo dell'ascolto delle richieste dalla rete; in tal modo, non è stata usata nemmeno l'opzione -s, che comunque non sarebbe stata sbagliata. Si può osservare quindi che l'opzione -p è assente, necessariamente, mentre non è stata usata l'opzione -u, dal momento che il programma viene già avviato con i privilegi dell'utente nobody. In questo caso, si è preferito lasciare il livello diagnostico al valore predefinito.
freeWAIS-sf permette di effettuare delle ricerche solo se prima sono stati costruiti gli indici dei dati a cui si vuole fare riferimento. Questi indici riguardano esclusivamente dei file di testo, o comunque file il cui contenuto sia leggibile come lo può essere un file di testo normale. Nella fase di creazione degli indici è possibile specificare delle particolarità che qui non vengono descritte; tuttavia, queste possono essere apprese leggendo la documentazione originale.
Una volta realizzati gli indici, le richieste per effettuare le ricerche devono comprendere l'indicazione dell'indice a cui si vuole fare riferimento, oppure si ricade nell'indice predefinito che è INFO, il quale deve essere collocato nella directory predefinita, stabilita all'avvio del servente.
Ogni indice è composto da molti file, accomunati dalla stessa radice, corrispondente al nome che si attribuisce all'indice. In pratica, volendo fare riferimento all'indice prova, vengono generati una serie di file, corrispondenti al modello prova.*
.
A titolo di esempio introduttivo, l'indice prova collocato nella directory /var/lib/wais/
, generato in base al contenuto delle pagine di manuale, potrebbe essere generato con il comando seguente, che mostra sullo schermo una serie di informazioni simili a quelle che si possono vedere sotto.
#
waisindex -d /var/lib/wais/prova -r /usr/man
[Invio]
718: 0: Sep 27 15:33:43 1999: 6: Starting to build database /var/lib/wais/prova 718: 1: Sep 27 15:33:43 1999: -2: Warning: couldn't open /var/lib/wais/prova.syn synonym translation disabled 718: 2: Sep 27 15:33:43 1999: 6: File: /usr/man/man5/adduser.conf.5.gz 718: 3: Sep 27 15:33:43 1999: 6: File: /usr/man/man5/sources.list.5.gz 718: 4: Sep 27 15:33:44 1999: 6: File: /usr/man/man5/locatedb.5.gz 718: 5: Sep 27 15:33:44 1999: 6: File: /usr/man/man5/keymaps.5.gz 718: 6: Sep 27 15:33:44 1999: 6: File: /usr/man/man5/porttime.5.gz 718: 7: Sep 27 15:33:44 1999: 6: File: /usr/man/man5/faillog.5.gz ... 718: 1444: Sep 27 15:36:21 1999: 6: adding word 'fr' into the stoplist /var/lib/wais/prova.stop since it has 21941 occurences (limit 20000). ... 718: 2577: Sep 27 15:38:40 1999: 100: Total word count for dictionary is: 1822254 718: 2578: Sep 27 15:38:42 1999: 6: Finished build |
A seconda delle politica che si vuole attuare, questa operazione potrebbe essere fatta anche utilizzando privilegi inferiori a quelli dell'utente root; in tal caso andrebbero predisposti opportunamente i permessi relativi alla directory /var/lib/wais/
.
Per quanto riguarda l'accesso alle informazioni generate, è sufficiente che siano disponibili i permessi di lettura, dal momento che è previsto un solo procedimento di scrittura, precisamente nel momento della creazione dell'indice.
L'accesso locale agli indici dovrebbe essere consentito anche senza utilizzare la rete (dipende da come sono stati compilati i programmi), utilizzando waissearch, per esempio nel modo seguente, dove si cercano tutte le corrispondenze con la parola «crypt». Si osservi anche il modo attraverso il quale si esce dal programma.
$
waissearch -d /var/lib/wais/prova crypt
[Invio]
Search Response: NumberOfRecordsReturned: 13 1: Score: 473, lines: 122 'crypt.3 /usr/man/man3/' 2: Score: 427, lines: 90 'create_user.7l /usr/man/man7/' 3: Score: 422, lines: 115 'pg_hba.conf.5 /usr/man/man5/' 4: Score: 354, lines: 86 'getpass.3 /usr/man/man3/' 5: Score: 332, lines: 166 'wavelan_cs.4 /usr/man/man4/' 6: Score: 323, lines: 153 'wavelan.4 /usr/man/man4/' 7: Score: 289, lines: 251 'undocumented.3 /usr/man/man3/' 8: Score: 221, lines: 563 'login.defs.5 /usr/man/man5/' 9: Score: 175, lines: 754 'Opcode.3pm /usr/man/man3/' 10: Score: 160, lines:1147 'pppd.8 /usr/man/man8/' 11: Score: 114, lines:3161 'perldiag.1p /usr/man/man1/' 12: Score: 100, lines:4606 'perlfunc.1p /usr/man/man1/' 13: Score: 91, lines:6223 'perltoc.1p /usr/man/man1/' |
View document number [type 0 or q to quit]:
q
[Invio]
Search for new words [type q to quit]:
q
[Invio]
Se invece è necessario accedere a un servente presso un nodo di rete remoto, si può aggiungere l'indicazione del suo nome o del suo indirizzo:
$
waissearch -h dinkel.brot.dg -d /var/lib/wais/prova crypt
[Invio]
Eventualmente potrebbe non essere necessario specificare il percorso per l'indice. Per la precisione, questo vale nel caso si acceda utilizzando il protocollo di rete, indicando il nodo, quando l'indice deve essere cercato nella directory predefinita secondo quanto stabilito nella riga di comando di avvio del servente. In tal caso:
$
waissearch -h dinkel.brot.dg -d prova crypt
[Invio]
Una volta ottenuto l'elenco dei file che corrispondono alla stringa di ricerca, si può ottenerne il contenuto, specificando il numero progressivo. Nel caso del primo esempio, se invece di uscire con il comando q fosse stato selezionato il numero uno, ecco quello che avrebbe potuto essere il risultato (ridotto in più punti):
Headline: crypt.3 /usr/man/man3/ .\" Michael Haardt (michael@cantor.informatik.rwth.aachen.de) .\" Sat Sep 3 22:00:30 MET DST 1994 .\" .\" This is free documentation; you can redistribute it and/or .\" modify it under the terms of the GNU General Public License as .\" published by the Free Software Foundation; either version 2 of .\" the License, or (at your option) any later version. ... .\" " .TH CRYPT 3 "September 3, 1994" "" "Library functions" .SH NAME crypt \- password and data encryption .SH SYNOPSIS .B #define _XOPEN_SOURCE .br .B #include <unistd.h> .sp .BI "char *crypt(const char *" key ", const char *" salt ); .SH DESCRIPTION .B crypt ... .SH "CONFORMING TO" SVID, X/OPEN, BSD 4.3 .SH "SEE ALSO" .BR login "(1), " passwd "(1), " encrypt "(3), " getpass "(3), " passwd (5) |
Evidentemente, il file viene ottenuto così come si trova, con l'aggiunta di un'intestazione con l'informazione di cosa si tratta. Probabilmente, la cosa più importante è sapere dove si trova il file, ma questo è già stato determinato prima.
È proprio in situazioni come questa che è necessario predisporre lo script gzcat, perché i file delle pagine di manuale potrebbero essere stati compressi per risparmiare spazio. |
Segue lo schema sintattico per l'utilizzo di waisindex:
waisindex [opzioni] file_o_directory... |
waisindex crea un indice delle parole contenute nei file indicati, o in quelli delle directory indicate, in maniera che poi si possa fare una ricerca rapida per queste parole, determinando quali siano i file che le contengono. In generale, lo spazio utilizzato dai file che costituiscono l'indice è quasi lo stesso di quello dei file che vengono scanditi.
La creazione di un indice è un'operazione a senso unico; è consentita l'aggiunta in riferimento ad altri file, ma non l'aggiornamento di dati già analizzati. In generale, deve essere ripetuta l'operazione ogni volta che si vuole aggiornare un indice in base ai cambiamenti dei dati originali.
|
Negli esempi seguenti si suppone di utilizzare i privilegi di un utente diverso da root, che però abbia la possibilità di creare gli indici nelle directory relative e che possa accedere in lettura ai dati da scandire.
$
waisindex -d /var/lib/wais/man -r /usr/man
[Invio]
Genera i file degli indici /var/lib/wais/man.*
, in base ai dati contenuti a partire dalla directory /usr/man/
.
$
waisindex -a -d /var/lib/wais/man -r /usr/local/man
[Invio]
Aggiunge agli indici creati nell'esempio precedente le informazioni sui file che si trovano a partire dalla directory /usr/local/man/
.
$
waisindex -d /var/lib/wais/INFO -r /usr/man
[Invio]
Crea l'indice INFO, nella directory /var/lib/wais/
. Convenzionalmente, l'indice INFO è quello predefinito.
Segue lo schema sintattico per l'utilizzo di waissearch:
waissearch [opzioni] file_o_directory... |
waissearch accede a un indice, leggendolo direttamente dal file system, o utilizzando un servente per mezzo della rete, mostrando il risultato della ricerca e restituendo eventualmente il contenuto di uno o più file corrispondenti. waissearch è pensato per essere usato in modo interattivo, ma potrebbe essere anche inserito in uno script, utilizzando qualche piccolo accorgimento.
|
Segue la descrizione di alcuni esempi.
$
waissearch -d /var/lib/wais/man crypt
[Invio]
Cerca nell'indice /var/lib/wais/man
la corrispondenza per la parola «crypt».
$
waissearch -h dinkel.brot.dg -d /var/lib/wais/man crypt
[Invio]
Come nell'esempio precedente, ma utilizzando il servizio del nodo dinkel.brot.dg
.
$
waissearch -h dinkel.brot.dg -d man crypt
[Invio]
Come nell'esempio precedente, contando sul fatto il servizio remoto sia configurato correttamente, per ciò che riguarda la directory degli indici.
$
waissearch -h dinkel.brot.dg crypt
[Invio]
Cerca nell'indice predefinito del nodo dinkel.brot.dg
le corrispondenze per la parola «crypt». In generale, l'indice predefinito corrisponde al nome INFO.
|
L'esempio rappresenta uno script molto banale, in grado di richiamare waissearch, con gli stessi argomenti passati allo script, facendo in modo che termini immediatamente di funzionare dopo aver mostrato l'elenco delle corrispondenze. Lo stesso esempio permette di capire come incorporare waissearch in uno script di altro genere.
Per utilizzare al meglio questo sistema di ricerca, occorre conoscere la sintassi per le interrogazioni. Le possibilità effettive possono dipendere dal modo in cui sono compilati i sorgenti. In generale, dovrebbero essere valide le regole che vengono descritte qui.
Per prima cosa, un elenco di parole spaziate rappresenta la ricerca di tutti i file che contengono almeno una di quelle parole, mentre una frase delimitata, che viene passata come un solo argomento, rappresenta la corrispondenza esatta con quella frase. Inoltre, si possono usare gli operatori booleani and e or e le parentesi tonde. Evidentemente, tali parole non possono essere usate come obiettivi di una ricerca; inoltre, è evidente che l'operatore or è predefinito.
Vale la pena di soffermarsi sull'operatore not, che va inteso come un «AND NOT» normale, per cui va usato come operatore binario (e non unario come sarebbe nella normalità). In pratica, l'interrogazione seguente non è valida:
|
Per individuare tutti i file che non contengono una cerca parola, occorre indicare prima cosa devono contenere. In pratica, l'esempio va corretto nel modo seguente:
|
Infine, si possono indicare delle parole incomplete utilizzando il carattere jolly *, che ha lo stesso significato intuitivo che si conosce per le shell. Non sono previsti altri caratteri del genere.
|
Senza ricorrere al protocollo usato da freeWAIS-sf, è possibile predisporre un sistema CGI molto semplice che si avvalga localmente di waissearch per generare un indice dei documenti HTML che corrispondono a un certo modello di ricerca.
Supponendo di gestire un sito HTTP, che localmente si articola a partire dalla directory /home/httpd/html/
, si comincia con la costruzione di un indice:
$
waisindex -d /var/lib/wais/http -r /home/httpd/html
[Invio]
Così si crea l'indice http nella directory /var/lib/wais/
, in base al contenuto della directory /home/httpd/html/
. Quello che serve adesso è un programma CGI da usare nello stesso elaboratore che offre il servizio HTTP, in modo da poter interrogare l'indice appena creato.
|
Il programma mostrato fa uso della solita libreria mini-lib.pl
, descritta nel capitolo 238. Richiamando il programma attraverso un navigatore (dovrebbe trattarsi dell'URI http://nodo/cgi-bin/cerca.pl
), si ottiene ciò che si vede nella figura 243.26.
|
Provando a inserire una richiesta composta dalla stringa «apache httpd», che indica di individuare i file contenenti la parola «apache» o la parola «httpd», indifferentemente, si potrebbe ottenere un risultato simile a quello mostrato nella figura 243.27.
|
Naturalmente, il programma in questione può essere abbellito, soprattutto con una guida che mostri la sintassi che può essere utilizzata per le interrogazioni.
ht://Dig
Ulrich Pfeifer, freeWAIS-sh, 1995
<http://www.is.informatik.uni-duisburg.de/projects/freeWAIS-sf/>
Norbert Gövert, Ulrich Pfeifer, SFgate, 1997
Leopoldo Saggin, freeWAIS 2.x & SFgate 5.x User Guide with Figures and Live Examples, 1997
George Eckel, Creare un server Internet con UNIX, 1995 Jackson Libri
Appunti di informatica libera 2006.07.01 --- Copyright © 2000-2006 Daniele Giacomini -- <daniele (ad) swlibero·org>
2) La dichiarazione del modulo, con l'elemento FORM va verificata per quanto riguarda l'attributo ACTION, che deve puntare esattamente al programma CGI di ht://Dig, presso il sito che interessa.
3) freeWAIS software libero con licenza particolare
4) WAIS software libero con licenza particolare (almeno nelle prime versioni)
Dovrebbe essere possibile fare riferimento a questa pagina anche con il nome indicizzazione_e_motori_di_ricerca.htm
[successivo] [precedente] [inizio] [fine] [indice generale] [indice ridotto] [translators] [docinfo] [indice analitico]