Google e la "copia cache"

La cache è uno strumento dell’informatica del quale si può parlare in maniera molto generica per facilitarne la comprensione. In due parole la cache mantiene una copia dei dati ai quali si accede con maggiore frequenza. Immaginiamo di avere un’enorme quantità di dati da consultare, per accedervi occorrerà un tempo fisico variabile legato a molti fattori in gioco. L’utilizzo della cache permette di velocizzare quest’accesso poiché i dati, già letti in precedenza, sono stati conservati in un archivio temporaneo più veloce, la cache appunto. Solo se questi dati non sono presenti nella cache, o sono stati modificati, vengono consultati nell’archivio (logicamente più lento) della memoria “principale” in cui risiedono i dati. Essa, nei computer per esempio, permette di superare limiti imposti dall’attuale lentezza degli Hard Disk.
Entrando nel dettaglio esistono molti tipi di memoria cache ed affrontarli tutti in poche righe sarebbe impossibile, poiché fanno parte di quegli strumenti che, lavorando in background, riescono a rendere più agevoli le operazioni quotidiane ed a molti utenti non interessa sapere altro.

Nel motore di ricerca Google, che su questa tecnologia basa le sue funzionalità, c’è però un lato intrigante della cache. Non è raro infatti trovare un link non funzionante tra i suoi risultati, poiché non ancora aggiornato nel suo database.
A questo punto si può fare un discorso inverso e sfruttare questa memoria per accedere a dati su Internet ormai non più accessibili (per vari motivi) scavando nella cache che Google mette a disposizione, definendola una “copia di backup nell’eventualità in cui la pagina originale non sia disponibile”. La cache di Google, che tutti abbiamo notato senza forse darle il giusto peso, può rivelarsi fondamentale per recuperare (ad esempio) il testo di una pagina accidentalmente persa del proprio sito, per “indagare” su potenziali truffatori che dopo esser stati scoperti cercano di far perdere le proprie tracce, ma può essere anche usata a scopi meno nobili, quali recuperare informazioni eliminate (dagli amministratori o dalle autorità) su siti che in passato hanno trasmesso materiale illegale. Un esempio banale, se su un sito pulito come answers.yahoo.com si trovano commenti relativi ai numeri seriali di Photoshop, è facile che questa pagina possa essere rimossa da chi modera la community, ciò non toglie che per molto tempo ancora la pagina incriminata sarà elencata tra i risultati di Google e raggiungibile dalla Copia Cache.

Insomma la cache, è uno strumento potente, ma anche pericoloso, che quando non è più buona (come può accadere sul computer) o legale (come può capitare sul Web) può compromettere la stabilità di tutto il “sistema”, nel senso esteso del termine.