Aiuto:Download di Wikipedia

  • D: È possibile scaricare l'intera Wikipedia per conservarla nel computer, evitando quindi di collegarsi ogni volta a Internet per la consultazione?
  • R: Certo che sì, in tanti modi.

Kiwix è un software libero (e gratuito) per leggere non in linea dei contenuti web; gira su Windows, Mac OS X, Android e GNU/Linux. È pensato per leggere Wikipedia in assenza di una connessione a internet da un archivio ZIM, un formato aperto ad alta compressione che sa gestire anche immagini e metadati aggiuntivi.

Lo sviluppo di Kiwix (http://www.kiwix.org) è indipendente da Wikimedia, ma Wikimedia ha collaborato ad alcuni miglioramenti e l'ha reso il lettore non in linea ufficiale per Wikipedia e gli altri progetti.

  Lo stesso argomento in dettaglio: Wikipedia:Kiwix.
 
Screenshot della versione 0.9 di Kiwix

Altri modi

modifica

Si può scaricare l'intero archivio, che in realtà è un enorme dump XML del database, che va in seguito utilizzato "in locale" tramite lo stesso software usato per far funzionare Wikipedia: MediaWiki. Altrimenti esiste il download di una più comoda versione in HTML statico di Wikipedia, ma non aggiornata molto spesso. In alternativa esistono programmi come Zipedia (un'estensione per Firefox[1]) ed il software Wikitaxi[2], che permettono di leggere direttamente i dump xml. Inoltre sono stati creati ulteriori programmi per la consultazione off-line di Wikipedia: Kiwix[3], che consentono di scaricare il database in formati particolari e poi consultarli offline. Kiwix usa il formato aperto openZIM. È possibile decidere se si vogliano scaricare le immagini o meno; i database sono disponibili per il download anche attraverso dei file .torrent. È possibile anche creare e scaricare sul proprio computer dei "libri di Wikipedia", che altro non sono che raccolte di voci (quindi non si parla dell'intero database, ma sue parti selezionate a piacere), in formato PDF, ODT, ZIM o ePub.

Esistono anche delle versioni su DVD di Wikipedia in lingua italiana (e, volendo, anche in altre lingue, al momento inglese e tedesca). C'è da notare che questo stato di fatto non impedisce, né scoraggia, la creazione di ulteriori versioni da parte di soggetti diversi con tecnologie e modalità diverse.

Salvare singole pagine

modifica

Per salvare singole pagine di Wikipedia sul proprio computer, è possibile:

  • Scaricare una versione in PDF della pagina, cliccando sul collegamento "Scarica come PDF" fra gli strumenti a sinistra (nella sezione "stampa/esporta"). Si tratta dell'uso più facile ed immediato della funzione dei "Libri di Wikipedia";
  • Utilizzare la funzione "salva pagina con nome" del proprio browser web, eventualmente applicandola alla versione stampabile della pagina. Si noti che spesso questo tipo di salvataggio genera un file .htm più una cartella dello stesso nome contenente le immagini ed altri file di supporto: in caso di spostamento, il file principale e la cartella vanno movimentati assieme, per mantenere la visualizzazione corretta. Internet Explorer è in grado anche di salvare una pagina web creando un unico file contenente tutto il necessario, con estensione .mht; altri browser supportano funzioni simili in modo nativo o tramite l'installazione di plugin aggiuntivi;
  • Esportare la pagina in formato XML tramite lo strumento Speciale:Esporta (Esempio: Speciale:Esporta/Aiuto:Download di Wikipedia), utilizzando poi un programma esterno in grado di leggere i file XML di MediaWiki, o importandole su un altro sito wiki. Lo strumento permette anche di esportare più pagine in un singolo file, ma è utile solo per una serie limitata di usi. Si ricorda che, a differenza dell'esportazione in PDF o HTML, l'output ottenuto in questo modo non è immediatamente visualizzabile (sebbene i PDF necessitino di Adobe Reader per venire letti, tale applicativo gratuito è estremamente diffuso), e non incorpora le immagini.

Libri di Wikipedia

modifica
  Lo stesso argomento in dettaglio: Aiuto:Libri.
 
Libri stampati da Wikipedia con PediaPress

È possibile creare dei libri di Wikipedia, che altro non sono che delle raccolte di voci: in pratica si utilizza un'apposita funzione del software con la quale si crea un elenco di voci preesistenti riguardo ad un argomento, si salva tale elenco all'interno della propria area utente oppure in una apposita area comune, dopodiché si può richiedere che il libro venga stampato e spedito a casa propria da PediaPress (a pagamento) oppure di scaricarlo (gratuitamente) sul proprio computer in formato PDF, ODT, ZIM o ePub. Non si parla quindi di scaricare l'intero database, ma solo di selezioni di voci, raggruppate in un unico file. Qualunque utente può creare una propria raccolta di voci attraverso la procedura guidata, mentre il suo salvataggio per future modifiche richiede di essere registrati da almeno quattro giorni. Per saperne di più Aiuto:Libri e le FAQ sull'argomento.

WikiReader

modifica
 
WikiReader utilizzato in un bosco
  Lo stesso argomento in dettaglio: WikiReader.

WikiReader è un progetto nato per proporre su di un dispositivo mobile una versione offline consultabile in modalità solamente testuale (senza immagini) di speciali e-book. Come primo prodotto vi è un lettore implementato delle voci di Wikipedia. Il progetto è patrocinato da Openmoko ed è stato pubblicato il relativo codice sorgente.

Il progetto ha avuto un inizio di realizzazione con la disponibilità di un lettore portatile offline (per ora solo per Wikipedia in inglese) nell'ottobre 2009.[4] Gli aggiornamenti potranno essere ricevuti per posta, su scheda microSD, ad un costo annuo forfettario e saranno inoltre liberamente scaricabili sul sito web del WikiReader (per chi dispone di una connessione a banda larga).

Diversamente da Wikipedia, il dispositivo prevede il filtro famiglia (parental control) per la protezione dei contenuti destinati agli adulti. Non è stato reso noto al momento dell'annuncio se e quando sarà resa disponibile anche la versione italiana o in altre lingue diverse dall'inglese.

Database da eseguire con MediaWiki

modifica
  Lo stesso argomento in dettaglio: Aiuto:Analisi del database.

A grandi linee, per ottenere sul proprio PC una copia del database di Wikipedia ci sono tre cose da fare:

  1. Installare un server LAMP, MAMP o WAMP (ossia un computer GNU/Linux o macOS[5] o Windows con software Apache, PHP e MySQL)
  2. Installare MediaWiki: vedi le istruzioni di installazione in inglese (completo) o le istruzioni di installazione in italiano (incompleto)
  3. Scaricare il dump XML del database dell'edizione in lingua italiana di Wikipedia, che può essere trovata qui: http://dumps.wikimedia.org/itwiki/ (i dump sono disponibili in vari formati: solo voci, voci e pagine di servizio, voci e pagine di servizio con cronologia, ecc), quindi importarlo in MediaWiki.

Questa operazione, né facile né comoda, richiede una certa conoscenza di tali tecnologie.

HTML statico

modifica

È disponibile una vecchia versione in HTML statico da scaricare all'indirizzo http://dumps.wikimedia.org/other/static_html_dumps/; sono presenti versioni di Wikipedia nelle varie lingue, compreso l'italiano. I dati provengono da dump estemporanei di Wikipedia, eseguiti ad intervallo di diversi mesi. Gli archivi si scaricano sotto forma di un file tar compresso all'interno di un file 7z (formato standard del programma gratuito 7-Zip, che gestisce anche i tar). L'ultima versione disponibile in italiano è di giugno 2008, e non sono previste nuove versioni.

Tenere conto che in tali versioni in HTML statico la ricerca non funziona ed è necessario digitare il titolo esatto della voce nel box di ricerca.

Esempio delle dimensioni del download: per la Wikipedia in lingua italiana di giugno 2008 (il cui contatore in pagina principale indica 465.463 voci) è necessario scaricare un file compresso .7z da 1.703.402 kB (1,62 GB), che contiene al suo interno un file di archivio .tar da 27.277.480 kB (26 Gigabyte), che una volta estratto genera circa 1.547.243 file in 34.133 cartelle (per circa 25 GB di dati).

  1. ^ Pagina dell'estensione e guida.
  2. ^ Wikitaxi.org.
  3. ^ Kiwix è supportato da Wikimedia Svizzera, Wikimedia Italia e dalla Wikimedia Foundation (cfr. Offline Wikipedia, una pagina in inglese su strategy.wikimedia.org).
  4. ^ Critiche sono state espresse per il prezzo al dettaglio ritenuto da molti eccessivo, soprattutto per quello che riguarda gli aggiornamenti per chi non dispone del collegamento a banda larga
  5. ^ Il macOS Server non richiede installazioni aggiuntive

Pagine correlate

modifica

Collegamenti esterni

modifica