Utente:FrescoBot/link
Ecco i dettagli delle principali sostituzioni fatte da FrescoBot che riguardano i link: siano essi wikilink o collegamenti esterni.
Correzione sintassi link
modificaCorrezione sintassi link esterni
modifica- [HTTP://www.google.it link] --> [http://www.google.it link] = link --> link
- [http://http://www.google.it link] --> [http://www.google.it link] = link --> link
- [http:www.google.it link] --> [http://www.google.it link] = [http:www.google.it link] --> link
- [http:/www.google.it link] --> [http://www.google.it link] = [http:/www.google.it link] --> link
- [http:///www.google.it link] --> [http://www.google.it link] = link --> link
- [[http://www.google.it link]] --> [http://www.google.it link] = [link] --> link
- [[http://www.google.it link] --> [http://www.google.it link] = [link --> link
- [http:://www.google.it link] --> [http://www.google.it link] = [http:://www.google.it link] --> link
- [http//www.google.it link] --> [http://www.google.it link] = [http//www.google.it link] --> link
- parola[http://www.google.it link] --> parola [http://www.google.it link] = parolalink --> parola link
- [http://www.google.it link]parola --> [http://www.google.it link] paola = linkparola --> link parola
- alcune altre varianti minori
Correzione sintassi wikilink
modifica- [[Sonar||sidescan sonar]] --> [[Sonar|sidescan sonar]] = |sidescan sonar --> sidescan sonar
- [['''''sonar''''']] --> '''''[[sonar]]''''' = '''''sonar''''' --> sonar
- [['''sonar''']] --> '''[[sonar]]''' = '''sonar''' --> sonar
- [[''sonar'']] --> ''[[sonar]]'' = ''sonar'' --> sonar
- [["sonar"]] --> "[[sonar]]" = "sonar" --> "sonar" (considera le eccezioni[1])
- [[(sonar)]] --> ([[sonar]]) = (sonar) --> (sonar) (considera le eccezioni[2])
- [['sonar']] --> '[[sonar]]' = 'sonar' --> 'sonar' (considera le eccezioni[3])
- [[sonar,]] --> [[sonar]], = sonar, --> sonar,[4]
- un[[sonar]] --> un [[sonar]] = unsonar --> un sonar
- un[[ sonar]] --> un [[sonar]] = unsonar --> un sonar
- [[1992-1998]] --> [[1992]]-[[1998]] = 1992-1998 --> 1992-1998 (any type of dash e considera le eccezioni[5])
- [[1992-98]] --> [[1992]]-[[1998|98]] = 1992-98 --> 1992-98 (any type of dash e considera le eccezioni[5])
- [[1792-07]] --> [[1792]]-[[1807|07]] = 1792-07 --> 1792-07 (any type of dash e considera le eccezioni[5])
Piping superfluo nei wikilink
modificaUn piped link è un wikilink nella forma [[voce|testo visualizzato]] e serve per inserire un link ad una voce visualizzando un termine diverso dal titolo della pagina. La prima lettera della voce a cui si punta può essere indifferentemente maiuscola o minuscola.
Fare un piped link del tipo [[Fenomeno di Runge|fenomeno di Runge]] oppure [[Fenomeno di Runge|Fenomeno di Runge]] non solo è inutile, ma appesantisce inutilmente il sorgente della pagina. Inoltre a colpo d'occhio è anche più difficile accorgersi di eventuali errori nel testo del piped link (es. ...il lancio dei [[Giavellotti|giavellotti]] piuttosto che ...il lancio dei [[giavellotti]]).
Eliminazione underscore visibili nei wikilink
modificaes. [[Giordano_Bruno]] (Giordano_Bruno) --> [[Giordano Bruno]] (Giordano Bruno)
Quasi tutti gli underscore visibili nei wikilink sono errori. Non esistono voci nel cui nome siano effettivamente presenti degli underscore e dato che nei wikilink un underscore ha lo stesso effetto della digitazione di uno spazio, ma non è raccomandato, ho provveduto a preparare questa sostituzione.
Tuttavia visto che possono esistere cose la cui grafia include effettivamente degli underscore (es. Shift_JIS), la sostituzione viene fatta a mano e ogni link sospetto è controllato.
Wikilink a sezioni inesistenti
modificaPremesse:
- purtroppo se si crea un link ad una sezione inesistente, se almeno la pagina esiste, il collegamento appare comunque blu;
- i wikilink diretti a sezioni sono case sensitive sulla prima lettera della sezione (tuttavia con IE funzionano comunque e questo crea ulteriore confusione)
Per correggere in automatico quanti più link a sezione errati, ogni tanto faccio girare uno script specifico che per ogni pagina che contiene link a sezioni:
- segue e verifica l'esistenza di tutti i link a sezioni (anche quelli speciali generati tramite template, o almeno i più comuni)
- se identifica come errato il link genera una lista di tutte le varianti plausibili (maiuscole/minuscole anche nelle parole successive alla prima, aggiunge toglie articoli, +-s finale, trattino vs. lineetta, ecc. ecc. ecc.
- verifica l'esistenza nella pagina di destinazione di ciascuna di queste varianti e se trova una corrispondenza corregge il wikilink
Per ridurre al minimo il carico sul server e velocizzare il processo faccio uso di una cache delle sezioni esistenti e di quelle inesistenti già verificate. Naturalmente non è in grado di corregge tutti i link errati, ma toglie di mezzo quelli banali che farebbero perdere comunque un sacco di tempo ad un revisore umano.
Alcuni esempi: minuscole/maiuscole, + articolo, - articolo, - parentesi, apostrofo sbagliato, - nome della voce, scambio & con e/and e viceversa, punti, ultima lettera, ecc.
Wikilink al titolo della voce
modificaUnlinking dei collegamenti alla medesima pagina (quindi in grassetto e non cliccabili). Vedi Check Wiki #48.
Wikilink con apostrofo errato
modificaSono partito dal presupposto che come c'è scritto in Aiuto:Nomenclatura#Caratteri da evitare, tutti gli apostrofi nei titoli delle voci dovrebbero essere degli apici. Di conseguenza tutti i wikilink dovrebbero puntare a voci con gli apici. Correggendo tutti i wikilink (solo la parte prima del |) dovrebbe portare quindi ad una delle seguenti situazioni:
- il wikilink punta direttamente alla voce corretta anziché al redirect con la grafia alternativa (situazione di gran lunga prevalente)
- il wikilink rosso diventa blu (abbastanza comune e di grande utilità)
- il wikilink diventa rosso perché anche la voce (non redirect) ha l'apostrofo errato (dovrebbe essere impossibile visto che ho corretto tutte queste voci prima di far partire la sostituzione)
- il wikilink diventa rosso perché punta ad un redirect con l'apostrofo errato e non esiste una voce o un redirect con lo stesso titolo ma con l'apostrofo corretto. Ho individuato quasi tutte le voci di questo tipo. Ho chiesto l'aggiornamento di in modo da
Esempio: wikilink al redirect Le Gore di Colle di Val d’Elsa che a sua volta punta a Gore di Colle di Val d'Elsa. Purtroppo mancava il redirect da Le Gore di Colle di Val d'Elsa e per questo il link era diventato rosso. Per risolvere il problema è stato sufficiente creare l'opportuno redirect.
Pur considerando il suddetto problema (non comune e temporaneo) penso che questa sostituzione sia stata molto utile per correggere un gran numero di link errati.
Collegamenti esterni che invece puntano a pagine di wikipedia
modificaA volte si trova un collegamento esterno (tra parentesi quadre) contenente l'url di una voce su Wikipedia (italiana o altre lingue). Questi collegamenti vanno convertiti in wikilink sia per ottenere l'aspetto standard di un wikilink, sia per far funzionare correttamente i vari "puntano qui". Esempi:
- [http://it.wiki.x.io/wiki/Santa_Lucia_di_Piave] --> [[Santa Lucia di Piave]]
- [http://it.wiki.x.io/wiki/File:Stemma_guagnano.jpg] --> [[:File:Stemma guagnano.jpg]]
- [http://de.wiki.x.io/wiki/WiMAX] --> [[:de:WiMAX]]
Collegamenti esterni non più validi
modificaVerba volant, scripta manent, ma pur essendo scritte le pagine web a volte scompaiono nel nulla. Per fortuna esistono alcuni siti che si sono dati come obiettivo quello di archiviare le pagine del web. Esempi:
- Internet Archive: http://www.archive.org --> tenta di archiviare tutti i siti del web periodicamente, putroppo la consultazione spesso è molto lenta e lacunosa. Le pagine archiviate diventano visibili dopo almeno 18 mesi dalla cattura.
- WebCite: http://www.webcitation.org --> servizio su richiesta, archivia la singola pagina richiesta con tutte le immagini. Funziona bene, ma c'è da tener presente che avendo archiviato solo la pagina richiesta verosimilmente tutti i link interni presenti non funzioneranno.
Chiusura di geocities.com
modificaViene verificata l'esistenza di una versione archiviata su questi siti (in quest'ordine):
- http://www.reocities.com
- http://www.oocities.com
- http://www.archive.org
- http://www.webcitation.org (lasciato per ultimo perché salva solo la pagina oggetto del link e non il sito, quindi tutti i link interni alle sottopagine non sono funzionanti)
Sostituito dove possibile utilizzando il template {{cita web}} con il parametro urlarchivio. A volte noterete il parametro urlarchivio2, per il momento serve di riserva.
- Vedi anche
- Wikipedia:Bar/Discussioni/Geocities chiude a fine anno. Link rotti?
- Wikipedia:Bot/Richieste#Rimozione_link_geocities.com
- Discussioni template:Cita web#deadurl=yes
Chiusura di demauroparavia.it
modificaViene verificata l'esistenza di una versione archiviata su questi siti (in quest'ordine):
- http://www.archive.org
- http://www.webcitation.org (lasciato per ultimo perché salva solo la pagina oggetto del link e non il sito, quindi tutti i link interni alle sottopagine non sono funzionanti)
Sostituito dove possibile utilizzando il template {{cita web}} con il parametro urlarchivio.
- Vedi anche
Carattere invisibile LTR mark
modificaOverlinking su giorni e mesi dell'anno
modificaSi veda Discussioni progetto:Coordinamento/Connettività#Overlinking su giorni e mesi dell'anno.
Collegamenti a Commons
modificaCome da richiesta in Wikipedia:Bot/Richieste, si tratta di importare da en.wiki i collegamenti alle categorie e alle gallerie di Commons e inserirli in un template {{interprogetto}}. Purtroppo la cosa non è del tutto banale per via di una serie di motivi:
- non sempre è facile posizionare la sezione "Altri progetti" nella voce dato che, in mancanza di una sezione Collegamenti esterni, deve insinuarsi tra la fine del testo vero e proprio (che non è marcato in alcun modo e che può anche terminare con un template come {{vedi anche}}, {{EndMultiCol}}), ecc) e la selva di template di navigazione/progetto/ecc che spesso affollano il fondo delle voci...
- il link su en viene comunque verificato per essere sicuri che esista la categoria o la galleria su commons
- se il link su en o su it puntano ad un redirect su Commons, vengono seguiti, verificati e viene importata la destinazione;
- se è già presente su it un collegamento a commons lo si confronta comunque con il link su en e se non corrisponde (nemmeno provando ad aggiungere o a togliere Category:) si annota il conflitto nel log;
- se la voce italiana ha una struttura non standard (tipo categorie piazzate acrobaticamente all'inizio della voce o sezione collegamenti esterni fuori posto) la sezione altri progetti potrebbe essere posizionata erroneamente
- se sono presenti istanze multiple di inteprogetto, non integro ma ne aggiungo un ulteriore interprogetto dato che potrei trovarmi in presenza di due gruppi di link a due concetti diversi (esempio missione e missionari) con i quali è bene non duellare con un bot
- purtroppo se la voce inglese contiene un collegamento ad un argomento correlato, ma diverso da quello della voce (es. "file multimediali correlati a Sony" nella voce relativa al fondatore dell'azienda), non c'è modo di cambiare opportunamente l'etichetta nel template interprogetto su it. Usare sempre l'etichetta inglese significherebbe avere su it.wiki un numero spropositato di collegamenti a Commons in inglese (es. Wikimedia Commons contiene file multimediali su "Boat" anziché "Imbarcazione").
Detto questo, a parte per l'ultimo problema difficilmente risolvibile, ho fatto quanto potevo per evitare di incappare in spiacevoli situazioni... sperema ben!
Note
modifica- ^ Eccezioni su en.wiki e it.wiki:
- ^
Eccezioni su it.wiki:
- (Best Live)
- (Fanculopensiero)
- (GI)
- (R)-pantolattone deidrogenasi
- (You Gotta) Fight for Your Right (to Party)
- (Untitled)
- ( )
- (not adam)
- (pronounced 'lĕh-'nérd 'skin-'nérd)
Eccezioni su en.wiki:- (((GRRRLS)))
- (1952-19??)
- (2)
- (3-methyl-2-oxobutanoate dehydrogenase (acetyl-transferring))
- (As We Know It)
- (Bem) Na minha mão (Susana Félix song)
- (Best LIVE)
- (Breach)
- (CH-VOX)
- (Fork and Knife)
- (GI)
- (I'm) Stranded (song)
- (I'm So) Happy Happy (You're Mine)
- (If You Can't Sing It) You'll Have to Swing It (Mr. Paganini)
- (LIVE)
- (Much) Wenlock (UK Parliament constituency)
- (No Pussyfooting)
- (ONe)
- (Pronounced 'Leh-'nérd 'Skin-'nérd)
- (R)-pantolactone dehydrogenase (flavin)
- (SAT, e-UNSAT)
- (See Inside)
- (Self Titled)
- (The EP)
- (Untitled) (film)
- (We Get There When We Do.)
- (You Gotta) Fight for Your Right (To Party!)
- ( )
- ( ) (film)
- (e)
- (guitar, vocal)
- (if)
- (not adam)
- (stavz'a'ker)
- (tabes dorsalis)
- ^ Eccezioni su it.wiki: Eccezioni su en.wiki:
- ^ Eccezioni conosciute:
- ^ a b c Eccezioni su it.wiki e en.wiki