AushulzBot
Utente:AushulzBot | |
AushulzBot (Talk · Contribs) | |
AushulzBot | |
Operatore: | Aushulz (msg) |
---|---|
Approvato: | Yes |
Flag: | 13-03-2009 |
Compito/i: | Correzione di errori comuni, inserimento di Template:Portale, ecc... |
Automatico o manuale? | manuale |
Linguaggio di programmazione/i: | framework pywikipediabot |
Informazioni sul bot
modifica- Data di creazione: 14 gen 2009
- Data di approvazione: 13 mar 2009
Regex e script pronti all'uso
modificaLe regex che sono scritte in questa sezione ("regex del mio bot") se sono state scritte da me autorizzo chiunque ad utilizzarle come meglio crede, se invece sono scritte da altri, le utilizzo in quanto gli utenti che le hanno create ne hanno permesso l'utilizzo.
Nelle sottopagine di Utente:AushulzBot/Python si trovano gli script e le regex in python che vado mano a mano scrivendo o che prendo in prestito da altri utenti.
- Utente:AushulzBot/Python/1 - Formattazione wiki delle note: al momento riesco a modificare i titoli della sezione "Note" quando sono errati. In futuro scriverò uno script per effettuare molte altre correzioni che riguardano le convenzioni dettate da Wikipedia:Modello di voce.
- Utente:AushulzBot/Python/2 - Errori di ortografia nei nomi delle regioni: si tratta di inserire un trattino "-" in alcuni nomi di regioni italiane. Necessito il flagaggio del bot per completare le operazioni, piuttosto ripetitive.
- Utente:AushulzBot/Python/3 - Sostituzioni SI (Sistema Internazionale): sto mettendo insieme un po' di regex mie e di altri. Bisogna stabilire con il Progetto:Scienza e tecnica le linee guida prima di far partire il bot, anche se alcune correzioni mano mano vengono svolte da altri bot.
- Utente:AushulzBot/Python/4, Utente:AushulzBot/Python/7 e Python:Portalebot.py - Modifiche al template:Portale: è indispensabile avere il flag per iniziare questi lavori, che vanno a sistemare il template:portale in vari modi (lascio i sottoportali, unisco i template:portale, inserisco i template:portale per categoria). Non sono riuscito a fare partire la regex dei sottoportali con il dump, ma in alfabetico funziona benissimo (sono arrivato dopo la "L" per la regex "Campania", ma ci sono tantissime regex da fare girare, per cui è molto meglio se risolvo il problema del dump).
- Utente:AushulzBot/Python/5 - Sostituzioni wiki en-it: sono sostituzioni di termini che derivano dal codice wiki inglese, ad esempio "[[category:" al posto di "[[categoria:"
- Utente:AushulzBot/Python/6 - Correzione minuscole: script che inserisce l'iniziale maiuscola nei nomi proprio di persona, nomi geografici, e dove ce n'è bisogno. Qualunque aiuto a completare la lista è ben accetto.
- Utente:AushulzBot/Python/8 - Sostituzioni template deprecati: sono sostituzioni di template deprecati (ad esempio Template:Commonscat).
- Ordine delle sezioni predefinite:
replace.py -page:"Utente:AushulzBot/Sandbox" -regex "(=+ *Bibliografia *=+)((\s|\S)*)(?<=\n)(=+ *Note *=+ *((\s*\<references */\>)|(\s*\{\{references *\| *[1-9] *\}\})))\s*" "\4\3\3\1\2" "(=+ *Voci correlate *=+)((\s|\S)*)(?<=\n)(=+ *Note *=+ *((\s*\<references */\>)|(\s*\{\{references *\| *[1-9] *\}\})))\s*" "\4\3\3\1\2" "(=+ *Altri progetti *=+)((\s|\S)*)(?<=\n)(=+ *Note *=+ *((\s*\<references */\>)|(\s*\{\{references *\| *[1-9] *\}\})))\s*" "\4\3\3\1\2" "(=+ *Collegamenti esterni *=+)((\s|\S)*)(?<=\n)(=+ *Note *=+ *((\s*\<references */\>)|(\s*\{\{references *\| *[1-9] *\}\})))\s*" "\4\3\3\1\2" -summary:"Ordino [[Wikipedia:Sezioni#Sezioni_predefinite|sezioni predefinite]]"
replace.py -page:"Utente:AushulzBot/Sandbox" -regex "(=+ *Altri progetti *=+)((\s|\S)*)(?<=\n)(=+ *Voci correlate *=+ *(\s*\* *\[\[[a-zA-Z0-9 ]+\]\])+)\s*" "\4\3\3\1\2" "(=+ *Collegamenti esterni *=+)((\s|\S)*)(?<=\n)(=+ *Voci correlate *=+ *(\s*\* *\[\[[a-zA-Z0-9 ]+\]\])+)\s*" "\4\3\3\1\2" -summary:"Ordino [[Wikipedia:Sezioni#Sezioni_predefinite|sezioni predefinite]]"
Lavori in corso
modificaQui sotto sono elencati i lavori che il bot sta svolgendo. Per dare uno sguardo a quelli terminati, vedere Utente:AushulzBot/Fatto.
Coordinate in formato decimale
modificaDa fare per tutti i comuni spagnoli (richiesta alla mia pagina di discussione di Utente:Carlomorino) In corso...
replace.py -cat:"Comuni della provincia di Lleida" -namespace:0 -regex "(longitudine= *)([0-9]*)(\s|\S) *([0-9]*)(\s|\S) *O" "longitudine_d= -{{subst:#expr: \2 + (\4/60) round 6}}" "(longitudine= *)([0-9]*)(\s|\S) *([0-9]*)(\s|\S) *E" "longitudine_d= {{subst:#expr: \2 + (\4/60) round 6}}" "(latitudine= *)([0-9]*)(\s|\S) *([0-9]*)(\s|\S) *S" "latitudine_d= -{{subst:#expr: \2 + (\4/60) round 6}}" "(latitudine= *)([0-9]*)(\s|\S) *([0-9]*)(\s|\S) *N" "latitudine_d= {{subst:#expr: \2 + (\4/60) round 6}}" -summary:"Converto coordinate in formato decimale"
Destubizzazione comuni con meno di 10.000 abitanti
modificaToglie l'avviso di stub dai comuni con meno di 10.000 abitanti. In corso... - prima di continuare, vedere Discussioni progetto:Amministrazioni/Comuni italiani e Discussioni portale:Geografia
replace.py -xml:itwiki-20090203-pages-articles.xml -regex "(\{\{[Ss]\|.*\}\})((\S|\s)*)(\| *abitanti *= *((([0-9][.| ])?[0-9])?[0-9])?[0-9]\s)" "\2\4<!-- comuni piccoli non sono stub - cfr. [[Wikipedia:Bar/Discussioni/Comuni francesi e spagnoli: stub?]] -->" -namespace:0 -summary:"comuni piccoli non sono stub - cfr. [[Wikipedia:Bar/Discussioni/Comuni francesi e spagnoli: stub?|qui]]"
Template di navigazione da sostituire con template:Portale
modifica- Cancellare "Template:Relatività generale" e "Template:Relatività"
- Vedi anche Progetto:Coordinamento/Template/Portali
- cercare le pagine in cui sono presenti più template:interprogetto e unirli. (tranne che sia presente interprogetto/notizia).
- CORREZIONE MAIUSCOLE - TEMPLATE PORTALE: controllare aziende e economia
- INSERIMENTO TEMPLATE PORTALE
Sovraffollate
modifica- Inserire il template:Portale nelle pagine delle categorie sovraffolate: http://it.wiki.x.io/wiki/Speciale:PuntanoQui/Template:Categoria_sovraffollata (si ha il vantaggio di avere subito dei risultati in termini di visibilità del portale)
- Inserire il portale Aziende nella categoria "Aziende" In corso... (mi sono fermato ad alcune categorie)
- Categoria:Aziende Fatto
- Categoria:Aziende quotate in borsa e sue dirette sottocategorie Fatto
- Categoria:Dirigenti d'azienda e sue dirette sottocategorie Fatto
- Categoria:Aziende del passato e sue dirette sottocategorie Fatto
- Categoria:Aziende del passato italiane Fatto
- Categoria:Banche storiche italiane Fatto
- Categoria:Economia aziendale e sue dirette sottocategorie Fatto
- Categoria:Gestione d'azienda e sue dirette sottocategorie Fatto
- Categoria:Finanza aziendale Fatto
- Categoria:Imprenditori e sue dirette sottocategorie Fatto
- Categoria:Liste di aziende Fatto
- Categoria:Multinazionali e sue dirette sottocategorie Fatto
- Categoria:Aziende per nazionalità e sue dirette sottocategorie Fatto (usare le entity per "à")
portale.py -namespace:0 -subcatmod:"Aziende per nazionalità" -add:aziende -remove:Aziende -remove:Economia -remove:economia
- Categoria:Aziende italiane per regione e sue dirette sottocategorie Fatto
- Categoria:Aziende italiane per settore e sue dirette sottocategorie Fatto
- Categoria:Aziende statunitensi e sue dirette sottocategorie Fatto
- Categoria:Aziende per settore e sue dirette sottocategorie Fatto
- Categoria:Organizzazione aziendale Fatto
- ...
- Inserire il portale Biografie in:
- Categoria:Biografie Fatto
- Categoria:Persone per attività Fatto- tranne le voci con la Z di "Stub politici"
- Categoria:Persone per città In corso... fatto fino a "Personalità legate a Fiume"
- Inserire il portale Fisica nella categoria "Fisica" (lista da completare)
- Categoria:Istituti di fisica e sue sottocategorie dirette Fatto
- Categoria:Fisici Fatto
- ...
- Inserire il portale Biologia nella categoria "Biologia"
-
- Categoria:Botanica Fatto
- Categoria:Stub botanica Fatto
- Categoria:Stub piante Fatto (si è più che raddoppiato il numero di visite al portale già dopo il primo giorno: [6]!!!)
- Categoria:Stub botanici Fatto
portale.py -namespace:0 -cat:"Stub botanici" -add:botanica -add:biografie -remove:Biografie -remove:Botanica -remove:biologia -remove:Biologia -except:"\|[Cc]ategorie" -except:"\| [Cc]ategorie"
- Categoria:Anatomia vegetale e sue sottocategorie Fatto
- Categoria:Fisiologia vegetale e sue sottocategorie Fatto
- Categoria:Giardinaggio e sue sottocategorie Fatto
- Categoria:Flora e sue sottocategorie Fatto
- Categoria:Liste di botanica e sue sottocategorie Fatto
- Categoria:Nomenclatura botanica Fatto
- Categoria:Opere di botanica Fatto
- Categoria:Orti botanici e sue sottocategorie Fatto
- Categoria:Paleobotanica e sue sottocategorie Fatto
- Categoria:Piante e sue sottocategorie Fatto
- Categoria:Tecniche botaniche Fatto
- ...
- Categoria:Stub medicina Fatto
- Categoria:Medicina Fatto
- Categoria:Economia sanitaria Fatto
- Categoria:Malformazioni Fatto
- Categoria:Medicina d'urgenza Fatto
- Categoria:Metaplasia Fatto
- Categoria:Ricerca clinica Fatto
- Categoria:Statistica medica Fatto
- Categoria:Attività assistenziali Fatto
- Categoria:Farmaci e tutte le sotto-categorie e sotto-sotto...categorie (-subcat) Fatto
- ...
- Categoria:Pokémon e sue sottocategorie (eliminare "Anime e Manga") In corso... (continuare da "Pokémon di stato Primo Stadio")
- Categoria:Lega Pokémon (eliminare "Anime e Manga")
Prima di continuare chiedere conferma al Progetto:Pokémon.
- Categoria:Editori per nazionalità e sue sottocategorie (eliminare "Letteratura")
- Categoria:Stub editoria (eliminare "Letteratura")
- ...
- Categoria:Ecologia (eliminare "ecologia", aggiungere "ecologia e ambiente") Fatto
- Categoria:Risparmio energetico Fatto
- Categoria:Bioindicatori Fatto
- Categoria:Aree naturali protette dell'Africa Fatto
- Categoria:Ecomusei Fatto
- Categoria:Effetto serra Fatto
- Categoria:Propulsione alternativa Fatto
- ...
- Categoria:Animazione (eliminare "Televisione")
- Categoria:Stub animazione (eliminare "Televisione")
- ...
- Categoria:Stub matematica Fatto
- Categoria:Statistica Fatto
- ...
(eliminare "Astronomia")
- Categoria:Anelli planetari e sottocategorie (tranne voce Anello planetario) Fatto
- Categoria:Asteroidi e sottocategorie (tranne la voce Asteroide, Corpo progenitore, Designazione provvisoria degli asteroidi) Fatto (aggiungo: tranne "Scopritori di asteroidi")
- Categoria:Comete (tranne la voce Cometa) NO sottocategoria Fatto
- Categoria:Meteoroidi e sottocategorie (tranne la voce Meteoroide, Micrometeorite, Bolide, Meteora) Fatto
- Categoria:Pianeti nani (tranne la voce Pianeta nano e Plutoide) Fatto
- Categoria:Satelliti naturali (tranne la voce satellite naturale, Quasi-satellite, Satellite irregolare)
- Categoria:Sistema solare Fatto
- Categoria:Pianeti e sottocategorie TRANNE Pianeti extrasolari (tranne Pianeta e tutte le voci che iniziano col nome "Pianeta", Planemo, Dominanza orbitale, Rigonfiamento equatoriale; Sub-nana bruna vuole "Stelle" )
(eliminare "Astronomia")
NB: Anche qui fare massima attenzione a non togliere altri portali che non siano quello Astronomia!!
- Categoria:Stelle: inserire il portale Astronomia e togliere eventuali sottoportali del portale Astronomia in tutte le voci, tranne Stella blu e tutte le voci che contengono nel titolo la parola "stellare" (non "stelle" o "stella", mi raccomando), dove ci va invece il portale Stelle.
- sottocategorie della Categoria:Stelle suddivise per costellazione; Fatto
- idem per tutte le restanti categorie, tranne la Categoria:Costellazioni, Categoria:Evoluzione stellare (i casi qua vanno valutati attentamente), Categoria:Gruppi stellari (già fatta, dunque da non toccare), Categoria:Nomenclatura stellare (inserire qua solo il Portale:Astronomia) e Categoria:Sole (già fatta, dunque da non toccare).
- Categoria:Vini Fatto
- ...
- Categoria:Neuroscienziati Fatto
- Categoria:Neuroscienze (subcatmod) Fatto
- Categoria:Neurologia (subcat) Fatto (tranne neurologia)
- Categoria:Sistema nervoso Fatto
- ...
- Categoria:Arcade e sottocat: Fatto
- Categoria:Videogiochi per console e sottocat: Fatto
- Categoria:Liste di videogiochi e sottocat: Fatto
- Categoria:Giochi online e sottocat: Fatto
- Categoria:Serie di videogiochi e sottocat: da fare con attenzione alle sottocat. (subcatmod)
- Categoria:Tipi di videogiochi: Fatto
- Altre sottocategorie di Categoria:Videogiochi: da fare
- da fare (chiedere se ci sono film tv e controllare bene sottocategorie):
- Categoria:Toho e sottocategorie
- Categoria:Disney e sottocategorie
- Categoria:Hanna-Barbera e sottocategorie
- Categoria:Troma e sottocategorie
- Categoria:Studi di animazione e sottocategorie
- forse non vanno portalati:
- CONTINUARE DA: Cinematografia LGBT
- SINTASSI (ATTENZIONE: AGIRE MANUALMENTE - Il "remove" serve a indicare i casi in cui bisogna premere "n")
portale.py -namespace:0 -cat:"Cinema sperimentale" -add:cinema -remove:"Guerre Stellari" -remove:"Indiana Jones" -remove:"James Bond" -remove:"Star Trek"
- ...
Portale: ...
modifica- e così via per altri portali...
- Inserire il template:portale anche nel namespace:categoria, servendosi degli elenchi creati sopra
- Vedi: http://botwiki.sno.cc/wiki/Python:Add_text_mod.py e http://botwiki.sno.cc/wiki/Python:Portale.py
- CORREZIONE TEMPLATE PORTALE
- Python:Portalebot.py : unisce due template:portale separati
- Eliminazione dei portali quando esistono quelli più specifici (ad esempio Campania - Napoli) - vedi Wikipedia:Bar/Discussioni/Modifiche grafiche al template:portale e al template:progetto
Procedure (per Windows XP)
modificaScaricare python e pywikipedia
modifica- Istruzioni: http://meta.wikimedia.org/wiki/Come_usare_il_wikipediabot_in_linguaggio_python
- Python: http://www.python.org/download/
- Pywikipedia: http://toolserver.org/~valhallasw/pywiki/ (scarica pywikipedia-nightly.zip e sposta la cartella decompressa in C:\)
- Creare un file "Portale.py" dove inserire il contenuto di http://botwiki.sno.cc/wiki/Python:Portale.py
- creare il file user-config.py:
mylang = 'it' family = 'wikipedia' usernames['wikipedia']['it'] = 'AushulzBot' console_encoding = 'cp850' use_api = True
Vedi anche: http://it.wiki.x.io/wiki/Discussioni_Wikipedia:Bot#Problema_con_i_bot
Avviare uno script
modifica- cmd.exe
- cd C:\pywikipedia
- login.py
oppure creare un file .cmd, inserendo ad esempio le righe:
cd C:\pywikipedia replace.py -log -start:! -namespace:0 -fix:minuscole
In questa maniera, basta creare un collegamento sul desktop e premerlo per fare partire lo script o la regex desiderata, senza bisogno di aprire la finestra dei comandi.
Terminare l'esecuzione di uno script
modifica- Per terminare l'esecuzione di uno script, premere CTRL+C
Copiare dalla finestra dei comandi
modifica- Per copiare fai tasto destro -> segna e poi seleziona col mouse e premi il tasto invio
Dump - Cosa fare passo passo
modifica- Andare su http://dumps.wikimedia.org/backup-index.html cercare il link "itwiki" ed entrare nella pagina Fatto
- Scaricare il file pages-meta-current.xml.bz2 Fatto
- Una volta terminato il download decomprimere l'archivio Fatto
- Scrivere la normale regex e sostituire il "-start:!" con "-xml:itwiki-XXXXXXXX-pages-meta-current.xml" Fatto
- fatto!
Dove ovviamente al posto di XXXXXXX ci sarà la data del vostro dump.
Riavviare un dump
modifica- Per continuare un dump interrotto, inserire nel comando (ad esempio replace.py):
-xmlstart:XXXXXXX
dove XXXXXXX è la pagina a cui si era rimasti
Sintassi degli script
modificaPortale.py
modifica-always Non chiede il consenso prima di editare. Usare con cautela.
-add:"Foo " Aggiunge Foo alla lista di portali.
-remove:"param" Toglie Foo dalla lista di portali, se presente
-except:"regex" Non processa le pagine che matchano la regex.
-force Processa comunque la pagina, anche se non ci sono cambiamenti nei portali.
-cat:"categoria" Processa le pagine di una categoria
-subcat:"categoria" Processa le pagine di una categoria e le sue dirette sottocategorie
-subcatmod:"categoria" Processa le pagine di una categoria e tutte le sue sottocategorie
vedi: http://botwiki.sno.cc/wiki/Python:Portale.py
Replace.py
modificaEntity
modifica- ş ş
- à à
FAQ
modificaAltri progetti
modifica- Wikibooks contiene testi o manuali su AushulzBot
- Wikizionario contiene il lemma di dizionario «AushulzBot»
Questa è la pagina personale di un bot autorizzato su Wikipedia | |
Se trovate questa pagina bot su un sito diverso da Wikipedia si tratta di un clone. In questo caso la pagina potrebbe essere poco aggiornata e il sottoscritto potrebbe non riconoscersi più nei suoi contenuti né desiderare o gradire alcuna affiliazione con il sito che state consultando. La pagina originale si trova qui: http://it.wiki.x.io/wiki/AushulzBot |