Correzioni sottoportali

modifica

Il codice sottostante (in python) va aggiunto al codice del file fixes.py Quindi si digita:

replace.py -log -xml:itwiki-20090203-pages-articles.xml -namespace:0 -fix:sottoportali

Le correzioni effettuate riguardano l'eliminazione dei portali superflui da "template:Portale".

fixes = {
'sottoportali': {
        'regex': True,
        'msg': {
               'it':u'[[template:Portale]]: lascio solo portali più specifici'
              },
        'replacements': [

# -----------------
# NAPOLI
# -----------------
                (u'(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)([Nn]apoli)([a-zA-Z _àèéìòù\|-]*)(\|[Cc]ampania)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\2\3\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)(\|[Cc]ampania)([a-zA-Z _àèéìòù\|-]*)([Nn]apoli)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\3\4\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)([Nn]apoli)([a-zA-Z _àèéìòù\|-]*)(\|[Ii]talia)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\2\3\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)(\|[Ii]talia)([a-zA-Z _àèéìòù\|-]*)([Nn]apoli)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\3\4\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)([Nn]apoli)([a-zA-Z _àèéìòù\|-]*)(\|[Ee]uropa)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\2\3\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)(\|[Ee]uropa)([a-zA-Z _àèéìòù\|-]*)([Nn]apoli)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\3\4\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)([Nn]apoli)([a-zA-Z _àèéìòù\|-]*)(\|[Gg]eografia)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\2\3\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)(\|[Gg]eografia)([a-zA-Z _àèéìòù\|-]*)([Nn]apoli)([a-zA-Z _àèéìòù\|-]*)(?=\}\})', ur'\1\3\4\5'),
# -----------------
# BENEVENTO
# -----------------
                (u'(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)([Bb]enevento)([a-zA-Z _àèéìòù\|-]*)(\|[Cc]ampania)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\2\3\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)(\|[Cc]ampania)([a-zA-Z _àèéìòù\|-]*)([Bb]enevento)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\3\4\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)([Bb]enevento)([a-zA-Z _àèéìòù\|-]*)(\|[Ii]talia)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\2\3\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)(\|[Ii]talia)([a-zA-Z _àèéìòù\|-]*)([Bb]enevento)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\3\4\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)([Bb]enevento)([a-zA-Z _àèéìòù\|-]*)(\|[Ee]uropa)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\2\3\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)(\|[Ee]uropa)([a-zA-Z _àèéìòù\|-]*)([Bb]enevento)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\3\4\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)([Bb]enevento)([a-zA-Z _àèéìòù\|-]*)(\|[Gg]eografia)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\2\3\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)(\|[Gg]eografia)([a-zA-Z _àèéìòù\|-]*)([Bb]enevento)([a-zA-Z _àèéìòù\|-]*)(?=\}\})', ur'\1\3\4\5'),
# -----------------
# ROMA
# -----------------
                (u'(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)([Rr]oma)([a-zA-Z _àèéìòù\|-]*)(\|[Ll]azio)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\2\3\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)(\|[Ll]azio)([a-zA-Z _àèéìòù\|-]*)([Rr]oma)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\3\4\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)([Rr]oma)([a-zA-Z _àèéìòù\|-]*)(\|[Ii]talia)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\2\3\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)(\|[Ii]talia)([a-zA-Z _àèéìòù\|-]*)([Rr]oma)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\3\4\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)([Rr]oma)([a-zA-Z _àèéìòù\|-]*)(\|[Ee]uropa)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\2\3\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)(\|[Ee]uropa)([a-zA-Z _àèéìòù\|-]*)([Rr]oma)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\3\4\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)([Rr]oma)([a-zA-Z _àèéìòù\|-]*)(\|[Gg]eografia)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\2\3\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)(\|[Gg]eografia)([a-zA-Z _àèéìòù\|-]*)([Rr]oma)([a-zA-Z _àèéìòù\|-]*)(?=\}\})', ur'\1\3\4\5'),
# -----------------
# FROSINONE
# -----------------
                (u'(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)([Ff]rosinone)([a-zA-Z _àèéìòù\|-]*)(\|[Ll]azio)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\2\3\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)(\|[Ll]azio)([a-zA-Z _àèéìòù\|-]*)([Ff]rosinone)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\3\4\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)([Ff]rosinone)([a-zA-Z _àèéìòù\|-]*)(\|[Ii]talia)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\2\3\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)(\|[Ii]talia)([a-zA-Z _àèéìòù\|-]*)([Ff]rosinone)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\3\4\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)([Ff]rosinone)([a-zA-Z _àèéìòù\|-]*)(\|[Ee]uropa)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\2\3\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)(\|[Ee]uropa)([a-zA-Z _àèéìòù\|-]*)([Ff]rosinone)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\3\4\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)([Ff]rosinone)([a-zA-Z _àèéìòù\|-]*)(\|[Gg]eografia)([a-zA-Z _àèéìòù\|-]*)(?=\}\})" "\1\2\3\5" "(?<=\{\{[Pp]ortale)([a-zA-Z _àèéìòù\|-]*)(\|[Gg]eografia)([a-zA-Z _àèéìòù\|-]*)([Ff]rosinone)([a-zA-Z _àèéìòù\|-]*)(?=\}\})', ur'\1\3\4\5'),

        ]
    },