Wikipedia:Bar/Discussioni/WikiTrust: cosa se ne sa?
WikiTrust: cosa se ne sa? | NAVIGAZIONE |
Ho visto che in it.mailing list si parla di WikiTrust, un add-on scaricabile per firefox e da qualche tempo utilizzabile in beta anche sulla it.wiki. Più precisamente, ho visto un messaggio in cui si parla di:
"WikiTrust (http://wikitrust.soe.ucsc.edu/) is an open-source tool that computes, for every word of text: * Who is the author of the word * In which revision was the word introduced * How well the word (and the surrounding text) has been revised."
Seguendo le istruzioni ho scaricato l'add-on, provandolo. L'ho trovato più che altro curioso e, a modo suo, divertente. Adesso vorrei sapere se per caso se ne sia già parlato a livello comunitario; cosa se ne pensi e se è il caso di suggerirne un'adozione massiccia o, in ogni caso, se esista una pagina in cui se ne parla o se si ha in mente di prepararne una. Grazie, --Twice25 (msg) 22:54, 18 ott 2009 (CEST)
- Se ne era parlato qualche tempo fa. Il problema è che è tutt'altro che affidabile. Cito da en.wiki:
«"the software doesn’t really measure trustworthiness, and the danger is that people will trust the software to measure something that it does not." Generally, users whose content persists for a long time without being "reverted" by other editors are deemed more trustworthy by the software. This may mean that users who edit controversial articles subject to frequent reversion may be found to be less trustworthy than others.»
«"il software non misura veramente l'affidabilità, ed il pericolo è che le persone credano che il software misuri qualcosa che in realtà non fa". In generale, gli utenti i cui contributi rimangono per molto tempo senza essere "annullati" da altri utenti vengono considerati più affidabili da questo software. Questo significa che chi edita voci controverse soggette a frequenti modifiche diventa automaticamente meno affidabile degli altri»
- Quindi io, che scrivo di argomenti frequentati da poche persone, sarei in automatico più affidabile di chi si occupa di politica, religione, ecc.
- A mio parere possiamo farne a meno; se l'edit count fa schifo nel giudicare un utente, questo è ancora peggio Jalo 23:02, 18 ott 2009 (CEST)
- Sono uno degli sviluppatori di WikiTrust. Dalle nostre analisi, non ci risulta che contributori a soggetti controversiali ricevano meno reputazione. Questo per varie ragioni: il sistema considera l'evoluzione della pagina nel lungo termine; autori in genere contribuiscono ad un misto di pagine non solo controversiali, e soprattutto, la reputazione non diminuisce in maniera significativa quando a cancellare una contribuzione sono autori novizi. Del resto, possiamo fare un esperimento pratico: se mi dite gli usernames di autori che sono, o non sono, coinvolti nella modifica di voci controversiali, io posso dirvi quale è la reputazione calcolata per loro dal sistema. Lucadealfaro (msg) 08:20, 19 ott 2009 (CEST)
- (conflittato) Se n'è parlato in mille posti diversi per anni. Inserisco solo un collegamento alla discussione al bar del 2007, e alla piú recente presentazione e discussione a Wikimania (notare che le richieste del pubblico sono già state soddisfatte). --Nemo 23:03, 18 ott 2009 (CEST) P.s.: Jalo ha ragione; per attivare su larga scala un'estensione come questa bisognerebbe prima cambiarle nome, trovare un modo semplice di spiegare che cosa fa, ed eventualmente cambiare il metodo di calcolo della "reputazione". D'altro canto nella discussione succitata Luca De Alfaro rispondendo alle diverse proposte di metodi per il calcolo della reputazione dice che li hanno provati e cambiavano poco i risultati.
- Avete suggerimenti per nome e spiegazione? Quello che cerchiamo di fare è semplicemente di rendere più facile il compito di esaminare gli articoli di Wikipedia, rendendosi conto di quali porzioni sono state modificate di recente, e controllando chi sia l'autore di porzioni di testo. Perché questo non sarebbe utile? Lucadealfaro (msg) 08:20, 19 ott 2009 (CEST)
- Se pensate che usare la reputazione sia troppo complicato o fuorviante, si potrebbe fare due modifiche alternative. La prima consite nell'usare solo l'età del testo (misurata con un misto di numero di revisioni, e tempo) per decidere che testo evidenziare con sfondo arancione. La seconda sarebbe di modificare il sistema di reputazione (suggerimenti?). Preferireste un sistema così modificato? Se sì, perché? Queste modifiche sono facili da fare, e se voi (ed altri) preferite, perché no? Lucadealfaro (msg) 08:47, 19 ott 2009 (CEST)
@Jalo et nemo. Più o meno le medesime considerazioni che mi ero fatto fra me e me. Allora, direi, che che converrebbe mettere la "sordina" anche in mailing list. Dai primi feed odierni mi pareva di aver colto dell'entusiasmo forse raffreddabile alla luce di quanto sopra. Ergo: prima di far circolare facili suggestioni ... con quel che segue (quando si parla di affidabilità è sempre bene andarci coi piedi piombo). --Twice25 (msg) 23:30, 18 ott 2009 (CEST)
- Diciamo solo che l'add-on di Firefox può essere interessante per qualcuno, ma eviterei di renderlo uno strumento ufficiale, altrimenti sembra veramente che diamo un voto agli utenti Jalo 23:51, 18 ott 2009 (CEST)
- È quello che intendevo. Lo hai detto con parole tue, ma appropriate. ^^ --Twice25 (msg) 00:23, 19 ott 2009 (CEST)
- Trovate il sistema di reputazione e la nozione di trust controversiale. Consideriamo allora la proposta seguente: il colore del testo è calcolato semplicemente sulla base del numero di versioni per cui è persistito nella pagina. L'unico accorgimento è di mettere un limite a quanto l'età può aumentare in un solo giorno, per evitare che utenti male intenzionati coprano le traccie delle loro modifiche tramite molte modifiche in rapida successione. Trovereste questo sistema più attraente? In fondo, mi costa pressapoco 10 linee di codice! Che ne pensate? Lucadealfaro (msg) 09:18, 19 ott 2009 (CEST)
- Lascio la parola agli amici più esperti. Per quanto mi concerne, nessuna pregiudiziale contraria ad ogni migliorìa, anche tecnica, che possa essere introdotta e che possa essere utile per aiutare il progetto a crescere meglio. Unica nota: se è da due anni e più che si parla del WikiTrust, come mai non è decollato a pieno su tutti i progetti prima, ma se ne sta ancora parlando quasi *clandestinamente* a livello di mailing list? --Twice25 (msg) 09:30, 19 ott 2009 (CEST)
- La ragione del ritardo è tecnica. Due anni fa, quando abbiamo annunciato il progetto, WikiTrust non era nè in grado di analizzare una grande Wikipedia come quella inglese, nè in grado di analizzare le revisioni man mano che venivano generate da contributori. Poteva solo analizzare dump statici di Wikipedie non troppo grandi. Da allora, siamo stati al lavoro per rendere possibile l'uso di WikiTrust su grandi wiki. Ora pensiamo finalmente che sia pronto. Ora, finalmente, analizzare la Wikipedia italiana (o francese, o spagnola, ...) è qualcosa che possiamo fare facilmente, in modo automatico, usando un calcolatore solo, sia per quanto riguarda l'analisi delle revisioni esistenti, che per quanto riguarda le revisioni nuove. Tieni anche conto che WikiTrust non è il nostro lavoro, ma il nostro hobby, limitando il tempo disponibile. Se vuoi avere un'idea del lavoro, puoi guardare la storia del progetto su GitHub! Ora che finalmente abbiamo un sistema che può essere usato, chiediamo commenti e pareri. Anche solo due mesi fa, la versione che vedi su Wikipedia italiana non era tecnicamente possibile. Lucadealfaro (msg) 09:58, 19 ott 2009 (CEST)
- Lascio la parola agli amici più esperti. Per quanto mi concerne, nessuna pregiudiziale contraria ad ogni migliorìa, anche tecnica, che possa essere introdotta e che possa essere utile per aiutare il progetto a crescere meglio. Unica nota: se è da due anni e più che si parla del WikiTrust, come mai non è decollato a pieno su tutti i progetti prima, ma se ne sta ancora parlando quasi *clandestinamente* a livello di mailing list? --Twice25 (msg) 09:30, 19 ott 2009 (CEST)
- Non ho ancora studiato l'algoritmo alla base del tool, quindi mi riservo di fare commenti/dare suggerimenti in seguito. La cosa che subito mi salta all'occhio è il problema con voci decronizzate, scorporate, unite o che abbiano subito una cancellazione selettiva della cronologia (per esempio per violazioni di copyright): in quest'ultimo caso, se una violazione di copyright viene trovata a distanza di molti edit, si perde praticamente tutta la cronologia successiva.
- Probabilmente su en.wiki questo non è un problema, a quanto mi ricordo (ma potrei sbagliarmi o potrebbero aver cambiato politica) loro non cancellano la cronologia per violazione di copyright. --Giuseppe (msg) 11:00, 19 ott 2009 (CEST)
- Per le voci decronizzate, scorporate, o unite, potremmo fare di meglio se WikiTrust fosse più integrato con Wikipedia; precisamente, se la API comunicasse i dettagli di questi cambiamenti. Probabilmente è possibile. Per cancellazioni dovute a copyright, non c'è rimedio: se l'informazione manca, anche se la cronologia fosse corretta, non potremmo in ogni caso mostrare l'origine delle parole, perche' le revisioni appunto mancano. Ma in pratica, per fortuna, curiosando in giro, mi sembra non siano problemi così frequenti; mi sembra che almeno un po' funzioni... Lucadealfaro (msg) 11:11, 19 ott 2009 (CEST)
- "il colore del testo è calcolato semplicemente sulla base del numero di versioni per cui è persistito nella pagina"
- E' proprio questo che non va, è un criterio sbagliato per misurare l'affidabilità.
- Inoltre questo tool, facendo accessi alla cronologia, rende ovviamente più pesante il caricamento della voce Jalo 19:43, 19 ott 2009 (CEST)
- Il colore non è calcolato solo sulla base del numero di versioni. Puoi trovare i dettagli nell'articolo "Assigning Trust to Wikipedia Content", disponibile sul sito di WikiTrust. Inoltre, la cronologia è preanalizzata, non è certo analizzata al volo ad ogni richiesta. La ragione per cui il sistema è lento è che non è integrato con i servers di Wikipedia, e deve mandare molta informazione in giro. Lucadealfaro 21:36, 19 ott 2009.
- Per le voci decronizzate, scorporate, o unite, potremmo fare di meglio se WikiTrust fosse più integrato con Wikipedia; precisamente, se la API comunicasse i dettagli di questi cambiamenti. Probabilmente è possibile. Per cancellazioni dovute a copyright, non c'è rimedio: se l'informazione manca, anche se la cronologia fosse corretta, non potremmo in ogni caso mostrare l'origine delle parole, perche' le revisioni appunto mancano. Ma in pratica, per fortuna, curiosando in giro, mi sembra non siano problemi così frequenti; mi sembra che almeno un po' funzioni... Lucadealfaro (msg) 11:11, 19 ott 2009 (CEST)
Continuiamo solo di la Jalo 00:33, 20 ott 2009 (CEST)