Elaborazione del linguaggio naturale
L'elaborazione del linguaggio naturale (NLP, da natural language processing) è una sottobranca di linguistica, informatica e intelligenza artificiale che tratta l'interazione tra i computer e il linguaggio umano, in particolare sul come programmare i computer per elaborare e analizzare grandi quantità di dati di linguaggio naturale. Lo scopo è rendere la tecnologia in grado di "comprendere" il contenuto dei documenti e le loro sfumature contestuali, in modo tale che possa quindi estrarre con precisione informazioni e idee contenute nei documenti, nonché classificare e categorizzare i documenti stessi.
Le sfide dell'elaborazione del linguaggio coinvolgono spesso il riconoscimento vocale, comprensione del linguaggio naturale e la generazione del linguaggio naturale.
Descrizione
modificaQuesto processo è reso particolarmente difficile e complesso a causa delle caratteristiche intrinseche di ambiguità del linguaggio umano. Per questo motivo il processo di elaborazione viene suddiviso in fasi diverse, tuttavia simili a quelle che si possono incontrare nel processo di elaborazione di un linguaggio di programmazione:
- analisi lessicale: scomposizione di un'espressione linguistica in token (in questo caso le parole)
- analisi grammaticale: associazione delle parti del discorso a ciascuna parola nel testo
- analisi sintattica: arrangiamento dei token in una struttura sintattica (ad albero: parse tree)
- analisi semantica: assegnazione di un significato (semantica) alla struttura sintattica e, di conseguenza, all'espressione linguistica
Nell'analisi semantica la procedura automatica che attribuisce all'espressione linguistica un significato tra i diversi possibili è detta disambiguazione.
Problemi
modificaIn teoria, l'elaborazione del linguaggio naturale è un metodo di interazione uomo-macchina. I primi sistemi sviluppati, quali SHRDLU, che lavoravano in "mondi a blocchi" con vocabolari ristretti, ottenevano ottimi risultati. Ciò portò i ricercatori a un eccessivo ottimismo, che scemò non appena i sistemi furono estesi a situazioni più realistiche con problemi reali di ambiguità e complessità.
La comprensione del linguaggio naturale è spesso considerata un problema IA-completo, poiché si pensa che il riconoscimento del linguaggio richieda una conoscenza estesa del mondo e una grande capacità di manipolarlo. Per questa ragione, la definizione di "comprensione" è uno dei maggiori problemi dell'elaborazione del linguaggio naturale.[1]
Approcci: simbolico, statistico, reti neurali
modificaApproccio statistico
modificaTra la fine degli anni '80 e la metà degli anni '90, l'approccio statistico ha posto fine al periodo invernale dell'intelligenza artificiale, causato dall'inefficacia degli approcci basati sulle regole.[2][3]
I primi alberi decisionali, che creano sistemi di regole rigide "se-allora", erano ancora molto simili ai vecchi approcci basati sulle regole. Solo l'introduzione dei modelli di Markov nascosti applicati alla marcatura delle parti del discorso ha annunciato la fine del vecchio approccio basato sulle regole.
Reti neurali
modificaLo svantaggio principale dei metodi statistici è che richiedono una complessa ingegnerizzazione delle caratteristiche. Dal 2015, l'approccio statistico è stato sostituito da un approccio a rete neurale che utilizza il word embedding per catturare le proprietà semantiche delle parole.
Le attività intermedie non erano più necessarie.
Elaborazione del linguaggio naturale in ambito educativo
modificaL'elaborazione del linguaggio naturale, o NLP (Natural Language Processing), trova applicazione anche nell’ambito della didattica e della scuola. Si rivela utile per riepilogare grandi volumi di testo, per tradurli da una lingua a un'altra, e rivela la sua efficacia anche nel rispondere a comandi digitati o parlati.
In ambito scolastico, i fruitori di tali nuove tecnologie comprendono gli studenti e l’intero sistema scuola. Non è solo il modo di apprendere che subisce modifiche con l’avvento di nuovi software di intelligenza artificiale (AI) ma anche il modo di insegnare, di progettare l’insegnamento e di viverlo all’esterno dell’orario scolastico e quindi saranno i docenti, i dirigenti, il personale amministrativo ma anche le famiglie a vedersi protagonisti in questa rivoluzione.
Tuttavia, affinché l’integrazione dell’AI nell’ambiente educativo sia consapevole e porti a risultati efficaci è bene che sia verificabile il principio di “explainability”, ovvero di spiegabilità, che si riferisce alla possibilità di comprendere il processo per cui un input dato allo strumento produce un determinato output. In questo senso è doveroso sviluppare una cultura dell'intelligenza artificiale.[4]
Per esempio, la prompt engineering è una disciplina che si è sviluppata con la volontà di costruire i giusti prompt da fornire agli strumenti così da permetterne un funzionamento preciso e coerente rispetto alla richiesta avanzata dall'utente.[4]
Valutazione dei compiti
modificaTra le importanti modifiche apportate dall’AI nel sistema scolastico si può sicuramente annoverare l'introduzione dei punteggi automatici che vedono l’elaborazione del linguaggio naturale come supporto fondamentale per il loro corretto funzionamento.
I sistemi di punteggio automatico ad oggi sono strumenti di grande utilità poiché offrono una valutazione tempestiva, precisa ed efficace delle competenze dello studente nella risoluzione di un dato problema, promuovendo un ambiente di apprendimento adattivo grazie alla possibilità di ricevere un feedback immediato che dia agli studenti modo di riconoscere e correggere le incomprensioni affinché possano padroneggiare meglio l'argomento in questione.[5]
Vantaggi
modificaL'uso dell'AI nella valutazione offre diversi vantaggi [5], tra i quali:
- La velocità: gli algoritmi di AI possono correggere un gran numero di compiti in una frazione del tempo necessario a un essere umano, consentendo agli insegnanti di dedicare più tempo alla didattica e al supporto personalizzato degli studenti.
- Feedback personalizzati: le tecnologie di AI possono fornire feedback dettagliati e personalizzati in tempo reale, aiutando gli studenti a comprendere meglio i propri errori e a migliorare le proprie competenze. Ad esempio, piattaforme come Grammarly utilizzano l'AI per suggerire correzioni grammaticali e stilistiche nei testi scritti dagli studenti.
- Analisi predittiva: l'AI può analizzare i dati di apprendimento degli studenti per identificare pattern e tendenze, permettendo agli educatori di intervenire tempestivamente con strategie mirate per supportare gli studenti in difficoltà. Questa analisi può anche prevedere le prestazioni future degli studenti, aiutando a personalizzare i percorsi di apprendimento.
Questo tipo di interazione immediata è particolarmente utile per l'apprendimento delle lingue straniere e delle materie scientifiche.
Strumenti per la correzione e la valutazione dei compiti
modificaNegli Stati Uniti, ad esempio, gli insegnanti delle scuole medie stanno iniziando a utilizzare un nuovo strumento di correzione basato su ChatGPT chiamato Writable.[6][7]
Acquisito da Houghton Mifflin, Writable è progettato per semplificare il processo di correzione e risparmiare tempo agli insegnanti. Gli insegnanti possono inviare i temi degli studenti per l'analisi, ricevendo commenti e osservazioni generati dall'AI, che vengono poi revisionati dai docenti prima di essere consegnati agli studenti.[6]
Gli strumenti di elaborazione del linguaggio naturale hanno il potenziale di trasformare radicalmente la valutazione dei compiti, rendendola più efficiente e informativa. Tuttavia, per sfruttare appieno questi vantaggi, è necessario affrontare le sfide con un approccio ponderato e inclusivo. Con un'implementazione attenta e responsabile, l'AI può diventare uno strumento prezioso per migliorare l'esperienza educativa e promuovere l'apprendimento personalizzato.
Mediatori Visivi e Mappe Concettuali
modificaI mediatori visivi, come le mappe concettuali, sono strumenti diagrammatici e visivi utilizzati per rappresentare e organizzare idee in modo non lineare. Questi strumenti sono stati sviluppati negli anni '70 presso la Cornell University, con l'obiettivo di illustrare le comprensioni concettuali dei bambini in ambito scientifico. Le mappe concettuali consentono di visualizzare fenomeni complessi, facilitando la creazione di nuove connessioni e la costruzione di conoscenze.[8]
Utilizzate ampiamente nelle discipline del design e nelle arti visive, le mappe concettuali servono come metodo di brainstorming per documentare idee e processi di progettazione fin dalle fasi iniziali. La loro utilità si estende anche alla ricerca qualitativa, dove aiutano i ricercatori a tracciare e analizzare le relazioni emergenti tra i dati. Mediante schizzi fatti a mano o strumenti digitali, le mappe concettuali permettono di visualizzare le inter-relazioni tra concetti, rendendo il processo di pensiero più trasparente e facilitando l'elaborazione di analisi e sintesi dei dati complessi. Tra i principali mediatori visivi ci sono le mappe concettuali e mentali, i diagrammi di flusso, i grafici e le tabelle, i diagrammi di Venn, gli storyboard, le infografiche, i diagrammi a ragno e a cascata, e i diagrammi SWOT. Questi strumenti permettono di organizzare, comprendere e comunicare dati e concetti in modo efficace, migliorando l'apprendimento.
L'intelligenza artificiale sta rivoluzionando la generazione di mappe concettuali attraverso mediatori visivi avanzati. Utilizzando algoritmi di machine learning e reti neurali, le soluzioni basate su IA sono in grado di analizzare grandi quantità di dati testuali e convertirli in mappe concettuali visive in modo automatico. Questi strumenti possono identificare relazioni chiave e concetti emergenti, offrendo rappresentazioni visive che facilitano la comprensione e l'analisi delle informazioni complesse. Questa tecnologia trova applicazione in vari campi, tra cui l'istruzione, la ricerca accademica e il business, contribuendo a semplificare il processo di apprendimento e decision-making. La capacità dell'IA di aggiornare e adattare continuamente le mappe concettuali in base a nuovi dati assicura che queste rappresentazioni rimangano accurate e rilevanti nel tempo.
Strumenti per la generazione di mappe concettuali
modificaEsistono diverse piattaforme che utilizzano l'elaborazione del linguaggio naturale per generare mappe concettuali. Alcune delle più note includono:
- MindMeister [9]: offre funzionalità di mappatura mentale basate su cloud, con l'integrazione di IA per suggerire connessioni e organizzare le idee in modo intuitivo.
- Lucidchart [10]: sebbene sia principalmente uno strumento di diagrammazione, Lucidchart utilizza l'IA per ottimizzare la creazione di diagrammi di flusso e mappe concettuali, facilitando la visualizzazione delle idee e delle relazioni tra concetti.
- Coggle [11]: una piattaforma di mappatura mentale che sfrutta l'IA per migliorare la creazione e l'organizzazione delle mappe concettuali, rendendo più facile la collaborazione in tempo reale.
- XMind [12]: utilizza l'intelligenza artificiale per assistere nella creazione di mappe mentali e concettuali, con suggerimenti intelligenti e layout automatici per migliorare la chiarezza e l'efficacia delle rappresentazioni visive.
- Ayoa [13]: combina funzionalità di mappatura mentale integrando l'IA per suggerire collegamenti tra concetti e per aiutare nella pianificazione e organizzazione delle idee.
- Miro [14]: una lavagna collaborativa online che utilizza l'IA per supportare la creazione di mappe concettuali e altri tipi di diagrammi, facilitando la collaborazione e l'ideazione visiva.
Altre applicazioni
modificaRiconoscimento vocale e dettatura Speech to Text (STT)
modificaIl riconoscimento vocale (Speech to Text) è in grado di convertire in modo affidabile dati vocali in dati di testo. Viene utilizzato da qualsiasi software o applicazione che necessiti di rispondere a domande parlate o comandi vocali in generale. Il riconoscimento vocale non è un compito facile per la macchina. L’ostacolo principale è dovuto alle specificità del linguaggio parlato umano: la velocità del parlato, le diverse sfumature di accenti e intonazioni, la possibilità di inserire enfasi e toni particolari, la difficile comprensione del volume della voce e l'eventuale grammatica scorretta. Per svolgere questo compito l’AI specializzata nell’NLP utilizza diverse tecniche che gli consentono di superare tali ostacoli e rispondere con grande precisione linguistica e comunicativa, adattandosi al destinatario.
L'utilizzo dei software Speech to Text in ambito scolastico è consolidato, si rivelano funzionali per prendere appunti velocemente, scrivere e-mail senza dover digitarne il testo, trascrivere riunioni o lunghe conversazioni. Oltre a questi usi legati alla produttività, si tratta di software inclusivi che aiutano anche nella compensazione di numerose disabilità.[15]
Esempi di assistenti vocali
modifica- Alexa: progettato da Amazon è tra i più acquistati dagli utenti, si attiva attraverso la pronuncia della parola “Alexa” seguita dalla richiesta o dal comando.
- Siri: disponibile su tutti i dispositivi Apple, viene attivato dall’utente mediante la keyword “Hey, Siri” seguita dalle richieste.
- Microsoft Cortana: supportato da tutti i sistemi operativi Windows 10 per PC, Windows Phone e Xbox One, è attivabile tramite la parola chiave “Hey, Cortana” seguita dalla richiesta.
- Google Assistant: assistente vocale Android integrato in tutti i dispositivi speaker Google.
Esempi di software Speech to Text
modifica- Google Docs Voice Typing[16]: è un software Google gratuito integrato in Google Docs
- Speech to Text di Microsoft Azure:[17] trascrive rapidamente e accuratamente il parlato in testo in più di 100 lingue diverse.
Sintesi vocale e software Text to Speech (TTS)
modificaLa sintesi vocale è una tecnica di riproduzione artificiale della voce, realizzata tramite sintetizzatori vocali che utilizzano software Text to Speech (TTS), trasformando il testo scritto in parlato. È ampiamente utilizzata in ambito scolastico e formativo, in modo particolare per supportare studenti con diagnosi di Disturbi Specifici dell'Apprendimento (DSA).
La sintesi vocale è impiegata come strumento compensativo per gli studenti con dislessia, permettendo di compensare le difficoltà di lettura. Grazie a questo strumento, lo studente può evitare di affrontare compiti di lettura che richiederebbero per lui uno sforzo significativo, senza però ottenere alcun beneficio nell'apprendimento.[18]
L'utilizzo della sintesi vocale è riconosciuto dalla Legge italiana n. 170 dell’8 ottobre 2010 come strumento compensativo per gli alunni con DSA che in quanto tale "trasforma un compito di lettura in un compito di ascolto" [19], facilitando così il processo di apprendimento per questi studenti.
Traduzione linguistica
modificaI servizi di elaborazione del linguaggio naturale hanno consentito grandi passi nel miglioramento delle prestazioni dei software di traduzione linguistica. La traduzione automatica è il processo di utilizzo dell’intelligenza artificiale per tradurre automaticamente il contenuto da una lingua all’altra senza l’intervento umano. Grazie alle tecniche di NLP, i traduttori online sono in grado di tradurre in modo sempre più accurato, fornendo risultati grammaticalmente corretti. Questi software sono dunque sempre più utilizzati anche per fini didattici e di apprendimento.[20]
Alcuni esempi dei software di traduzione linguistica maggiormente utilizzati per la didattica
modifica- Grammarly: inserendo una frase scritta in inglese, questa app non solo individua errori grammaticali o di sintassi. Infatti, analizzando la frase inserita, offre suggerimenti su come migliorare lo stile e le espressioni.
- WordFisher[21]: è uno strumento avanzato per traduttori che lavorano con i documenti di Microsoft Word. WordFisher è un programma che necessita di Word per lavorare: le sue funzioni vengono infatti installate nel menu della barra degli strumenti di Word.
- Google Traduttore: è un servizio di traduzione automatica multilingue sviluppato da Google LLC. È utilizzabile sul Web o tramite l'app Google Traduttore. Consente di tradurre testi, scrittura a mano libera, foto e contenuti vocali in oltre 100 lingue.[22]
- Reverso[23]: traduce documenti di tutti i tipi, in oltre 25 lingue, lasciando la formattazione originaria. Trova sinonimi in tempo rapido, grazie all’uso integrato di più dizionari, è integrato con un correttore automatico e possiede una versione gratuita.
- Wordreference: è uno dei dizionari online più utilizzati, consente la traduzione in circa 20 lingue, ha un coniugatore di verbi, un forum, prevede alcuni dizionari monolingue ed è completamente gratuito.
Assistenti conversazionali
modificaI motori di ricerca tradizionali come Google ad esempio, identificano i siti contenenti le parole ricercate sulla base del loro algoritmo e sta poi all’utente svolgere un operazione di selezione e verifica dell'attendibilità delle fonti. Nel caso degli “assistenti conversazionali” invece, basta formulare correttamente la domanda e il testo verrà generato in maniera automatica dal software.
Gli assistenti conversazionali utilizzano grandi volumi di dati, il machine learning e l'elaborazione del linguaggio naturale per riconoscere input vocali e testuali e tradurne i significati in varie lingue. Attraverso “prompt” ben costruiti questi software sono in grado di variare i registri linguistici (giornalistico, scientifico, narrativo ecc.) e le età dei destinatari dei testi, i processi NLP fluiscono continuamente in un ciclo di feedback costante allo scopo di migliorare sempre di più gli algoritmi di AI.[24]
Tra gli assistenti conversazionali maggiormente utilizzati in ambito scolastico abbiamo ChatGPT. Questa piattaforma deve il suo continuo progresso all’uso di quantità sempre crescenti di dati per addestrare il suo numero esponenzialmente crescente di parametri che gli permette di proseguire la conversazione migliorando e affinando progressivamente l’output finale.
Criticità dell’elaborazione del linguaggio naturale
modificaIn generale, l'impiego dell'Intelligenza Artificiale e delle sue declinazioni sia in ambito educativo che generale comporta delle criticità condivise, tra cui:[25]
- L'enorme mole di dati e informazioni che vengono processati per elaborare i testi e i linguaggi: sono richieste eccessive spese monetarie sia per l’acquisto che per il mantenimento e supporto delle AI, le cui stesse sono di proprietà di aziende tecnologiche e quindi disponibili soltanto nei Paesi del mondo più ricchi, principalmente America, Cina ed Europa, creando così grande disparità con i Paesi più poveri, specialmente Sud America e Africa, generando una situazione di “data poverty”.[26]
- Limitazioni contestuali: i modelli delle AI basate sull’elaborazione del linguaggio naturale, possono presentare delle limitazioni del linguaggio basate sul contesto culturale di un Paese di riferimento. Questo può portare a fraintendimenti, oltre che analisi scorrette dei testi.
- Ambiguità e polisemie: molte parole e frasi possono avere molteplici significati, creando difficoltà nelle AI basate sull’NLP di comprensione nell’intenzione e utilizzo, oltre che nell’intenzione in un determinato contesto. Questo può portare ad una inaccuratezza dei dati analizzati.
- Diversità dei linguaggi e idiomi: la vastissima diversità dei linguaggi e delle varianti regionali quali dialetti, slang o colloquialismi risultano difficili da essere compresi e analizzati per i modelli delle AI basate sull’NLP.
- Mancanza di ragionamento implicito: al contrario degli umani, che spesso basano la comunicazione anche attraverso l’utilizzo di codici linguistici impliciti basati sul contesto, cultura generale e buon senso, le macchine AI sono completamente prive di questo aspetto, ostacolando la loro capacità di analisi di un testo dove sono presenti più sfumature e informazioni implicite, come un linguaggio di tipo sarcastico.
- Emoticon e caratteri speciali: con l’avvento e utilizzo dei media digitali, le emoticon e i caratteri speciali vengono sempre più utilizzati in contesti online, creando però difficoltà nelle AI nel riuscire a riconoscerli e a utilizzarli in base al contesto di riferimento.[26]
- Precisione dei dati inseriti: per garantire risultati eccellenti, è importante assicurarsi che chi si occupa dei training di allenamento delle macchine AI inserisca dei dati quanto più accurati possibili. In caso contrario, l’inserimento di dati incompleti o erronei potrebbero comportare risultati distorti, rafforzando pregiudizi sociali e stereotipi.
Note
modifica- ^ Democratizzare la comunicazione scritta per far progredire le capacità proprietarie dell'NLG. 06/21/2022
- ^ How the Statistical Revolution Changes (Computational) Linguistics, su aclanthology.org. URL consultato il 20 maggio 2024.
- ^ Philip Resnik. Four revolutions, su languagelog.ldc.upenn.edu. URL consultato il 20 maggio 2024.
- ^ a b Sandro Iannaccone, Come l'intelligenza artificiale può aiutare la didattica, su Wired Italia, 13 novembre 2023. URL consultato il 3 giugno 2024.
- ^ a b Gyeong-Geon Lee, Ehsan Latif, Xuansheng Wu, Ninghao Liu e Xiaoming Zhai, Applicazione di modelli linguistici di grandi dimensioni e catena di pensiero per il punteggio automatico., su sciencedirect.com.
- ^ a b Jennifer A. Kingson, How teachers started using ChatGPT to grade assignments [Gli insegnanti stanno adottando la valutazione basata su ChatGPT], su axios.com, 6 marzo 2024.
- ^ (EN) Writable, su Writable. URL consultato il 3 giugno 2024.
- ^ Lynn Butler-Kisber Defines Collage Inquiry, 2017, DOI:10.4135/9781473964471. URL consultato il 3 giugno 2024.
- ^ MeisterLabs, MindMeister: Mappe mentali online e Brainstorming, su MindMeister. URL consultato il 3 giugno 2024.
- ^ Diagrammazione intelligente, su Lucidchart. URL consultato il 3 giugno 2024.
- ^ Coggle - Simple Collaborative Mind Maps, su coggle.it. URL consultato il 3 giugno 2024.
- ^ (EN) Xmind Ltd, Xmind - Full-featured mind mapping and brainstorming tool., su Xmind. URL consultato il 3 giugno 2024.
- ^ Italian Homepage - Ayoa, su Ayoa - Mind Mapping, Whiteboards & Tasks. Powered by AI, 11 ottobre 2022. URL consultato il 3 giugno 2024.
- ^ Miro | Lo spazio di lavoro visivo per l'innovazione, su https://miro.com/. URL consultato il 3 giugno 2024.
- ^ (EN) The best dictation and speech-to-text software in 2024 | Zapier, su zapier.com. URL consultato il 3 giugno 2024.
- ^ Type & edit with your voice - Google Docs Editors Help, su support.google.com. URL consultato il 3 giugno 2024.
- ^ (EN) Speech to Text – Audio to Text Translation | Microsoft Azure, su azure.microsoft.com. URL consultato il 3 giugno 2024.
- ^ Scuola Digitale - PROGRAMMI DI SINTESI VOCALE, su sites.google.com. URL consultato il 3 giugno 2024.
- ^ LEGGE 8 ottobre 2010 , n. 170 Nuove norme in materia di disturbi specifici di apprendimento in ambito scolastico (PDF), su istruzione.it.
- ^ Carmelina Maurizio, Traduzioni, farle con la tecnologia: strumenti, portali e servizi online, su AgendaDigitale, 14 Aprile 2022.
- ^ WordFisher, su hugedomains.com.
- ^ Scaricare e utilizzare Google Traduttore - Android - Guida di Google Translate, su support.google.com. URL consultato il 3 giugno 2024.
- ^ Reverso | Traduzione e dizionario gratis, su www.reverso.net. URL consultato il 3 giugno 2024.
- ^ Cosa è l'AI conversazionale? | IBM, su www.ibm.com, 18 maggio 2023. URL consultato il 3 giugno 2024.
- ^ (EN) Unravelling the secrets of natural language processing, su ISO. URL consultato il 3 giugno 2024.
- ^ a b Thanveer Shaik, Xiaohui Tao e Yan Li, A Review of the Trends and Challenges in Adopting Natural Language Processing Methods for Education Feedback Analysis, in IEEE Access, vol. 10, 2022, pp. 56720–56739, DOI:10.1109/ACCESS.2022.3177752. URL consultato il 3 giugno 2024.
Bibliografia
modifica- Isabella Chiari, Introduzione alla linguistica computazionale, Bari, Laterza, 2007, ISBN 978-88-420-8209-5.
Voci correlate
modificaAltri progetti
modifica- Wikimedia Commons contiene immagini o altri file sull'elaborazione del linguaggio naturale
Collegamenti esterni
modifica- Elaborazione del linguaggio naturale, su Vocabolario Treccani, Istituto dell'Enciclopedia Italiana, 2023.
- (EN) Tara Ramanathan, natural language processing, su Enciclopedia Britannica, Encyclopædia Britannica, Inc.
- (EN) Opere riguardanti Natural language processing (Computer science) / Natural Language Processing, su Open Library, Internet Archive.
Controllo di autorità | LCCN (EN) sh88002425 · J9U (EN, HE) 987007536703305171 · NDL (EN, JA) 00562347 |
---|