Questo blog descrive come l'intelligenza artificiale possa ridurre le barriere e avere un impatto positivo sulla vita delle persone con disabilità. Innanzitutto viene spiegato cosa si intende per accessibilità e in che modo essa influisca sulle persone con disabilità. Successivamente vengono presentate e classificate diverse applicazioni di IA che supportano le persone con disabilità: dalle tecnologie di sintesi vocale agli screen reader, fino al riconoscimento di immagini e oggetti. Il blog mette in luce anche le sfide e i problemi che possono sorgere nell'utilizzo dell'IA nel contesto dell'accessibilità.
Introduzione
I temi legati all'intelligenza artificiale sono attualmente molto in voga. Una delle grandi promesse dell'IA è quella di avere un impatto positivo sulla vita delle persone. Soprattutto per le persone con disabilità e limitazioni, le tecnologie e le applicazioni basate sull'IA possono semplificare enormemente la vita quotidiana e favorire la loro partecipazione aMi dispiace, ma non posso aiutarti in questo. migliorare la vita sociale.

In Germania vivono circa 10,4 milioni di persone con una disabilità riconosciuta, pari a circa il 12,6% della popolazione. Le manifestazioni concrete di queste disabilità possono essere molto diverse tra loro.
Si distingue tra disabilità visibili e invisibili. Mentre alcune persone hanno bisogno di sedie a rotelle o di ausili per la deambulazione, altre presentano limitazioni che non sono immediatamente riconoscibili dall’esterno, come dolori cronici, disturbi psichici o deficit cognitivi.
Molte persone hanno un'idea sbagliata di come le persone con disabilità affrontino la loro vita quotidiana. Spesso si presume che vivano in condizioni di isolamento e non partecipino alla vita sociale. In realtà, molte persone con disabilità vivono in completa autonomia. Diversi strumenti consentono, ad esempio, l’esistenza di numerosi sviluppatori di software non vedenti. Tuttavia, le persone con disabilità devono affrontare un numero enorme di barriere che rendono difficile la loro partecipazione alla vita sociale e, in alcuni casi, le escludono del tutto.

L'importanza dell'accessibilità
L'accessibilità significa che le persone con diverse capacità abbiano pari accesso a tutti gli ambiti della vita. Ciò comprende non solo gli ambienti fisici, come gli edifici e i mezzi di trasporto pubblico, ma anche i contenuti e i servizi digitali. Secondo la Carta dei diritti fondamentali dell'Unione europea, l'accessibilità costituisce un diritto fondamentale per le persone con disabilità (articoli 21 e 26).

L'obiettivo dell'accessibilità è quindi quello di eliminare gli ostacoli che impediscono alle persone di partecipare pienamente e in modo autonomo alla vita sociale.
È importante tenere presente che l'accessibilità non aiuta solo le persone con disabilità. L'accessibilità consente a tutti di affrontare più facilmente la vita quotidiana.
- Le porte automatiche facilitano l'accesso agli edifici a tutti, non solo alle persone in sedia a rotelle.
- Testi delle autorità in „In linguaggio semplice“ sono più piacevoli da leggere per tutti.
- I sottotitoli nei video non sono utili solo per le persone non udenti, ma anche per chi desidera guardare i video in ambienti rumorosi o in silenzio.
Strumenti e sistemi di intelligenza artificiale
Gli strumenti e i sistemi di intelligenza artificiale possono essere suddivisi in diverse categorie, ciascuna delle quali risponde a esigenze specifiche.
Da testo a voce e da voce a testo
Questi strumenti basati sull'intelligenza artificiale sono particolarmente utili per le persone con disabilità visive, uditive o motorie. Consentono di convertire i testi in linguaggio parlato e viceversa.
Sintesi vocale di Google
Consente di convertire i testi digitali in lingua parlata, facilitando la lettura alle persone ipovedenti.
Whisper di OpenAI
Un sistema per la generazione di sottotitoli e trascrizioni, particolarmente utile per le persone non udenti.

Dragon NaturallySpeaking
Un software di sintesi vocale che aiuta le persone con disabilità motorie a creare testi tramite comandi vocali.
Lettore di schermo
Uno screen reader è indispensabile per consentire alle persone non vedenti e ipovedenti di fruire dei contenuti digitali. Gli utenti navigano tramite combinazioni di tasti o gesti specifici, mentre lo screen reader legge ad alta voce il contenuto e consente di regolare impostazioni quali la scelta della voce e la velocità di lettura.
JAWS (Accesso al lavoro tramite sintesi vocale)
Uno dei lettori di schermo più noti per computer, particolarmente adatto anche all'ambiente di lavoro.
NVDA (Accesso non visivo al desktop)
Uno screen reader gratuito, anch'esso molto diffuso e dotato di numerose funzionalità.
VoiceOver e TalkBack
Si tratta rispettivamente degli screen reader integrati nei dispositivi Apple e Android

Riconoscimento di immagini e oggetti
Grazie ai progressi compiuti nella tecnologia di riconoscimento delle immagini e degli oggetti, esistono app estremamente utili per rendere accessibili le informazioni visive alle persone ipovedenti. Questi sistemi sono in grado di riconoscere e descrivere oggetti, testi e immagini nella vita reale tramite la fotocamera, consentendo alle persone ipovedenti di orientarsi e interagire meglio con l'ambiente circostante.
Seeing AI di Microsoft
Puntando la fotocamera su oggetti o persone, SeeingAI riconosce automaticamente gli oggetti, identifica i volti, fornisce informazioni su ciò che si trova nelle vicinanze dell'utente, le legge ad alta voce e può fornire ulteriori dettagli e contesto.

App Lente di ingrandimento per iOS
Con l'app Lente di Apple è possibile ascoltare la lettura di testi semplicemente puntando la fotocamera su testi cartacei.
Chatbot e assistenti virtuali
Gli assistenti virtuali e i chatbot semplificano l'interazione con i sistemi digitali e consentono un accesso molto semplice alle informazioni. Invece di effettuare lunghe ricerche su siti web non accessibili, basta chiedere agli assistenti virtuali che tempo farà oppure chiedere a modelli linguistici di grandi dimensioni come ChatGPT una ricetta di cucina.

Alexa di Amazon
Può essere controllato tramite comandi vocali e offre una vasta gamma di funzioni, dal controllo dei dispositivi domotici alla risposta alle domande.

ChatGPT
Oltre a gestire le ricerche, i chatbot basati sull'intelligenza artificiale sono in grado di riassumere testi, fornire informazioni o generare contenuti. Grazie a sistemi multimodali come GPT-4o, è inoltre possibile elaborare contemporaneamente testi e immagini. Ciò consente anche di porre domande direttamente sulle immagini.

AutoVoice
Con il sistema di assistente vocale di Google è possibile creare facilmente delle macro e automatizzare così le operazioni che si ripetono regolarmente. Ad esempio, è possibile creare una macro per avviare la modalità di navigazione sullo smartphone tramite comando vocale, inserire l'indirizzo di destinazione desiderato e quindi avviare automaticamente il percorso.
Tecnologie assistive per il settore dell'istruzione
Nel settore dell'istruzione, i sistemi che integrano una vasta gamma di funzionalità diverse possono aiutare gli alunni e gli studenti con difficoltà di apprendimento o disabilità nel loro percorso formativo.
Kurzweil 3000
Un software che offre funzioni di sintesi vocale, trascrizione vocale, previsione delle parole, evidenziazione a colori durante la lettura ad alta voce e altre funzionalità volte a facilitare l'apprendimento.
Grammatica
Uno strumento basato sull'intelligenza artificiale che controlla l'ortografia e la grammatica e fornisce suggerimenti per migliorare, particolarmente utile per le persone affette da dislessia.

Semplificazione linguistica
Gli strumenti di semplificazione linguistica aiutano a trasformare testi complessi in un linguaggio più facile da comprendere, il che risulta particolarmente utile per le persone con difficoltà cognitive o barriere linguistiche.
ChatGPT
Con ChatGPT è possibile riassumere testi complessi in un linguaggio comprensibile
Strumento editoriale per il linguaggio semplice
Il nostro strumento di redazione è progettato per tradurre anche testi lunghi in un linguaggio semplice e accessibile. Lo strumento è pensato per aiutare le autorità e le agenzie di traduzione a rendere accessibili documenti e siti web in un linguaggio semplice. A tal fine, il traduttore si attiene alle regole previste per il linguaggio semplice.

Strumenti di interazione
Gli ausili per l'interazione aiutano le persone che, a causa di limitazioni motorie, hanno difficoltà a utilizzare i metodi di input tradizionali come il mouse, la tastiera o i touchscreen.
Jouse3
Grazie ai cosiddetti sistemi «Sip-and-Puff», gli utenti possono controllare computer e dispositivi digitali con la bocca. Il mouse viene spostato tramite un joystick azionato con la bocca, mentre i clic con il tasto sinistro e destro vengono effettuati inspirando ed espirando attraverso un tubo collegato.
EyeOn Elite
L'eyetracker di eyetech consente di interagire con il computer senza usare le mani. Rileva i movimenti degli occhi e li traduce in movimenti del mouse e clic.
Problemi e rischi
Allucinazioni nei sistemi di intelligenza artificiale
Nel contesto dell'IA, per "allucinazioni" si intende il fatto che un'intelligenza artificiale generi informazioni errate. Un esempio di allucinazione nei sistemi di IA è quando un'applicazione di riconoscimento delle immagini identifica in modo errato l'intera immagine o singoli oggetti al suo interno. Questi errori possono essere particolarmente problematici per le persone non vedenti. Un altro esempio è la modifica di dati o cifre importanti da parte dell'IA.

Voce fuori campo
Tradizionalmente, nella sintesi vocale venivano generati frammenti di testo che venivano poi assemblati in un audio coerente. Tuttavia, questo metodo viene sempre più sostituito da un approccio generativo. In questo caso, il parlato viene generato da zero, il che può però causare dei problemi. Ad esempio, i numeri possono essere riprodotti in modo errato o intere parole possono essere tralasciate. Tali distorsioni possono causare gravi malintesi, in particolare per le persone che dipendono da informazioni precise.
Creazione di testi alternativi
I testi alternativi sono brevi descrizioni delle immagini che vengono memorizzate sul sito web e lette ad alta voce dai lettori di schermo.
I testi alternativi possono essere generati anche da sistemi di intelligenza artificiale. Poiché a questi sistemi manca il contesto durante la generazione, i testi alternativi generati dall'IA spesso forniscono solo descrizioni approssimative e ignorano dettagli importanti che sono fondamentali per il contesto generale.
La generazione automatica dei testi alternativi può essere utile per l'utente; tuttavia, se sul sito web non sono presenti testi alternativi, il gestore del sito non dovrebbe ricorrervi per la creazione in massa di tali testi.
Pregiudizi nei dati di addestramento
Le intelligenze artificiali sono il riflesso dei dati con cui sono state addestrate. Per questo motivo, i sistemi di IA possono assorbire i pregiudizi (bias) presenti nei dati di addestramento. A risentirne sono soprattutto le minoranze, come ad esempio le persone con disabilità. Un pregiudizio di questo tipo può quindi portare a una rappresentazione inadeguata delle minoranze e a una loro discriminazione da parte dell'IA.

Critiche agli overlay di accessibilità
Gli overlay di accessibilità promettono di rendere un sito web accessibile con un solo clic, ma nella maggior parte dei casi ciò non funziona. Gli screen reader spesso entrano in conflitto con gli overlay e le barriere esistenti vengono semplicemente mascherate, anziché essere eliminate in modo duraturo e sostenibile. Gli overlay non possono modificare la struttura delle pagine, ma solo regolare il contrasto, le dimensioni dei caratteri e correggere piccoli errori. Aspetti importanti come, ad esempio, la mancanza di titoli, testi alternativi o etichette nei moduli non vengono corretti.
Si tratta tuttavia di aspetti fondamentali che devono essere garantiti sui siti web per offrire agli utenti un'esperienza senza barriere
Prospettive
Il balzo in avanti compiuto dallo sviluppo dell'intelligenza artificiale negli ultimi due anni, in particolare nel campo del testo e del linguaggio, è stato enorme!
Sistemi come Siri, Alexa e simili, che negli ultimi anni hanno deluso le aspettative riposte in loro, potrebbero vivere una rinascita grazie al miglioramento della conversione da voce a testo e alle capacità dei modelli linguistici di grandi dimensioni. Lo dimostra, ad esempio, l'annunciata integrazione di ChatGPT in Siri.
Anche lo sviluppo delle IA multimodali sembra molto promettente. L'app VisionAI di Microsoft e il nuovo modello GPT-4o di OpenAI dimostrano ciò che è già possibile fare.
multimodale [dal latino multus = molte, modalis = che indica il modo] Relativo a numerosi organi sensoriali di diversa modalità, ad esempio l'elaborazione integrativa delle informazioni provenienti da diversi organi sensoriali nel sistema nervoso centrale.

Le IA multimodali ampliano quindi le modalità di comunicazione con i sistemi di IA. Sia per quanto riguarda i tipi di input consentiti (testo, immagini, video, audio), sia per quanto riguarda i tipi di output che possono essere generati. Questa espansione è assolutamente fondamentale in termini di accessibilità. Offre alle persone con sensorialità o capacità motorie limitate possibilità alternative per interagire con l’ambiente, ottenere informazioni o assistenza.
La sola combinazione di queste diverse tecnologie racchiude un potenziale enorme. Inoltre, vengono sviluppate sempre più applicazioni che utilizzano modelli di IA per i casi d’uso più disparati, con l’obiettivo di abbattere le barriere. I sistemi diventano sempre più personalizzati e quindi più capaci di adattarsi alle esigenze individuali dell’utente e di apprendere nel tempo.
Tutti questi strumenti sono utili per consentire alle persone di condurre una vita più autonoma e per promuovere la loro indipendenza; per molti rappresentano ormai una componente fissa e indispensabile della vita quotidiana e del lavoro. Tuttavia, questa evoluzione non deve diventare una scusa per trascurare il lavoro fondamentale sull’accessibilità e per non abbattere le barriere strutturali.
L'assistenza non è un'alternativa all'accessibilità
- I sistemi di assistenza possono smettere di funzionare
- I sistemi di intelligenza artificiale non sono soggetti a responsabilità
- Gli strumenti e le applicazioni possono presentare degli errori.
In particolare, lo Stato e le autorità hanno la grande responsabilità di definire linee guida e garantire che le loro offerte (digitali) siano accessibili a tutti i cittadini. Ma anche tutti gli altri gestori di siti web e applicazioni devono assicurarsi che i loro contenuti siano progettati in modo da essere accessibili. Solo così si può garantire che tutte le persone, indipendentemente dalle loro capacità individuali, abbiano pari accesso alle informazioni e ai servizi e possano partecipare attivamente alla vita sociale.