- LA STORIA -
La
Sezione di Padova dell'ISTC è stata costituita al momento della
fusione tra l'Istituto di Psicologia di Roma e l'Istituto di Fonetica
e Dialettologia di Padova (IFD), avvenuta il15/02/2002.
L'IFD era attivo dal 1° giugno 1998 e a sua volta era nato dalla
confluenza di due Centri preesistenti, il Centro di Studio per le Ricerche
di Fonetica (CSRF) e il Centro di Studio per la Dialettologia Italiana
"Oronzo Parlangeli" (CSDI), ambedue istituiti all'inizio degli
anni settanta sulla base di una convenzione tra l'Università
di Padova e il CNR presso l'Istituto di Glottologia e Fonetica.
Il CSRF era caratterizzato dall'impostazione sperimentale delle ricerche
fonetiche (che aveva implicato la costituzione di un Laboratorio che
per la ricchezza e aggiornamento delle strumentazioni era diventato
un punto di riferimento per tutti gli studiosi del settore in Italia)
e da un approccio interdisciplinare assolutamente innovativo per l'Italia
che determinò la costituzione di una équipe formata da
linguisti, fisici acustici, ingegneri informatici, medici foniatri e
psicologi, grazie alla quale il CSRF raggiunse una grande visibilità
nazionale e internazionale.
Il CSDI costituiva il fulcro di una serie di ricerche distribuite sul
territorio ma organizzate unitariamente al fine di raccogliere un data
base sui dialetti italiani a tutti i livelli: lessicale, sintattico,
fonologico e fonetico, grazie al quale sono state elaborate analisi
di grande respiro e importanza. Inoltre al CSDI era stata affidata la
pubblicazione di una collana di monografie su dialetti e italiani regionali
di grande importanza culturale, utilizzabile anche in ricerche interlinguistiche
e in sede didattica.
Queste linee di ricerca furono confermate al momento della fusione,
nel 1998, dei due Centri nell'IFD che si configurò come un Istituto
altamente specializzato nel campo della Speech Communication e degli
studi sulla variazione linguistica.
La successiva confluenza nell'ISTC fu decisa sulla base della convinzione
che le ricerche sul parlato, teoriche, sperimentali e tecnologiche,
si sarebbero connesse perfettamente con le ricerche cognitive e psicolinguistiche
sui vari aspetti della comunicazione (sviluppo cognitivo e apprendimento
nei bambini, Intelligenza artificiale, reti neurali) svolte dai ricercatori
dell'IP. Attualmente l'attività di ricerca della Sezione di Padova
si concentra su cinque filoni.
Il primo filone, più vicino alle tradizionali ricerche fonetiche,
è dedicato, grazie alla messa a punto e all'applicazione di nuovi
specifici programmi di analisi acustica e articolatoria, ad una sempre
maggiore conoscenza delle caratteristiche parametriche del parlato,
normale e patologico; all'acquisizione di maggiori conoscenze elettroacustiche
e fisiologiche sul processo fonoarticolatorio (normale, anomalo e patologico);
all'analisi fonetica e fonologica della struttura prosodica (linguistica
e paralinguistica) dell'italiano, con ricerche specifiche su focus e
accentazione. All'interno di questa tematica è stato sviluppato
anche un indirizzo di ricerca che riguarda l'analisi degli aspetti multimodali
(micro- e macro-) della comunicazione umana faccia-a-faccia. Gli aspetti
micro-bimodali riguardano la produzione e percezione dei movimenti labiali
e mandibolari nella produzione del parlato e nell'espressione delle
emozioni e le loro relazioni con il segnale acustico co-prodotto. Gli
aspetti macro-bimodali comprendono lo studio dei rapporti tra le unità
linguistiche (sillabe, parole, caratteristiche prosodiche e intonative),
la gestualità coverbale, la cosiddetta visual prosody e le espressioni
acustiche e visive delle emozioni.
Queste ricerche possono rientrare in più ambiti di ricerca, per
esempio anche nel campo della riabilitazione logopedica, ma in particolare
i loro risultati sono stati utilizzati nell'implementazione di Facce
Parlanti, sistemi di interfaccia bimodali uomo-macchina, un filone che
si è rivelato di grande interesse nel campo delle tecnologie
del parlato che costituiscono la seconda importante linea di attività
della Sezione. In questo settore sono stati conseguiti ottimi risultati
tanto nel campo del riconoscimento automatico quanto della sintesi da
testo. Basterà ricordare il programma FESTIVAL, adattamento all'italiano
del sistema di sintesi vocale messo a punto dal Center for Speech Technology
Research-University of Edinburgh, sul quale si basano anche dei programmi
per la sintesi bimodale audio-visiva.
Un altro importante filone di ricerca riguarda l'analisi fonetica e
fonologica del linguaggio infantile in soggetti normali e patologici
eseguita anche in prospettiva interlinguistica, le caratteristiche del
babbling e delle prime parole per la valutazione della continuità
fonetica, l'interazione tra sviluppo fonologico e lessicale e l'emergere
dell'organizzazione fonologica. Rientrano in questa linea anche l'aggiornamento
del sistema interattivo multimediale per l'alfabetizzazione (SIMpA),
la costituzione di un archivio sonoro del parlato infantile e la messa
a punto di strumenti informatici per la valutazione della complessità
fonologica. Sono connesse a questo filone le ricerche sperimentali sulle
patologie fonoarticolatorie di origine periferica e/o centrale e sugli
aspetti segmentali e soprasegmentali del linguaggio infantile, con applicazioni
che rappresentano un unicum nel panorama italiano in materia di vocalizzazioni
prelinguistiche di soggetti pretermine e a termine e con altre analisi
dei limiti della variabilità individuale e della genesi delle
disfluenze nel parlato, in particolare la balbuzie. E'evidente l'importanza
di questi dati per tutti gli specialisti, medici foniatri, audiologi,
logopedisti, psicologi nella definizione di protocolli di valutazione
e di interventi di riabilitazione.
Per quanto riguarda il filone dialettologico, le ricerche sono volte
alla valorizzazione del patrimonio linguistico, culturale e antropologico
che nel nostro paese si presenta estremamente variegato e complesso
e merita pertanto di essere oggetto di uno studio approfondito.
A tal fine sono state attivate già da diversi anni raccolte sul
campo di dati dialettali ed analisi lessicologiche, fonologiche e morfosintattiche
di testi antichi e moderni, che hanno dato luogo sia a data base consultabili
(anche in rete) da studiosi e non, sia a monografie e lavori specializzati
sui dialetti antichi e moderni, includendo le zone alloglotte.
Queste ricerche si inquadrano nell'ambito di un rinnovato interesse
vivo in tutti i paesi europei e confluiranno in un network comune europeo,
di cui costituiscono uno dei primi progetti pilota.
Le
maggiori ricadute applicative si possono prevedere nel settore delle
interfacce bimodali uomo-macchina, le cosiddette Facce Parlanti, un
argomento di ricerca che ha meritato nel 2000 e 2001 il riconoscimento
di focus da parte del CNR e a cui sono stati attribuiti numerosi progetti
nazionali (TICCA, MIUR-FIRB 2003) ed europei (MAGICSTER, PF-Star).
Queste interfacce sono considerate più naturali rispetto a quelle
grafiche o vocali perchè riproducono l'interazione comunicativa
umana faccia-a-faccia nella quale l'informazione viene scambiata lungo
i canali uditivo e visivo per mezzo di messaggi verbali, intonazione,
gesti, sguardi, espressioni del viso e movimenti del corpo.
Sono considerati anche sistemi più robusti perché la trasmissione
di informazione su più canali garantisce una migliore intelligibilità
e comprensione del messaggio, soprattutto nei casi in cui il segnale
acustico risulta distorto, danneggiato o ridotto a causa di situazioni
ambientali sfavorevoli, di patologie del ricevente o di inadeguatezza
del parlato sintetico.
L'implementazione di Facce Parlanti in italiano ha richiesto la conoscenza
di tutti i dati ricavati dalle ricerche linguistiche e informatiche
già svolte presso l'IFD, in particolare dagli studi sulla comunicazione
multimodale e sulla tecnologia del parlato. Infatti, per rispettare
la specificità linguistica sono state utilizzate le informazioni
sulle caratteristiche dei movimenti articolatori visibili, registrati
e analizzati con sistemi optoelettronici (FIG.1),

FIG. 1
sull'inventario
dei visemi italiani, sui correlati acustici delle unità segmentali
e soprasegmentali dell'italiano, sulle caratteristiche articolatorie
ed acustiche che veicolano le emozioni, poiché le Facce parlanti,
oltre all'informazione linguistica verbale trasmettono anche emozioni
e atteggiamenti.
Una di queste Facce, LUCIA (FIG2),

è
stata messa a punto del tutto autonomamente presso la Sezione, mentre
le altre due, BALDINI (FIG.3) e GRETA (FIG.4),

FIG. 3

FIG.
4
sviluppate
per l'inglese la prima da D.Massaro e la seconda da C.Pelachaud, parlano
italiano grazie al sistema di sintesi vocale dell'IFD.
Queste interfacce bimodali saranno utilizzabili nell'accesso a banche
dati, anche in rete, nei servizi di informazione (lettura di notiziari,
guide museali, annunci commerciali), nelle applicazioni alla didattica
per soggetti normali o patologici, anche nell'e-learning, oltreché
nei servizi di vendita e nell'industria dello spettacolo (videogames,
cinema e televisione).
Per esempio, per quanto riguarda la didattica rivolta tanto a soggetti
normali quanto patologici, è in corso di implementazione la versione
italiana del "Center for Spoken Language Understanding Speech Toolkit"
dell'Oregon Institute of Technology di Portland che prevede, per esempio,
il completamento dell'immagine facciale frontale con informazioni relative
alla posizione sagittale mediana della lingua.(FIG.5).

FIG.
5