![]() |
Agostino
Tarsitano
Attività di Ricerca |
Lattività di ricerca di Agostino Tarsitano si è fondata su due principi ispiratori: la statistica come metodo, comune quindi a tutte le discipline speculative ed il calcolo statistico come realizzazione e verifica dei metodi. Non sono mancate collaborazioni con economisti, sociologi, demografi, esperti di marketing, ingegneri e fisici. Esse hanno dato spazio alla visione della statistica come ausilio non solo delle scienze hard, ma anche di quelle che escono o non possono stare nel chiuso di un laboratorio.
Le aree che egli ha maggiormente privilegiato sono le
seguenti:
Analisi delle serie storiche
E stata una delle prime aree in cui lo scrivente ha
operato. In questo ambito ha condotto studi approfonditi nel campo
temporale con lavori sulluso e le proprietà dei modelli ARIMA.
Si trattava, per quei tempi (1978-80) di studi innovativi in Italia. Ad
esempio, ha proposto in una nota non riproducibile, luso delloperatore
differenza (1-B)d con d frazionario poi ricomparso in tempi molo recenti.
Cartografia tematica:
Le serie territoriali possono essere ben rappresentate
se alla distribuzione statistica si accompagnano le informazioni cartografiche
racchiudendo in una immagine unica il fenomeno, il territorio e la loro
interazione. Lo studio della diffusione spaziale del fenomeno cioè
la sua concentrazione in pochi punti o la disseminazione più o meno
uniforme possono suggerire interpretazioni e chiavi di lettura altrimenti
difficili da immaginare. A. Tarsitano ha studiato in particolare lanalisi
statistica dei dati da satellite. Dimostrando che i canali di trasmissione
dei Landsat si muovono lungo due componenti fondamentali e che la bidimensionalità
dei dati consente di identificare solo dei macroenti al suolo. Agli inizi
degli anni ottanta la qualità delle informazioni non consentiva
la quantificazione delle risorse territoriali con il satellite. Di recente
si sta interessando della costruzione delle disease maps e unita alla clustering
spaziale.
Statistica computazionale
Fin dai primi studi universitari A.Tarsitano ha investito
in conoscenze informatiche sia per quanto riguarda i linguaggi di programmazione
che i linguaggi orientati della statistica. In quella fase ha maturato
anche linteresse per lanalisi numerica ed in particolare per i calcoli
iterativi delle regressioni non lineari oggetto della tesi di laurea e
di un lavoro specifico. La formazione in questo ambito ha permesso di seguire
la pur frenetica evoluzione dei mezzi di calcolo e del software in modo
da avvantaggiarsi dei prodotti migliori offerti dal mercato e, quando necessario,
di costruirne artigianalmente di propri. Ad esempio, il computer è
anche servito per lo studio delle proprietà campionarie ed asintotiche
di vari indici descrittivi della concentrazione. A questi la teoria assegna
delle proprietà ottimali senza però specificare quando queste
comincino a manifestarsi. Limpegno dello scrivente si è diretto
alla determinazione di pseudo campioni atti a funzionare come comodo, sebbene
mai totalmente affidabile, laboratorio sperimentale per gli indici statistici.
Questo motivo si ritrova in diversi lavori allinterno dei quali ha dimostrato:
1) Gli stimatori vincolati non sono necessariamente una
soluzione valida nel calcolo delle regressioni non lineari, anzi tenere
conto dei vincoli significa costringere artificiosamente dei dati a stare
dentro un modello da cui vorrebbero invece fuggire. In altre parole i vincoli
sono più una sorta di test di coerenza che un elemento di stima.
2) La normalità asintotica di alcuni indici di
concentrazione basati sul modello Gamma standardizzato.
3) I classici indici di concentrazione possono essere
espressi come rapporti di statistiche L riuscendo a dare una nuova loro
interpretazione e che la normalità asintotica è valida sotto
condizioni più generali di quelle usualmente riferite in letteratura.
Non solo, ma gli indici di concentrazione di sinistra con pesi cioè
maggiori per i redditi più piccoli hanno proprietà asintotiche
migliori
4) Il test di Hotelling è ancora preferibile per
la scelta delle variabili nella discriminazione quadratica anche quando
i gruppi hanno diversa matrice di varianza-covarianza.
A.Taristano ha anche redatto un tutorial mirato alla
generazione di campioni pseudo casuali da distribuzioni continue univariate.
E stata inoltre sua costante preoccupazione saggiare con dati simulati
gli assunti teorici con cui si confrontava. Anche le asserzioni più
pacifiche possono mostrare risvolti curiosi ed interessanti quanto sono
sperimentate un numero di volte sufficiente a far comparire situazioni
campionarie estreme.
Analisi multivariata
Lambito è molto ampio e diverse tecniche, sia
classiche: cluster analysis, factor analysis, multidimensional scaling,
regioni di tolleranza che più recenti (grafiche soprattutto e sulle
possibilità offerte dai nuovi computer) sono state esplorate.
Per le prime sono stati privilegiati gli aspetti
applicativi: a fronte della pressione degli studiosi di discipline utenti
che hanno molto arricchito la conoscenza operativa delle tecniche in questione.
Ci sono anche stati dei contributi metodologici originali (una variante
dellISODATA, nel 1979, reinterpretazione del problema Behrens-Fisher nellanalisi
discriminante quadratica del 1990 e, nello stesso periodo, luso degli
intervalli di tolleranza multivariati come metodo classificazione in tre
gruppi). Nel periodo 1996-1999 ha sviluppato un nuovo algoritmo per la
cluster analisys non gerarchica che supera mediamente gli algoritmi inseriti
nei pacchetti applicativi più noti. In questo stesso ambito è
anche riuscito a dimostrare empiricamente come le procedure apparentemente
più complesse possano in realtà essere non solo più
efficaci (raggiungere più spesso la soluzione ottima), ma più
efficienti (terminare mediamente in un tempo minore).
Nel campo della grafica multidimensionale, lo scrivente
ha subito adottato come strumento operativo, i cinegrammi, (lo scatterplot
in tre dimensioni in particolare realizzato con il glorioso MACSPIN) ed
ha in corso studi sullutilizzo, nellambito dellanalisi multidimensionale,
delle workstation ad alta risoluzione e dei computer vettoriali e paralleli.
Analisi territoriali
Le analisi statistiche territoriali a fini conoscitivi
richiedono complesse indagini investigative che coinvolgono una molteplicità
di indicatori e, spesso, un alto numero di entità territoriali.
In tale situazione si comprende l'importanza di opportune tecniche di analisi
multivariata in grado di semplificare la struttura dei dati (sia dal punto
di vista degli indicatori che da quello delle unità da trattare),
di evidenziare le variabili (reali o latenti) importanti e di individuare
relazioni e comportamenti tra di esse.
In questo ambito, A. Tarsitano ha portato luso
della procedura Friedman-Rubin per lanalisi non gerarchica dei gruppi
che consente lindividuazione di entità correlate quale quelle riscontrate
nelle zoning nonché la fattorizzazione degli indicatori riscalati
con metodi alternativi alla usuale standardizzazione. La sottile diversificazione
della procedura tra analisi in blocco e blocchi di analisi è un
carattere distintivo delle sue indagini e collaborazioni in questo campo.
Studi sulla distribuzione dei redditi
Linteresse per questarea scaturì dalla constatazione
della crescita di attenzione sulla concentrazione da parte della letteratura
internazionale, laddove in Italia si riscontrava un calo di tensione e
di impegno in unarea dove la nostra tradizione avrebbe richiesto e permesso
analisi molto più approfondite. Nel flusso di studi che seguirono
si inseriscono diversi lavori dello scrivente: la riscoperta dellindice
di concentrazione di Bonferroni, il calcolo dei decili a partire dalla
distribuzione in classi, il comportamento di alcuni indici di concentrazione,
noti e meno noti, nellambito del modello Gamma. La proposta del modello
Lambda generalizzato come descrittore della distribuzione dei redditi secondo
lammontare. Di particolare rilievo è lo studio dellasimmetria
della curva di Lorenz e la sua interpretazione economica che consente
di proporre in un nuovo e più formale schema le ipotesi di Kuznets
(la sua famosa curva ad U) della distribuzione del reddito nello sviluppo
economico. In questo ambito sono state colmate due lacune: lespressione
della condizione di simmetria della curva di Lorenz nel sistema di coordinate
(p,q) e la determinazione delle formule di calcolo per diversi indici di
asimmetria allorché i dati siano raggruppati in classi. In tempi
più recenti.