|
The Author explains methods and meanings of the terms "Criminal Profiling", either from a theorical and practical view. In particular the article itemizes the "Artificial Neural Networks (ANN)" and the possibility to use such recent technologies for a better criminal profiling.
Oggigiorno si parla molto di "criminal profiling", complici le varie serie televisive che mitizzano questo metodo investigativo; purtroppo quello che vediamo in televisione è sicuramente fuorviante riguardo ad una attività che è ben diversa, più complessa e più incerta negli esiti, in ogni caso molte volte nella pratica meno scientifica di come ci viene rappresentata.
Intanto sull'utilizzazione del termine stesso "criminal profiling", che comunque qui utilizzeremo, non vi è univocità; infatti il nome più appropriato per le attività che vediamo rappresentate nella finzione televisiva potrebbe essere "psychological criminal profiling", o semplicemente "psychological profiling"; in realtà il Federal Bureau of Investigation (FBI) degli Stati Uniti, che spesso vediamo come sede di queste attività, utilizza il nome "criminal personality profiling".
Al di là del nome, i criminologi fanno rientrare queste attività nella criminologia applicata o nella criminologia clinica, oppure le associano alle tecniche di ricostruzione della scena del crimine e proprio per questo le definizioni di questo gruppo di attività afferenti al "criminal profiling" sono molteplici e diversificate, in funzione anche dell'utilizzazione più o meno ampia di dati e della provenienza degli stessi.
Per esempio una definizione che si riferisce ad un uso "strategico" di informazioni raccolte in modo massiccio è la seguente: "In its plainest sense, criminal justice profiling occurs when criminal justice officials strategically consider characteristics such as race, gender, religion, sexual orientation, [age and other factors] to make discretionary decisions in the course of their duties."[1].
Un'altra definizione che invece si riferisce maggiormente alla scena del crimine è: "It is an attempt to determine the attributes of an unknown subject (UNSUB) or perpetrator based on evaluating minute details of the crime scene, the victim, and any other obtainable evidence."[2].
Per quanto andremo ad illustrare nel presente articolo, con il termine "criminal profiling" possiamo intendere un processo di acquisizione e di elaborazione di informazioni utile all'individuazione del soggetto che ha compiuto (o sta per compiere) un determinato crimine.
In relazione al fatto che il processo di acquisizione delle informazioni sia associato ad una vera e propria attività investigativa specifica (posteriore all'accadimento o immediatamente precedente all'accadimento), oppure ad una attività di prevenzione generalizzata (non connessa dunque direttamente ad un evento specifico), alcuni autori[3] parlano di criminal profiling "reactive" o "proactive".
In pratica quando gli investigatori utilizzano il profiling per risolvere crimini già avvenuti, essi stanno utilizzando la modalità reactive; al contrario il profiling proactive si riferisce al tentativo di impedire il crimine in una fase molto anteriore a che questo avvenga.
Proprio questa ultima tipologia di profiling che, per inciso, ha un particolare interesse oggigiorno con riferimento agli atti terroristici, viene così definita: "To make judgments about another, relative to possible criminal activity, based on a number of overt and subtle factors which may or may not include things such as a person's race, manner of dress and grooming, behavioral characteristics, when and where the observation is made, the circumstances under which the observation is made, and relative to information the officer may already possess."[4].
E' poi possibile operare un'altra differenza che indirettamente abbiamo già richiamato: quelle fra criminal profiling induttivo e criminal profiling deduttivo.
Nel criminal profling deduttivo lo scopo dell'analisi è di dedurre il comportamento di un particolare criminale dalle evidenze relative al singolo crimine[5]; questo modus operandi confida nella tipicità del modo di ragionare e del comportamento umano. Il problema di questo approccio è che molti fattori esterni possono influenzare il comportamento umano e quindi possono produrre, in una determinata situazione, effetti diversificati, anche se generati da personalità fondamentalmente simili.
Nel criminal profiling induttivo si parte invece da un insieme di dati relativi ad eventi simili, correlati ai dati delle persone che li hanno causati, in modo da arrivare a dedurre il "profilo" del criminale "standard" per quel particolare evento; banalizzando, se sappiamo che l'80% dei serial killer che uccidono le studentesse nei parcheggi delle scuole sono uomini, di razza bianca, con una età fra i 30 e i 40 anni, che vivono soli con la madre e guidano un certo tipo di automobile, sapendo che il criminale che cerchiamo ha attaccato almeno quattro volte studentesse nel parcheggio di una scuola, possiamo presupporre di doverlo cercare fra gli uomini di età compresa fra i 30 e i 40 anni, che vivono soli con la madre, e guidano quel particolare tipo di automobile.
Gli assunti del criminal profiling induttivo sono:
- il comportamento e le motivazioni dei criminali non cambiano riguardo al tempo, essendo caratteristiche statiche e prevedibili, basate sulle modalità del comportamento umano individuale e sulle sue caratteristiche che sono abbastanza stabili;
- i criminali che hanno commesso determinati crimini in un passato recente (talvolta anche remoto) sono culturalmente simili agli odierni criminali che commettono gli stessi crimini, essendo influenzati da condizioni ambientali simili ed avendo le stesse motivazioni generali e qualche volta anche le stesse motivazioni specifiche;
- i criminali già conosciuti condividono pertanto le loro caratteristiche con i criminali ancora sconosciuti che commettono lo stesso tipo di crimini, da cui la possibilità di operare generalizzazioni utili ad una previsione che si basi sulle specifiche caratteristiche e sul comportamento effettivo nel caso in studio.
In modo totalmente diverso, il criminal profiling deduttivo si appoggia invece solamente sulle evidenze della scena del crimine e sullo stato della vittima; grazie a questa tipologia di profiling si deducono le caratteristiche del criminale basandosi sullo scenario dell'evento (esempio: se il criminale taglia con cura parti dal corpo della vittima, si può dedurre che sa far uso di strumenti da taglio e quindi potrebbe essere un chirurgo, oppure un macellaio, ecc., se il corpo della vittima presenta tipi di ferite non mortali, ma tutte leggere, si può comprendere che il criminale non voleva inizialmente ucciderla, ma voleva solo procurarle dolore e quindi questo può aiutarci a capire il profilo psicologico del criminale, e così via).
Gli assunti del criminal profiling deduttivo sono:
- le evidenze sulla scena del delitto, l'analisi della scena stessa tramite le documentazioni, mediche, chimiche, fotografiche, ecc., tutto quanto può essere utile a far comprendere in particolare le interazioni fra vittima (o vittime), criminale (o criminali) e luogo del delitto, l'eventuale evoluzione (o la non evoluzione) nel tempo nei casi seriali, le eventuali più o meno chiare "firme" lasciate dal criminale sulla scena del delitto, sono tutte caratteristiche utili a tracciare il profilo del criminale;
- egualmente le studio e l'analisi delle caratteristiche peculiari della vittima possono farci capire perché il criminale abbia scelto quella determinata vittima all'interno della generalità della popolazione e quindi contribuire al profilo del criminale.
Come possiamo intuire vi sono alcuni atti criminali, come gli atti terroristici, che mal si prestano ad essere affrontati con le usuali tecniche del criminal profiling, deduttive o induttive che siano, o meglio mal si prestano ad essere affrontati solamente con queste tecniche per più motivi; fra questi:
- la grande variabilità nel tempo e nello spazio degli atti terroristici stessi;
- la non rispondenza dei terroristi agli ordinari profili psicologici criminali;
- la necessità di un inquadramento sociologico particolare del fenomeno terrorismo;
- il fatto che negli attentati terroristici molte caratteristiche della scena del delitto vanno perse.
Gli atti terroristici possono essere considerati una sorta di serial killing perpretato da una pluralità di persone anziché da un solo criminale; come si può comprendere questa tipologia difficilmente si ritrova al di fuori degli atti terroristici, salvo che nei delitti seriali messi in opera da sette o organizzazioni simili.
Va anche osservato come per definizione stessa l'atto terroristico sia diverso da un normale atto criminale e come le strategie e le tattiche del terrorismo possano evolvere velocemente ed in modo imprevedibile; a titolo di esempio riportiamo il seguente estratto di un articolo de "La Repubblica".
(da La Repubblica)
"Scotland Yard li chiama "terroristi della porta accanto": uomini e donne che conducono una vita apparentemente normale, fino al giorno in cui escono di casa per seminare morte e distruzione. Si nascondono tra quasi due milioni di musulmani britannici, senza dare segnali di radicalismo, per non destare sospetti. Al Qaeda è la loro fonte d'ispirazione, ma non hanno bisogno di ricevere istruzioni: l'occasionale tappa nelle madrasse del Pakistan, le scuole coraniche considerate la culla dell'estremismo islamico, è più un rito d'iniziazione che una necessità strategica..."
"Ma ci sono gravi motivi di preoccupazione per le autorità britanniche. Il primo è che è difficile individuare dei "terroristi della porta accanto". Il secondo è che, anche quando vengono individuati, occorrono enormi risorse per seguirne le mosse. L'anno scorso la polizia ha reso noto che sorveglia 1700 potenziali terroristi impegnati a preparare almeno trenta piani di attacco contro questo paese..."
In questi casi quindi l'uso delle sole tecniche di criminal profiling classiche non serve a molto, e deve essere assistito da un approccio sociologico e psicologico specifico; infatti come è comprensibile dall'articolo citato, il mutamento di strategia operato dagli agenti terroristici, che nella fattispecie erano persone normalissime, ormai perfettamente integrate nella società nella quale vivevano, ha posto le autorità britanniche nell'impossibilità di procedere con gli ordinari metodi investigativi.
Tutto quanto qui detto può quindi indurci ad utilizzare metodi nuovi per il criminal profiling.
Il metodo che qui proponiamo è l'utilizzazione delle reti neurali artificiali, un metodo di elaborazione dell'informazione molto efficiente per operare previsioni ove gli ordinari metodi statistici o algoritmici falliscono, metodo basato sul modello del cervello umano.
Per rete neurale artificiale (ANN - artificial neural network - nella letteratura in lingua inglese) si intende una replica artificiale (hardware o simulata via software) delle reti neurali naturali, quelle biologiche[6], cioè dell'insieme delle cellule (i cosiddetti neuroni) che costituiscono il cervello umano o animale; gli studi hanno da tempo dimostrato che un determinato tipo di reti neurali artificiali, quelle con apprendimento supervisionato, a differenza dei normali computer che devono essere programmati con procedure algoritmiche, sono in grado di individuare la soluzione di problemi che vengono loro posti, apprendendo direttamente dall'esperienza che accumulano presentando loro ripetutamente una serie di esempi del problema da trattare, corredati delle relative soluzioni.
E' stato anche dimostrato che una rete neurale artificiale, purché abbia un numero conveniente di neuroni nello strato nascosto, può computare qualsiasi tipo di funzione computabile.
Le reti simulano quindi il funzionamento del cervello umano e animale, che riesce a trovare la soluzione ai vari problemi semplicemente basandosi sull'esperienza del passato.
Egualmente gli studi hanno mostrato che un altro tipo di reti neurali artificiali, quelle senza apprendimento supervisionato (dette anche auto-organizzanti), hanno una forte analogia con alcune strutture neurobiologiche e con la capacità di queste ultime di auto-organizzarsi apprendendo autonomamente senza la necessità di mostrare loro esempi; queste reti possono indicarci se esiste una struttura (organizzata) soggiacente ai dati che vengono loro presentati.
In pratica questo tipo di rete compie la stessa funzione messa in atto dalla corteccia cerebrale negli animali superiori e nell'uomo.
La possibilità di individuazione di determinati pattern dei valori di indicatori sancisce la possibilità di utilizzare le reti neurali artificiali come metodo previsionale, come alcuni autori mostrano in un quadro comparativo delle varie metodologie[7].

Da un punto di vista generale possiamo dire che le reti neurali artificiali si inseriscono in qualche modo nella più ampia tematica dell'intelligenza artificiale e ne costituiscono un'evoluzione innovativa; è innegabile che lo stimolo alla realizzazione delle reti neurali artificiali provenga dal desiderio di riprodurre sistemi di elaborazione "intelligenti", simili, per prestazioni e comportamento, all'uomo, le cui azioni sono governate dal cervello.
Le reti neurali artificiali replicano l'organizzazione del cervello umano, essendo costituite da molti processori semplici (neuroni artificiali) interconnessi fra sé, come nella figura sottostante, che rappresenta una piccola rete neurale artificiale composta da 5 neuroni (2 di input, 2 nascosti, 1 di output).

Ogni neurone artificiale, in modo sostanzialmente simile ad un neurone biologico, calcola il segnale in uscita come funzione[8] della differenza fra il prodotto dei segnali di entrata per i rispettivi pesi sinaptici, ed un valore di soglia prefissato.
A livello complessivo le reti neurali artificiali ricordano nelle loro prerogative il cervello (umano o animale) essenzialmente per due aspetti:
- la conoscenza è acquisita attraverso un progressivo processo di apprendimento, e non è immessa tutto ad un tratto dall'esterno come invece avviene per i computer tradizionali;
- la forza delle connessioni fra neuroni, conosciuta anche come peso sinaptico, è utilizzata per immagazzinare la conoscenza e per l'apprendimento.
I tipi di rete neurale artificiale sono molti e, considerate le varianti che ognuno può avere, abbiamo una panoramica di centinaia di tipi diversi [8 bis]; in somma sintesi, come abbiamo già detto, da una parte vi sono le reti ad apprendimento supervisionato, che necessitano di un "istruttore" per poter apprendere, dall'altra quelle ad apprendimento non supervisionato che apprendono da sole.
All'interno di queste due grandi classi le reti variano sia per architettura che per algoritimi di funzionamento per il calcolo dei pesi sinaptici corretti; ulteriori variazioni sono date da altri aspetti quali l'inizializzazione dei pesi sinaptici, le possibilità di variazione nel tempo in presenza di input costanti, ed altri parametri. L'uso di uno o l'altro tipo di rete dipende dal particolare problema sul quale vogliamo applicare la rete e, purtroppo, anche dalla maggiore o minore disponibilità di software di rete neurale[9].
Oggigiorno le reti neurali artificiali sono utilizzate in svariate applicazioni pratiche, per lo più in ambito finanziario (per prevedere l'evoluzione dei titoli di borsa), industriale (come nel riconoscimento di pattern, nel controllo di processi), o anche casalingo (nel riconoscimento vocale utilizzato dai telefoni cellulari, nel riconoscimento dei caratteri utilizzato dagli scanner); al momento sono invece ancora molto limitate le applicazioni su fenomeni sociali e limitatissime quelle collegate all'argomento che qui trattiamo, il criminal profiling.
Gli indiscutibili vantaggi che una rete neurale artificiale fornisce rispetto agli ordinari metodi di previsione sono:
- è possibile operare previsioni efficienti anche nel caso di mancanza di una variabile di input. La rete tollera infatti la mancanza di alcuni dati essenziali ed è in grado di operare comunque previsioni valide;
- è possibile inserire fra le variabili di input anche variabili che non hanno influenza sul fenomeno in esame. La rete provvederà da sola a non prendere in esame, o a prenderle in esame nella misura dovuta, le variabili di input che non hanno influenza o che hanno influenza limitata sul fenomeno. Grazie a questo è possibile, in caso di dubbio sull'importanza o meno di una determinata variabile per il fenomeno che viene considerato, fornire alla rete anche i dati corrispondenti alla variabile dubbia, senza per questo avere previsioni scorrette;
- non sono necessarie conoscenze matematiche particolarmente approfondite; tutto quello che è necessario, oltre alla padronanza della tematica delle reti neurali artificiali, è un po' di attenzione nella costruzione della rete (individuazione del tipo, dell'architettura, del numero dei nodi) e quindi molta pazienza nell'ottimizzare i parametri di lavoro della rete rispetto allo specifico fenomeno.
Andiamo pertanto ad ipotizzare una o più possibili reti neurali artificiali che ci possano assistere nel criminal profiling.
Riguardo al criminal profiling induttivo, e dunque a quella tipologia di criminal profiling che cerca di individuare il "profilo" del criminale utilizzando l'assocazione fra i dati rilevati sulle scene di molti crimini ed i profili di chi li ha commessi (rilevati, chiaramente, a posteriori), questi dati devono già essere in nostro possesso affinché la rete neurale possa lavorarci.
Per una applicazione pratica su questa tipologia di criminal profiling si ritiene che il tipo di rete neurale artificiale più adeguata sia una rete neurale artificiale del tipo multi-layer perceptron (MLP), rete ad apprendimento supervisionato, in quanto:
- è il tipo di rete che è stato più a lungo studiato e quindi più conosciuto, anche per quanto concerne la calibrazione dei vari elementi della rete[10], e dunque il tipo di rete che può fornire risultati maggiormente attendibili, almeno allo stato attuale di studio delle reti neurali artificiali;
- la rete MLP è una tipologia di rete meno critica di altre reti neurali artificiali (come per esempio la rete RBF[11] che pure ha la stessa architettura), che consente valide generalizzazioni dei fenomeni a partire da input non perfettamente determinati; in particolare è in grado di fornire output corretti anche quando vengono presentati in input, insieme alle variabili veramente significative per il particolare fenomeno, altre variabili non significative. Inoltre, un po' come tutte le reti neurali, accetta input corrotti da "rumore"[12] senza modificare sensibilmente il proprio comportamento riguardo all'output (quando invece altri metodi, come quelli statistici, condurrebbero ad errori fatali per la previsione);
- è il tipo di rete più facilmente implementato in software di simulazione ANN già disponibili sul mercato, anche con licenza freeware o shareware, oppure messo a disposizione gratuitamente da Istituti Universitari;
- le reti MLP possono essere considerate ottimi approssimatori universali di funzioni non lineari, con una serie di indiscutibili vantaggi rispetto ad altri metodi, in quanto:
· consentono la presentazione contemporanea di input diversi per campo di variazione (per esempio: sia quantità rappresentate da un numero reale, come potrebbero essere dati macro-economici, come il PIL, sia valori di SI/NO rappresentati da 1 e 0, come le risposte ad alcune batterie di domande);
· consentono di non doversi preoccupare dello specifico modello di funzionamento che utilizzeranno per l'approssimazione (sono una sorta di black box).
Vanno comunque precisati alcuni aspetti che devono essere tenuti presenti per utilizzare una rete neurale artificiale MLP[13] per il criminal profiling induttivo:
- è necessario avere la disponibilità di gruppi di dati (costituiti da variabili che rappresentano gli elementi della scena del crimine e variabili che rappresentano le caratteristiche del profilo) abbastanza corposi, in modo da poter procedere sia all'addestramento della rete, sia al test della stessa utilizzando gli ultimi dati (input e relativi output), al fine di verificarne l'efficienza prima dell'uso in sede previsionale;
- la tipologia di crimine non dovrebbe aver subito modificazioni sostanziali e le variabili oggetto di rilevazione per descrivere il crimine ed il suo autore non dovrebbero essere state modificate. Tanto per fare un esempio se si fosse rilevata, anziché la precisa nazionalità del criminale, la sua appartenenza o meno all'Unione Europea questa variabile non sarebbe corretta in quanto avrebbe avuto una evoluzione nel tempo;
- vanno individuate, utilizzando gli studi già compiuti sullo stesso argomento, le variabili di input "chiave" (quelle che rilevano la scena del crimine) e le variabili di output "chiave" (quelle che vanno ad individuare il "profilo"). Per fortuna l'utilizzazione di una rete neurale consente di utilizzare più variabili rispetto a quelle effettivamente significative, senza per questo inficiare il funzionamento della rete che semplicemente, "ignorerà" le variabili che non sono significative.
Cerchiamo di fornire un esempio pratico, certamente non esaustivo dato il limitato spazio a disposizione.
I passi da compiere sono i seguenti, ammettendo, sempre per esempio, di utilizzare un database costituito da record i cui campi siano simili a quelli compilati nel VICAP (Violent Criminal Apprehension Program), del FBI (il questionario a risposta multipla che descrive il crimine in corso di analisi e le cui informazioni vengono poi effettivamente inserite in un database):
1. individuazione delle variabili di input costituite dalla misurazione (in termini numerici, in termini di si/no, ecc.) degli elementi rilevati sulle scene dei crimini. Nel nostro esempio, utilizzando (si ripete, è solo un esempio, le variabili da utilizzare realmente sono molte di più) alcune variabili del VICAP relativamente agli omicidi a sfondo sessuale, potremmo avere:
|
Variabile
|
Range
|
|
|
|
|
Attacco pianificato (o spontaneo)
|
SI/NO
|
|
Vittima sconosciuta
|
SI/NO
|
|
Luogo del crimine sconosciuto
|
SI/NO
|
|
Ha conversato con la vittima prima dell’attacco
|
SI/NO
|
|
Vittima sottomessa con mezzi di costrizione prima di essere uccisa
|
SI/NO
|
|
Atti sessuali prima della morte
|
SI/NO
|
|
Atti sessuali dopo la morte
|
SI/NO
|
|
Penetrazione violenta quando la vittima è ancora in vita
|
SI/NO
|
|
Corpo rimosso dalla scena del crimine e portato altrove
|
SI/NO
|
|
|
|
|
...
|
|
|
|
|
|
Arma da fuoco
|
SI/NO
|
|
Arma da taglio
|
SI/NO
|
|
Arma personale (o di opportunità)
|
SI/NO
|
La specificazione delle variabili può essere più o meno ampia, per esempio oltre a prevedere una variabile arma da fuoco si/no, potrebbe prevedere il calibro dell'arma o altre caratteristiche più specifiche; ovviamente più si aumenta la specificità, meno generalizzazioni si possono fare. Queste variabili sono quelle che corrisponderanno ai neuroni di input della nostra rete neurale artificiale.
2. Individuazione delle variabili di output che descrivono il profilo del criminale. Nel nostro esempio, utilizzando (si ripete, è solo un esempio, le variabili da utilizzare realmente sono molte di più) alcune variabili del VICAP relativamente agli omicidi a sfondo sessuale, potremmo avere:
|
Variabile
|
Range
|
|
|
|
|
Intelligenza
|
1-10
|
|
Socialmente adeguato
|
1-10
|
|
Sessualmente adeguato
|
|
|
Occupato in lavori di media-alta qualifica
|
SI/NO
|
|
Tende a cambiare spesso lavoro
|
SI/NO
|
|
Lavoratore manuale
|
SI/NO
|
|
Disoccupato
|
SI/NO
|
|
Situazione familiare normale
|
SI/NO
|
|
Situazione familiare problematica
|
SI/NO
|
|
Uso di alcool (1=uso normale – 10= abuso)
|
1-10
|
|
Uso di sostanze stupefacenti (1=uso normale – 10= abuso)
|
|
|
Vive con partner
|
SI/NO
|
|
Sesso
|
M/F
|
|
Geograficamente mobile
|
1/5
|
|
Interesse nei mass media
|
1/5
|
|
Aspetto curato
|
1/10
|
|
Igiene personale
|
1/10
|
|
Figlio unico o maggiore
|
SI/NO
|
|
Dispone di altri appartamenti oltre la residenza
|
SI/NO
|
|
|
|
|
...
|
...
|
|
|
|
|
Vive in luogo isolato
|
SI/NO
|
3. Reperimento delle serie dei valori correlati input/output riferiti alle variabili di cui sopra. Queste serie non sono altro che uno "spaccato" del database. In realtà già nella selezione delle variabili è bene tenere conto dei dati a disposizioni.
4. Prima strutturazione della rete MLP in termini di numero dei neuroni di input (che corrispondono alle variabili di input), di output (che corrispondono alle variabili di output), nascosti. In via molto generale, è da tenere presente che aumentando il numero di nodi nascosti la rete neurale artificiale aumenterà le propria precisione rispetto ai dati presentati, ma diminuirà la propria facoltà di generalizzazione a valori che non rispettano il trend precedente. All'opposto diminuendo i nodi nascosti si aumenteranno le facoltà di generalizzazione a nuovi valori, ma si diminuirà la precisione. Per esempio, supponendo che le variabili che descrivono il profilo siano 35, quelle relative alla scena del crimine siano 50, l'architettura della rete potrebbe essere quella in figura.

5. normalizzazione di tutti i valori delle variabili affinché possano essere trattati dalla rete neurale artificiale. Questa operazione si compie facendo una proporzione fra il range di ogni variabile (intendendo per range la differenza fra il massimo ed il minimo raggiungibili dalla variabile in considerazione e non il minimo ed il massimo attuali) ed i valori 1 e 0. Esistono metodi diversi per effettuare questa operazione, ognuno dei quali ha influenza sul funzionamento della rete neurale;
6. apprendimento iniziale della rete neurale utilizzando tutti i valori input/output, meno alcuni set di valori, che serviranno per la fase di test. Alla rete come strutturata in prima istanza verranno dunque presentati i valori (normalizzati) di input e di output, verificando se dopo la fase di apprendimento (che dovrebbe durare per almeno 10.000 epoche[14]) la rete abbia appreso correttamente. La verifica verrà compiuta per la prima volta semplicemente sui valori già presentati durante l'apprendimento; in pratica si verificherà che la rete sia effettivamente un buon approssimatore della funzione che descrive la serie di dati presentata nell'apprendimento. Se in fase di test (con gli stessi valori presentati) la rete funzionerà abbastanza correttamente (e dunque sarà un buon approssimatore della funzione descrittrice del fenomeno), si effettuerà una fase di test con i valori lasciati fuori dall'apprendimento e si verificherà che la rete compia una previsione abbastanza accurata rispetto a tali valori. Durante questa prima fase l'errore (come differenza fra i dati reali e quelli prodotti in fase di funzionamento dalla rete neurale) potrà essere anche notevole. Quello che comunque interessa è che tendenzialmente la rete riesca ad effettuare una previsione;
7. ottimizzazione dei parametri di apprendimento (in particolare: tasso di apprendimento e momento), tenendo sempre sotto controllo la progressiva discesa dell'errore nel momento dell'apprendimento ed utilizzando questo per ottimizzare i vari parametri (che sono: tasso di apprendimento, pesi sinaptici iniziali, modalità di presentazione dei dati alla rete - sequenziale o random, ecc. ecc.);
8. variazione del numero dei neuroni nascosti, dapprima aumentandolo, e rifacendo una serie di prove modificando i parametri come prima, quindi diminuendolo, in modo da individuare il numero di neuroni nascosti ottimale per il nostro problema;
9. effettuazione di prove utilizzando minimi e massimi diversi; in particolare se alcuni dei dati futuri (al momento purtroppo non conosciuti) fossero fuori tendenza le previsioni della rete potrebbero essere non corrette se la normalizzazione non avesse tenuto conto dei minimi e massimi possibili di questi valori fuori tendenza;
10. nuovo addestramento aumentando le epoche necessarie per l'addestramento, portandole fino a valori di 108, provando i vari algoritmi di propagazione dell'errore, individuando il migliore algoritmo di propagazione dell'errore fra quelli a disposizione con il particolare software (all'inizio può convenire utilizzare il più semplice);
A questo punto la rete si trova nella configurazione migliore per procedere alle previsioni richieste; il procedimento da seguire è sintetizzato nella figura riportata.
Con la rete neurale artificiale a termine apprendimento sarà pertanto possibile ottenere il profilo del criminale che cerchiamo immettendo i dati della scena del crimine; ovviamente il profilo sarà più o meno preciso in funzione dei neuroni di output (e quindi delle variabili) che avremo scelto.
Alcuni argomenti che, sia pure in questo ristrettissimo ambito è possibile da subito inquadrare sono i seguenti:
- per poter strutturare una rete neurale artificiale e sottoporla all'apprendimento è necessario l'utilizzazione di indicatori (riferiti alle scene dei vari crimini) che provengano dalla stessa fonte, così da assicurare la loro omogeneità riguardo alla scala di misurazione. E' dunque indispensabile avere a monte un database di dati sui crimini commessi. D'altra parte il database è necessario se si vuole lavorare seriamente con qualsiasi metodo (matematico, statistico, ecc.);
- il pregio della rete neurale artificiale è anche quello di poter effettuare simulazioni modificando i valori di input. Per fare un esempio: qualora ci si accorgesse successivamente (ai rilievi di indagine) che la scena del crimine era stata modificata e dunque che i valori rilevati non sono veritieri, si potrebbero comunque modificare successivamente questi valori per ottenere la previsione corretta;
- è possibile immettere nella rete qualsiasi tipo di informazione (esempio: numero di ferite, ferite da taglio si/no, ferite arma da fuoco si/no, violenza sessuale si/no, ecc.). Il pregio di utilizzare una rete neurale artificiale è che i dati possono essere di forma varia e quindi sia di tipo numerico che di tipo logico (si/no). In via teorica i dati possono essere di qualsiasi tipologia (per esempio anche spaziale) in quanto per una ANN non conta la modalità di rappresentazione della conoscenza ai fini dell'elaborazione della conoscenza stessa;
- la mancanza di alcune variabili o il valore errato di alcune di esse non pregiudicherebbe il risultato essendo le ANN piuttosto tolleranti riguardo al "rumore" nei dati di ingresso.
Va infine accennato al fatto che potremmo utilizzare una rete SOM (self-organizing map) per un sistema di criminal profiling deduttivo; le reti SOM infatti riescono a classificare autonomamente pattern di dati e sarebbe quindi possibile far individuare ad una rete neurale artificiale i collegamenti esistenti (e non visibili immediatamente all'investigatore) fra grandi quantità di dati.
Un esempio di architettura di rete SOM è riportato in figura[15].

con l'individuazione del neurone vincente nella figura seguente.

La rete SOM opportunamente realizzata potrebbe allora riuscire ad individuare autonomamente collegamenti fra elementi di indagine (da una parte le qualità personali, dall'altra le caratteristiche degli eventi), collegamenti ai quali gli investigatori non pensano neanche lontanamente; questo potrebbe essere particolarmente interessante nel caso del terrorismo, specialmente utilizzando grandi database che lavorano su dati a livello di intera popolazione.
In pratica la rete SOM potrebbe descriverci la probabilità che un determinato profilo di persona (non individuabile con i metodi tradizionali) possa far parte di un gruppo terroristico o stia per attuare un atto terroristico, utilizzando un database di dati psicologici, culturali, della personalità, sociologici della società di provenienza, sociologici della società in cui la persona si è inserita, di grandi gruppi di persone.
Si aggiunga che la creazione di una rete neurale artificiale mista (chiamate da alcuni autori "nested artificial neural networks[16]" o da altri hybrid artificial neural networks), e dunque una rete MLP che utilizza in input, anziché i dati "grezzi" del database, i risultati ottenuti da più reti SOM che accettano i dati in entrata, potrebbe risultare un potente strumento, in particolare nel campo del terrorismo che risulta particolarmente difficoltoso all'approccio con le usuali tecniche di criminal profiling.
Certamente tutto questo porterebbe a problemi legali (è lecito procedere ad una "mappatura" indiscriminata di molti soggetti, mappatura condotta magari su base religiosa, oppure su base etnica?), filosofici (è giusto che la società proceda ad un così stretto controllo sui propri cittadini?) e politici (le informazioni raccolte mettono in grado la pubblica autorità di operare discriminazioni, sia pure non volute) di difficile soluzione.
[1] Bumgarner, J., Profiling and Criminal Justice in America. Santa Barbara, CA, 2004
[2] Copson, G., Coals to Newcastle: Part 1. A study of offender profiling., Home Office, Police Research Group London,1995
[3] Quali per esempio Fredrickson e Siljander in Fredrickson, D.D. & Siljander, R.P. Racial profiling: Eliminating the confusion between racial and criminal profiling and clarifying what constitutes unfair discrimination and persecution. Charles C. Thomas Publisher, Ltd., Springfield 2002
[4] Fredrickson, D.D. & Siljander, R.P., op. cit.
[5] Douglas, J. E., & Munn, C., Violent crime scene analysis: Modus operandi, signature, and staging. FBI Law Enforcement Bulletin 1992, 62, 1-20.
[6] Müller B., Reinhardt J., Neural Networks: An Introduction, Springer-Verlag, Berlin 1990.
[7] Gupta D., An Early Warning About Forecasts: Oracle to Academics, in Schmeidl S. and Adelman H., Synergy in Early Warning Conference Proceedings, Toronto, Canada, 1997 March 15-18.
[8] La funzione può essere di vario tipo; la più utilizzata è la funzione sigmoide.
[8 bis] P. Peretto, An Introduction to the Modeling of Neural Networks, Aléa Saclay Cambridge University Press, Cambridge 1992
[9] In via teorica dovremmo, in base al problema da studiare, scegliere il tipo di rete neurale da utilizzare; nella realtà quasi tutti i ricercatori si riducono ad utilizzare un particolare tipo di rete in considerazione della disponibilità dello stesso sul mercato del software.
[10] Nel caso della rete MLP: numero neuroni, architettura, pesi sinaptici iniziali, tasso di apprendimento, funzioni di output utilizzate, ecc.).
[11] RBF sta per radial basis function, in quanto questa rete utilizza una funzione a base radiale per calcolare il segnale di uscita dei neuroni.
[12] "Rumore" in questo senso si ha quando le misurazioni dei valori di una variabile sono disturbate da un'altra variabile, peraltro non influente sul fenomeno.
[13] Cfr. Bedessi S., L'utilizzazione di una rete neurale artificiale per la previsione delle presenze turistiche, in "Azienda pubblica", I, 2007, Maggioli Editore, Santarcangelo di Romagna 2007
[14] Per "epoca" si intende la presentazione di una intera serie di valori di input corredati dei relativi output.
[15] Fonte dell'immagine: Institut für Neuroinformatik (INI) - Ruhr-Universität Bochum (Germania)
[16] Baram Y., Nested Neural Networks, NASA Technical Memorandum 101032, 1988
|