|
OCRDID
La punta di diamante dei pacchetti software realizzati da Digital Idea S.r.l. è quello denominato OCRDID.
Acquisire dati da fonti diverse, eterogenee e spesso esterne al sistema informativo, per procedere al trattamento degli stessi e all’elaborazione delle informazioni che dai dati sono derivate, è un'esigenza divenuta comune in molti ambienti che sono sollecitati ad operare con rapidità ed attenzione alle esigenze del mercato o delle specifiche utenze.
OCRDID è una famiglia di prodotti software che consente di realizzare sistemi per il riconoscimento di caratteri presenti su documenti precompilati, sia in forma stampata sia manoscritta incasellata.
E' fondamentale negli uffici commerciali, che devono acquisire e processare ordini provenienti da forze di vendita distribuite su un ampio territorio e che trasmettono gli ordini compilando, in molti casi a mano, moduli prestampati.
E' importante per un buon servizio alla clientela per tutte le aziende o gli enti che offrono servizi di pagamento per conto terzi, operando su documenti cartacei compilati dai clienti stessi o da enti creditori.
E' la quotidiana attività, di quegli enti che provvedono ad esaminare, ed elaborare i dati contenuti in questionari compilati, per ricerche di mercato o per sondaggi con le più varie finalità.
E' propedeutica alla realizzazione di un qualunque sistema d’archiviazione ottica e d’indicizzazione di documenti.
Ad un’esigenza operativa così diffusa - e sempre più importante per avere informazioni accurate e tempestive o per fornire servizi efficienti - finora si è tentato di rispondere con un'attività d’inserimento di dati nel sistema informativo che ha richiesto sforzi ed impegno di risorse e di tempo non indifferenti.
Impegno che non ha però garantito precisione nella corrispondenza fra i dati sui supporti cartacei e gli stessi introdotti nel sistema informativo, né tempestività nella disponibilità dei dati alle applicazioni informatiche di trattamento ed elaborazione delle relative informazioni.
La soluzione, è un sistema di riconoscimento caratteri facilmente utilizzabile dagli operatori, integrabile senza difficoltà all'interno delle procedure applicative informatiche e competitivo nell'investimento.
Oggi la soluzione si chiama OCRDID
Alla base di OCRDID c'è la teoria delle reti neuronali.
Utilizzando i concetti di questa teoria, sono stati sviluppati gli algoritmi che consentono l'identificazione di caratteri con l'esame comparativo e iterativo di più parametri concorrenti.
OCRDID non procede ad un’interpretazione del carattere con una ricostruzione dello stesso per punti, ma, acquisitane la forma nel suo complesso, bada a scheletrizzarla e a trasformarla in un vettore con cui mirare alla zona d’iperspazio rispondente alle caratteristiche dell'immagine acquisita.
Caratteristiche generali
L'utilizzo della tecnologia delle reti neuronali rende OCRDID un prodotto all'avanguardia tecnologica e dotato di caratteristiche quali:
- velocità d’elaborazione
OCRDID ottimizza il percorso nella rete per arrivare all'identificazione del carattere, utilizzando regole di scelta di tipo Winner Takes All (WTA)
- affidabilità di riconoscimento è possibile affinare il grado d’affidabilità di riconoscimento agendo sul parametro di severità della rete, secondo le esigenze di ciascun’applicazione
- personalizzazione la possibilità di creazione ed istruzione di ciascuna rete neuronale, consente a ciascun utente di disporre di un iperspazio di caratteri congruente sia con le proprie necessità che con le tipologie di caratteri utilizzati
- espansibilità della base della conoscenza sono espandibili sia il numero di caratteri di ciascuna rete neuronale istruita, sia il numero di reti gestibile da OCRDID
- aperturai risultati del riconoscimento dei caratteri sono resi disponibili all'uso da parte d’applicativi dell'utente sotto forma d’aree di memoria
- portabilità oltre a quelle attualmente già previste, OCRDID è facilmente portabile su diverse piattaforme ed architetture di sistema
- assistenza OCRDID è l'espressione delle capacità tecnologiche di una software house in grado di fornire agli utenti una completa assistenza nella fase d’istruzione delle reti neurali, nella realizzazione di complessi sistemi applicativi di riconoscimento e nelle fasi successive all'installazione, quali training agli utenti e manutenzione
- competitività OCRDID è inseribile in qualunque realtà operativa senza sconvolgere piani d’investimento, in forma graduale secondo le reali esigenze
Caratteristiche specifiche del prodotto
OCRDID è un sistema modulare, composto da vari programmi, finalizzato all'acquisizione dati da modulistica. L'intero processo è altamente automatizzato, richiedendo l'intervento dell'utente soltanto nelle fasi di acquisizione, per il caricamento del materiale cartaceo nello scanner e in quella finale di correzione che consiste nella verifica dei risultati del riconoscimento. Tale fase è, comunque, semplificata e accelerata grazie a una preventiva valutazione dei risultati sulla base dei controlli formali indicati dall'utente. Il ciclo di lavorazione si chiude con una fase di esportazione nella quale viene prodotto un flusso di uscita in base al formato definito dall'utente.
Il sistema è altamente personalizzabile in tutte le sue fasi e consente anche il semplice data-entry da immagine con validazione dell'input basata su una serie di controlli formali. Attualmente, è già stato utilizzato con vari tipi di moduli fra cui ICI, RAV (multe), utenze, ricette mediche, autorizzazioni per la privacy, ecc....
Il flusso
Modulo di AQUISIZIONE (scanner virtuale).
Il modulo di acquisizione si occupa di inserire nel sistema le immagini già acquisite tramite scanner. In questa fase vengono immessi tutti i dati riguardanti le distinte e i dati relativi alle quadrature.
Modulo OCR.
Le immagini così ottenute vengono inviate ad un sofisticato programma di riconoscimento ottico (OCR/ICR) in grado di trattare l'immagine migliorandone la qualità, eliminare la fincatura e analizzare il contenuto dei campi da riconoscere. Sono supportati sia caratteri stampati con qualsiasi tipo di font, sia il manoscritto in stampatello, così come i campi biffati (OMR).
Modulo di CONTESTUALIZZAZIONE.
I risultati dell'OCR vengono poi passati a un software di contestualizzazione il cui compito primario è quello di esaminare i risultati del riconoscimento rispetto ai controlli formali precedentemente definiti e quando possibile, risolvere eventuali ambiguità fornendo infine una valutazione tale da semplificare e accelerare la successiva fase di controllo.
Modulo di CORREZIONE.
Nella fase di correzione vengono presentati all'utente i risultati del riconoscimento suddivisi in:
- errati rispetto ai controlli formali
- dubbi
- corretti in base ai controlli formali
La fase di correzione è altamente customizzabile: la verifica può essere compiuta sia in ordine di documento che in ordine di campo o secondo una sequenza predefinita, in una o più tornate. Le reazioni all'input dell'utente possono essere personalizzate, sia in caso di errore (es.: mostra una lista dei valori possibili) che di input parziale (funzioni di completamento automatico, dove possibile). Sono inoltre disponibili tasti di controllo a cui è possibile associare funzioni personalizzate. In questa fase, inoltre, si può effettuare un controllo di quadratura sul totale di uno o più campi.
Modulo di MONITOR.
La lavorazione termina con le fasi di esportazione in cui viene generato il flusso di uscita.
Nel corso dell'intera lavorazione l'amministratore può controllare tutti i processi grazie a un programma di monitor che permette anche di intervenire sia sui vari passi della lavorazione stessa (es.: avvio/blocco di singole mazzette, cambiamenti di priorità e stati di lavorazione) che sul singolo documento. Il monitor fornisce anche valutazioni statistiche dell'andamento del lavoro e permette di calcolare totali in run-time. Estesi file di log vengono generati in ogni fase.
Caratteristiche specifiche del riconoscimento:
- indipendenza dalla dimensione dei caratteri OCRDID effettua il riconoscimento in modo indipendente dalla dimensione dei caratteri acquisiti
- indipendenza dalla densità OCRDID effettua il riconoscimento in modo indipendente dalla densità dell'immagine acquisita
- gestione del disallineamento
OCRDID effettua il riconoscimento in modo insensibile al disallineamento verticale dei caratteri acquisiti
- gestione dei caratteri interrotti OCRDID dispone d’algoritmi che consentono di effettuare l’interpretazione dei caratteri interrotti
- gestione di celle logiche OCRDID dispone d’algoritmi che consentono di effettuare il riconoscimento dei caratteri manoscritti incasellati con gestione della cella logica.
|