Skip to content

Good Archive Solution

Per la digitalizzazione dei tuoi documenti

Ideato da GoodCode, Archive-Go, è la soluzione affidabile e accessibile per la digitalizzazione di archivi storici e documenti editoriali complessi.

ArchiveGO software editoria digitalizzazione corriere ticino

Archive-Go

GoodCode conosce bene le sfide che si celano dietro la digitalizzazione di documenti editoriali complessi, ed ha ideato una soluzione in grado di superare i limiti dei sistemi OCR esistenti attraverso lo sviluppo di un algoritmo geometrico in grado di rilevare con accuratezza la struttura degli articoli.

Con archive-go è possibile estrarre automaticamente articoli di giornale dalle immagini (.pdf o .jpeg), garantendone l'indicizzazione e il recupero delle informazioni a livello di articolo.

Caratteristiche principali

  • Implementazione della tecnologia OCR
  • Segmentazione degli articoli
  • Ricomposizione testuale degli articoli
  • Ordine di lettura corretto (da una colonna all’altra, fronte retro e testi interrotti)
  • Rilevamento di tabelle, titoli, sottotitoli e pubblicità
  • Rilevamento interruzioni
  • Riconoscimento di caratteri speciali e caption
Le prime orme sulla luna corriere del ticino digitalizzazione contenuti editoriali Goodcode-1
Metodo

Riconoscimento ottico dei caratteri
all'interno della pagina

La tecnologia OCR per quanto sia largamente utilizzata per estrarre testo da immagini non garantisce sempre risultati accurati. Sono comuni le situazioni in cui parti di testo non vengono totalmente integrate, i font riconosciuti, i caratteri speciali distinti e spesso non vengono letti i testi all'interno di immagini.
Attraverso l'algoritmo ideato da GoodCode per affinare il processo di ricostruzione e ricombinazione del testo, questo problema viene superato, consentendo la ricostruzione accurata della pagina.

Segmentazione e correzione
dell'ordine di lettura

Gli articoli di giornale possono dimostrarsi realmente complesse e difficili da analizzare. In una pagina compaiono più articoli e descrizioni, didascalie, citazioni e perfino pubblicità.
Con l'API di Archive-Go è possibile stabilire il corretto ordine di lettura anche su layout complessi, in quanto è in grado di distinguere le sezioni logiche presenti nell'articolo con estrema precisione.

Il flusso di lavoro di digitalizzazione

goodcode archive off icon Documenti di origine
Il tuo materiale può essere fornito in formato .pdf o .jpeg. Non ci sono limiti di volumi.  
goodcode amazon textract Amazon Textract
Archive-Go utilizza come primo step la tecnologia ML di Amazon Textract per la lettura ed elebaorazione dei documenti, estraendo accuratamente i testi, scrittura a mano, tabelle e altri dati.  
Goodcode algoritmo Algoritmo Archive-Go
Il punto di forza che rende unico il progetto Archive-Go. Un algoritmo che supera i limiti legati alla tecnologia OCR esistente, garantendo l’ordine di lettura corretto di pagine molto strutturate e complesse.  
Goodcode API API
Abbiamo progettato l'API per essere semplice e flessibile: il sistema restituisce il contenuto strutturato della pagina del giornale in formato .json.  

Vuoi digitalizzare il tuo archivio?

Benefici

Velocità di digitalizzazione

Archive-Go è la soluzione ideale per digitalizzare grandi volumi dai layout complessi in tempi brevi.
Il tempo medio impiegato per la digitalizzazione di una pagina di giornale è di 19 secondi.

Flessibilità e soluzioni custom

Le nostre soluzioni sono flessibili e customizzabili in base alle diverse necessità. Archive-Go è un servizio adattabile a tutti quei settori operativi in cui è richiesta la digitalizzazione di grandi volumi e di documenti dal layout complesso come testate giornalistiche, ordini di trasporto e archivi storici.

Expertise

Archive-Go è un servizio affidabile e testato. Grandi gruppi editoriali si sono affidati a noi per digitalizzare anni della loro storia editoriale. Con questo servizio sono stati digitalizzati 750.000 pagine di giornale, a partire da edizioni storiche del 1900.

Indicizzazione delle pagine

Poter reperire in maniera efficace e veloce qualsiasi documento all'interno del proprio archivio digitale è il grande valore aggiunto che Archive-Go offre oggi alle aziende che devono gestire grandi volumi documentali.

Archive-Go, estraendo la struttura logica della pagina e con essa tutti i metadati, è in grado di identificare i diversi articoli che compaiono sulla medesima (anche di argomenti diversi), recuperare le informazioni e creare un motore di ricerca dei file molto efficiente.

L'indicizzazione degli articoli è possibile quindi sia a livello di ricerca di parole all'interno dell'articolo che di edizione. Sarà quindi possibile ricercare l'articolo per edizione, autore o titolo.

Diversi algoritmi vengono applicati per poter sempre rilevare varianti della parola specifica per una data lingua.

Dicono di noi

Googcode top reviews

 

CdT

"Goodcode gave us a turnkey deliverable without hassles nor delays."

Alessandro Colombi
Gruppo Corriere del Ticino SA, CEO

Richiedi una consulenza

Raccontaci il tuo progetto

Le nostre soluzioni sono personalizzabili e adattabili alle tue esigenze. 
Troveremo insieme la soluzione fatta su misura alle tue richieste.

GoodCode logo horizontal white
Goodcode Swiss made softwares