Indexación de Documentos

Dentro de nuestra actividad en la República de Paraguay, InDiSe está en pleno avance para la homologación del Proceso de Digitalización Certificada, mediante el cumplimiento de la Resolución 1438/2015 del Ministerio de Industria y Comercio.

Entre otros requisitos que exige la resolución, está la catalogación e indexación de los documentos escaneados que pasan a guarda digital dentro de la Gestión Documental.

Indexar un documento refiere a detectar y disponer de palabras claves, que sean capaces de localizarlo en el menor tiempo posible. Nuestro proceso ha diseñado y provee los siguientes métodos de indexación que enunciamos a continuación.

Palabras claves para todo el lote de digitalización
Esta opción está pensada para un lote de digitalización donde todos los documentos comparten atributos comunes, los que pueden ser ingresados como palabras claves y estarán disponibles para cada uno de los documentos del lote.

Análisis semántico por OCR. Autotagging
El OCR (reconocimiento óptico de caracteres) es una función avanzada que tienen los equipos scanners y el Autotagging es una técnica que permite proveer una lógica de extracción de palabras claves.

Para la extracción, InDiSe trabaja con dos criterios lógicos, el primero reconoce todas las palabras del documento y realiza un ranking de ocurrencia de las palabras relevantes y toma las diez primeras como palabras clave. Para la segunda opción, el usuario debe confeccionar un diccionario semántico, dentro del que se colocan las palabras que se buscarán en el documento.

Reconocimiento OCR para palabras claves de formularios
Esta función es una instancia más refinada y está pensada para procesar formularios definidos. El sistema trabaja en la localización de las palabras, mapeando el formulario y ubicando las palabras que fueron previamente definidas como claves.

Extracción de palabras claves por interacción con sistemas corporativos
Finalmente, esta opción se ha diseñado para almacenar palabras claves tomadas de una fuente externa. En este caso se necesita procesar un código con el que el sistema deberá interactuar contra un servicio corporativo previamente definido.

Comentarios

Entradas populares de este blog

Digitalización Certificada en Paraguay

SEMINARIO INTERNACIONAL DE FIRMA DIGITAL

Nuevo InDiSe ST 3.0 Storage Manager