sistemas de captura de contenido?
Word Count:
561
Resumen:
Junto con el contenido almacenamiento, conservación, y la entrega, la captura es uno de los componentes clave de Enterprise Content Management. Este artículo explorará el contenido de maneras es capturado en los sistemas de ECM.
Palabras clave:
Document Management, Document Management Software, Gestión de Documentos, Libro de captura, automatizada del flujo de trabajo, políticas de retención de versiones de documentos, Content Central, basada en el navegador, basada en la Web
Cuerpo del artículo:
Junto con el contenido almacenamiento, conservación, y la entrega, la captura es uno de los componentes clave de Enterprise Content Management. Este artículo explorará el contenido de maneras es capturado en los sistemas de ECM.
Captura normalmente consiste en la adquisición de datos en bruto y luego de transformación que de alguna manera.
Captura de Datos
Los datos pueden ser capturados manualmente por los sistemas de ECM de:
Los documentos en papel que puede ser escaneada por sus imágenes, o para obtener más información esencial en el contenido del documento que se transcribe en un formulario electrónico de datos de entrada de
Documentos de oficina, tales como correspondencia, hojas de cálculo, presentaciones, etc creado originalmente en formato electrónico
E-mails enviados o recibidos
Objetos multimedia como contenido de audio o de vídeo, animación, interactividad y
Microfilm
Los datos también pueden ser dispuestos para ser capturados automáticamente a partir de documentos EDI o XML, aplicaciones de ERP, y otra línea de aplicaciones de negocio como la contabilidad o CAD. Interfaces automatizadas que se puede construir con estas fuentes.
Primera transformación
Texto de documentos escaneados y faxes digitales no son legibles. Para convertirlos en caracteres legibles por máquina, diferentes tecnologías de reconocimiento de caracteres se utilizan. En la actualidad, estos incluyen:
Reconocimiento óptico de caracteres - OCR - utilizado para convertir las imágenes del documento escrito en documentos de texto con caracteres legibles y editables
Reconocimiento de caracteres escritos a mano - ACNUR - se utiliza para convertir escritura a mano o letras en caracteres de texto. La tecnología aún no ha sido perfeccionado
Optical Mark Recognition - OMR - utilizar para leer las marcas en las casillas y otros pre-definidos los campos de formularios, etc
De códigos de barras estandarizados, permitiendo la extracción de información mediante lectores de códigos de barras
Ambos OCR y HCR han sido continuamente mejorado usando características de inteligencia artificial como la comparación, la lógica, y listas de referencias.
Documento de técnicas de imagen para mejorar la calidad de las imágenes digitalizadas mediante la mejora de la legibilidad y la adaptación de las imágenes que han sido capturados en un ángulo incómodo.
ECM puede entender los datos capturados a través de formas externas, si el sistema de captura conoce la estructura y la lógica de las formas.
Agregación e indexación
Los sistemas de gestión de contenidos empresariales capturar el contenido en varios formatos de numerosas fuentes. El contenido se agregan a continuación, e indexados de manera que pueda ser recuperado de manera significativa.
La lógica de la indexación de la ECM es en sí mismo, y no depende de ninguna lógica de la indexación de las fuentes originales, si el contenido se habían registrado allí.
El sistema Enterprise Content Management tiene que desarrollar una estructura propia que permita acomodar las diversas categorías de contenidos que alberga.
El contenido capturado es la entrada a las etapas posteriores
El contenido capturado de diversas fuentes por el sistema Enterprise Content Management es "administrado" de manera que pueda ser procesado y utilizado, o archivados.
Artículos separados identificará los componentes de la gestión de bases de datos, que autoriza el acceso, y el desarrollo de las fases de almacenamiento, conservación y entrega.
Conclusión
Capturar el contenido es el primer paso en el Enterprise Content Management. Teniendo en cuenta la variada naturaleza de los contenidos a ser capturados, ECM se ha de utilizar las tecnologías variadas para hacerlo. La digitalización de documentos de papel, la creación de interfaces para la captura de documentos electrónicos desde otras aplicaciones, la conversión de imágenes de documentos en documentos de texto machine-readable/editable, utilizando tecnologías de imagen para mejorar la calidad de las imágenes capturadas, etc, son ejemplos de las tecnologías disponibles.
El contenido capturado se destina a un repositorio común donde está indexado en categorías significativas. El contenido se pasa a las fases posteriores de la gestión, almacenamiento, conservación y entrega.