La captura de información de cualquier naturaleza, imágenes, datos, códigos debe ser verificada a través de procesos automáticos y/o manuales (con intervención de un operador).
Dependiendo de la naturaleza de la información y su criticidad, se establecerán controles de calidad absolutos (sobre el 100% del dato) o relativos a través de un porcentaje de muestra adecuado.
Algunos datos son sencillos de controlar con algoritmos de validación cuando el dato responde a un modelo lógico (dni, cuentas bancarias…) o algo tan simple como rangos de datos razonables o incluso algo tan sencillo pero tan eficaz como el tamaño de ocupación de un fichero de imagen para estimar si la captura de imagen es dudosa. Si un dato nos preocupa especialmente, qué mejor método que una doble grabación por operadores distintos.
Además de las estrategias de validación de datos durante el proceso de producción se debe tener en cuenta que al principio del proyecto la vigilancia y el porcentaje de muestreo debe ser más intenso para detectar en la puesta en marcha las debilidades y corregirlas con un bajo coste evitando reprocesos masivos.
Otra tarea muy manual a tener en cuenta son los requisitos de tratamiento de los originales ya procesados (grapado, ensobrado, ordenaciones, eliminaciones selectivas…) sin olvidar como se ha comentado en la entrada relativa a preparación documental, que todas estas manipulaciones son muy costosas y hay que analizar con cuidado su necesidad, para no incurrir en costes excesivos en detrimento de otras tareas de mayor valor añadido.
Emilio Sanz, fecit.
El control de calidad en servicios de indización de datos y de digitalización de documentos es un tema peliagudo que me gustaría desarrollases más.
A veces suelo utilizar un simil que no sé si es muy afortunado, pero ahí va. Si produjésemos tornillos o clavos o … desde el diseño se estarían definiendo criterios de calidad claros, los procesos serían controlables, las materias primas se exigirían con certificados, etc. Y además, pondríamos controles aleatorios siguiendo sistemas de verificación simple o doble, comparando la pieza obtenida con una «maestra». Incluso tendríamos sistemas de visualización que harían esta inspección automáticamente.
Pero cuando de lo que se trata es de escanear 200.000 páginas de 1.000 libros del siglo XVI, cada uno en un estado de conservación distinto, en materiales diversos … Cada página es única.
¿Cómo se define un criterio «claro» e «indiscutible» de calidad»? ¿es aceptable utilizar técnicas de muestro en este tipo de trabajos? ¿se puede exigir el CERO defectos? y si la respuesta es que no ¿qué % te parece aceptable?
Bueno, como ves más preguntas que respuestas.
Un saludo.
Buenos días Eneko y gracias por tu participación.
Por comenzar de una forma un poco desenfadada, cosas indiscutibles hay pocas para mi, los impuestos, morirse y alguna que otra satisfacción.
Tu comentario es muy interesante y apetecible para la reflexión. Lo que planteas sin duda no es fácil de definir y desde mi punto de vista (entiéndase como un opinión más) no existe “respuesta indiscutible”. Efectivamente cada página es única, como cualquier documento de archivo con valores primarios y secundarios, sea del siglo XVI o de un expediente administrativo relativo a una subvención de hace seis meses.
Con esto quiero decir que a priori no lo se. Creo que es interesante abordar un aspecto tan importante cómo el que planteas desde la perspectiva del propio proyecto. El hecho de que nos enfrentemos a un fondo documental histórico de enorme valor no quiere decir que el planteamiento de calidad sea sustancialmente distinto a otros, para mi deberá ser el que exige el proyecto en su contexto, así como los objetivos establecidos y la meta esperada para esta digitalización específica.
¿Existe un parámetro de calidad a aplicar de forma genérica a todos los protocolos notariales escritos en procesal con tintas ferrogálicas? Para mí, no. ¿Permanecen inalterados los criterios de calidad que se aplicaron en los años 90 en la digitalización del Archivo General de Indias en Sevilla?, probablemente no.
Cuál es entonces mi idea al respecto. Cuando se aborda un proyecto de digitalización de cualquier naturaleza, debe haber existido una reflexión previa y profunda que aconsejan esta inversión y esfuerzo. Puede ser la suma de algunos factores como la necesidad de preservación del original, difusión, investigación, eficacia y eficiencia en la gestión administrativa, seguridad física, reducción de costes, etc., así como la existencia de recursos y la voluntad de llevarlo a cabo lo que hacen que finalmente se ejecute el proyecto.
Es decir el propietario o gestor de ese fondo documental procede a su digitalización tras haber analizado previamente las prioridades del mismo y las necesidades a cubrir, por lo tanto se define un alcance de proyecto, metas y objetivos, así como inversiones y plazos, en definitiva se plantea profesionalmente un esquema de proyecto.
En esa reflexión absolutamente necesaria, la calidad debe ocupar su lugar, sino el proyecto está mal planteado y el análisis previo es deficiente. Conocidos los objetivos y las necesidades generales, las variables de calidad deberán ser definidas de forma específica y por supuesto valoradas económicamente, igual que las de preparación, modelos de digitalización, recursos de almacenamiento, perfiles profesionales y cualquier otra variable del proyecto.
¿Es más complejo un proyecto de digitalización de 1.000 libros del S XVI con un alcance de 200.000 páginas que uno de 3000 fotografías en placas de vidrio o una digitalización de 5 millones de páginas de expedientes administrativos en seis meses? No, sencillamente son distintos. Para cada proyecto se deberán proveer los medios adecuados, personales y materiales, con el grado de especialización y metodología que exija cada caso.
La fase de calidad debe existir en todos, con los parámetros que exige cada caso. Es ahí donde se definen las estrategias y ojo, los costes de calidad, directamente vinculados a los objetivos previstos.
Desde un punto de vista técnico sí entiendo que el compromiso de calidad en una documentación histórica de esa naturaleza debe ser exigente y por lo tanto debemos dotarnos de equipos humanos y medios especializados para obtener un umbral de calidad alto que debe ser correspondido con una partida económica suficiente.
La estrategia de calidad la marca por lo tanto el propio proyecto y todos los métodos que defines en tu entrada son susceptibles de ser tenidos en cuenta, si bien la calidad = a error cero, no creo que se justifique salvo casos muy específicos para alcances muy limitados debido a los costes.
Creo que existe otro aspecto a tener presente en estos comentarios aprovechando la entrada. Nunca se debería hacer una reflexión sobre el umbral de calidad de un proyecto cuando éste está en marcha, manifiesta un error de método. Si puede ocurrir que se exija un umbral de calidad mayor por algún motivo y en ese caso, debemos hacer una gestión del cambio en el proyecto para adecuarnos a los nuevos requisitos.
Eneko como ves es una reflexión, no es una respuesta.
Espero que te resulte útil y me gustaría seguir intercambiando conocimiento. Creo que desde Gupost podéis aportar mucho valor por la experiencia profesional de vuestro equipo.
Un saludo, El Escribano.