A los responsables de licencias y autorizaciones de SAP: ¿cómo puede estar seguro de que su informe final no se basa en datos corruptos? Tal vez tenga una herramienta de software que analiza los datos por usted, pero ¿hay algún dato que falte o que esté corrupto en origen? ¿Cómo lo sabe?
Juan Pérez solicita su aprobación para ver las facturas
Recientemente, algunos de nuestros clientes reconocieron que no les bastaba con tener una herramienta superior para la supervisión de licencias o autorizaciones de usuarios. Como dice la frase, el diablo está en los detalles; descubrieron que algunos de sus detalles eran inexactos o incompletos. Esto no es un secreto, por supuesto; si han estado en el negocio de la informática por un tiempo lo habrán oído alguna que otra vez, pero es un concepto extremadamente crítico cuando se trata de combinar los datos de los usuarios a lo largo de diferentes sistemas o de otorgar autorizaciones a usuarios.
Imagínese tratando de combinar 10.000 datos de usuario entre diferentes aplicaciones sin tener la dirección de correo electrónico completa de cada una. «Juan Pérez» y «Zhang Wei» probablemente darán lugar a múltiples combinaciones, pero ¿y si son realmente una sola persona y deban unirse en un solo empleado? Nunca lo sabrá si no tiene una dirección de correo electrónico completa y precisa.
O, por ejemplo, cuando se solicita una autorización adicional para ver los estados financieros: la cuenta de usuario es «Juanes», el nombre es «Juan» y no hay apellido ni dirección de correo electrónico. ¿Cómo puede identificarse quién es quién?
Datos faltantes. Datos incorrectos
De Google: «La limpieza de datos o depuración de datos es el proceso de detección y corrección (o eliminación) de registros corruptos o inexactos de un conjunto de registros, tabla o base de datos».
Para trabajar bien con los datos, estos deben ser precisos y completos. Tenemos cuatro consejos gracias a la experiencia adquirida con clientes que han pasado por el tedioso proceso de limpieza de datos.
- Los datos más importantes van primero: Debe identificar cuáles son los campos de datos más importantes para su proceso y comenzar por ahí. Por ejemplo, para tener un proceso de licencia satisfactorio que incluya el paso de combinar las cuentas de usuario entre diferentes aplicaciones SAP, para empezar necesita los datos de las direcciones de correo electrónico de los usuarios; después el nombre y los apellidos. Para poder identificar quién es una persona en un proceso relacionado con autorizaciones, también se necesitan datos sobre su departamento y su puesto. Primero identifique cuáles son los datos más importantes y luego concéntrese en completarlos.
- Comparta la tarea, pero esté preparado para asumir el control: Probablemente, necesitará que otras personas le ayuden a completar los datos que faltan, especialmente si necesita datos sobre las ubicaciones externas. Tómese el tiempo necesario para identificar quiénes son los que pueden ayudarle, pero sepa que algunos no se pondrán a ello cuando usted lo necesite; en ese caso, tendrá que hacer el trabajo usted mismo. Por ejemplo, si necesita completar la información de la dirección de correo electrónico, puede pedir a los directores de departamento los datos de sus empleados, pero seguramente le pasarán la tarea a otra persona, que quizá o bien no entienda la tarea o esté demasiado ocupada para si acaso responder. De todos modos, es su responsabilidad, así que no queda otra que hacerse cargo y remangarse. No olvide que la limpieza de datos es solo un paso más de los muchos hacia una sólida licencia SAP o un proceso de autorización eficiente.
- No se trata de todo o nada; un 90 % es mucho mejor que un 50 %: Eliminar datos sucios es un desafío continuo que probablemente no terminará cuando lo haga su proyecto. Si acepta esto, será más fácil evitar la frustración cuando descubra que hay más datos que limpiar, como en el mito de Sísifo. Haga un esfuerzo para limpiar la máxima cantidad de datos posible, pero no se olvide de establecer límites de tiempo y cuál el objetivo final; es mucho más importante cumplir en plazo el objetivo (mejor licenciamiento, implementación del flujo de trabajo) que conseguir unos datos impecables. Después de un primer proyecto exitoso, siempre se puede planear un segundo.
- Las herramientas son estupendas, pero no siempre son imprescindibles: si su organización no es tan grande, o la cantidad de datos no es elevada, puede tratar de confiar en el ojo humano para detectar datos perdidos y corruptos. Una persona puede revisar fácilmente 1000 registros de datos, e incluso revisar 10.000 elementos de datos no es descabellado. Por supuesto, hay excelentes herramientas que pueden detectar datos corruptos mediante conjuntos de reglas de datos y rastreo de duplicados. Sin embargo, puede descubrir que su organización no quiere gastar dinero en ellos. En este caso, una buena práctica es reducir los objetos de datos más importantes y hacer el trabajo manualmente. Se sorprenderá de la capacidad del ojo humano.