El proceso informático se divide en
cuatro pasos fundamentales para un usuario típico que aseguran la
finalización de la tarea: acceso, solicitud, proceso y análisis. (Ver
Figura 2)
Acceso:
• Inicio de sesión: El usuario debe poder iniciar la sesión de la
solución y deberá identificarse como usuario válido. Es posible que
entonces puedan ver sólo la información relevante a su función y/o
grupo.
• Inicialización: Antes de realizar una solicitud del trabajo, puede
existir la necesidad de configurar un panel de control para ejecutar
la tarea. Dada la naturaleza de la informática de larga ejecución,
una ejecución del proceso puede considerarse un “proyecto”.
Solicitud:
• Carga: Un usuario debe poder cargar o acceder a grupos de datos
que están previstos para ser utilizados como parte de un trabajo.
Los grupos de datos pueden ser grandes, no homogéneos o de
origen externo, por lo tanto, se necesita un paso específico en el
flujo de trabajo para obtener estos datos y dividirlos entre el nodo
del clúster de manera que equilibre la cantidad prevista de trabajo.
• Inserción de datos: un usuario debe poder añadir parámetros y
metadatos asociados para garantizar que el trabajo se ejecute
exitosamente. Estos parámetros se capturan para reutilización y
auditoría.
• Aprobación: después de añadir parámetros y cualquier otra
información requerida, es probable que se pida aprobación antes
de presentar el trabajo. Entonces, probablemente se producirá
algún tipo de flujo de trabajo de aprobación, seguido de una
presentación del trabajo del usuario.
Proceso
• Preproceso: El paso de preproceso para un trabajo puede realizar
diversas cosas. Probablemente traslade los grupos de datos a los
nodos del clúster y tal vez realice un grupo de procesamientos
iniciales, como la generación de medidas analíticas para ser
utilizadas en el procesamiento principal. También puede inicializar
estructuras de datos y evaluar todos los datos para su validación
antes de ejecutarlos.
• Proceso: Esta fase representa el procesamiento paralelo en sí.
Cada nodo ejecutará una porción y puede ser necesario pasar
resultados intermedios a otros nodos para que se complete el
proceso total (trabajo de paso de mensajes). Otra opción es que
los datos pueden ser propicios para ser computados dentro de
porciones totalmente aisladas, como situaciones “que pasaría si” o
un análisis paramétrico. Esta fase puede ocurrir durante un tiempo
potencialmente significativo. Lo ideal sería que se proporcione
algún comentario al usuario final durante este tiempo.
• Post-proceso: El paso final en el procesamiento en sí es similar al del
preprocesamiento en el sentido de que es posible que se complete
algún trabajo con los datos obtenidos. Esto puede comprender
movimientos de datos hacia almacenes, agregación de datos de
nodos separados, operaciones de depurado, tareas de visualización,
etc.
Análisis:
• Automático: Si bien es probable que los resultados de la tarea
necesiten intervención especializada para comprenderlos
verdaderamente, es posible realizar un análisis automático, en
particular, en el caso de un análisis estadístico en el que los patrones
son importantes y fáciles de automatizar.
• Con conexión: El usuario debe poder realizar un análisis básico sin
tener que solicitar todo el grupo de datos. Esto puede presentarse
como herramientas con paradigmas de inteligencia comercial –
segmentación y separación, etc.
• Descarga: Por último, el usuario debe poder recuperar los grupos de
resultados para la manipulación avanzada sin conexión, según sea
necesario.
No hay comentarios:
Publicar un comentario