Requisitos para la información documentada

En áreas de investigación, existe una necesidad muy importante de registrar la información por varios motivos. Puede simplemente existir la necesidad de volver a ejecutar algoritmos para asegurar que se produzcan los mismos grupos de resultados como un ejercicio de “tranquilidad”, pero muy probablemente, esto será requerido como parte de prueba y de backup científico para publicar una investigación. Pueden también existir razones estatutarias para esta información documentada: en la industria aeroespacial, en el caso de una investigación de accidente aéreo, los ingenieros que toman decisiones determinadas de ingeniería pueden ser responsables de la causa del accidente y estar sometidos a procesos penales. 
Por lo tanto, la necesidad de recrear estados específicos y grupos de resultados según sea necesario y de seguir los pasos de decisión hacia estas elecciones es de extrema importancia. La complejidad de estas tareas es aún mayor cuando uno considera que el ciclo de vida del diseño de un avión podría ser de 50 años. Volúmenes significativos de datos y movimiento de datos Deep Thought desempeñó una de las tareas más grandes de HPC en los últimos tiempos (de ficción). Dada una pregunta simple (“¿Cuál es la respuesta a la vida, el universo y todo lo demás?”), arrojó una respuesta simple (“42”), aunque, después de varios millones de años de procesamiento y una pequeña pausa desconcertadora al final del proceso.
Sin embargo, la realidad es que es muy probable que los cálculos significativos que requieren una gran cantidad de procesamiento impliquen importantes cantidades de datos a lo largo de todo el ciclo de vida del cálculo. Aún, con la simplicidad del ingreso de datos y el resultado del estilo de Deep Thought, los grupos de datos operativos dentro del espacio de problema durante el cálculo, pueden ser significativos. Se deben desarrollar estrategias para administrar estos datos y sus metadatos. Dada la necesidad de la información documentada, estas estrategias deben ser flexibles y eficaces, y deben estar integradas dentro procesos de flujo de trabajo utilizados para coordinar los cálculos.

Comentarios