En áreas de investigación, existe una necesidad muy importante de
registrar la información por varios motivos. Puede simplemente
existir la necesidad de volver a ejecutar algoritmos para asegurar
que se produzcan los mismos grupos de resultados como un ejercicio
de “tranquilidad”, pero muy probablemente, esto será requerido
como parte de prueba y de backup científico para publicar una
investigación. Pueden también existir razones estatutarias para esta
información documentada: en la industria aeroespacial, en el caso de
una investigación de accidente aéreo, los ingenieros que toman
decisiones determinadas de ingeniería pueden ser responsables de la
causa del accidente y estar sometidos a procesos penales.
Por lo
tanto, la necesidad de recrear estados específicos y grupos de
resultados según sea necesario y de seguir los pasos de decisión
hacia estas elecciones es de extrema importancia. La complejidad de
estas tareas es aún mayor cuando uno considera que el ciclo de vida
del diseño de un avión podría ser de 50 años.
Volúmenes significativos de datos y movimiento de datos
Deep Thought desempeñó una de las tareas más grandes de HPC en los últimos tiempos (de ficción). Dada una pregunta simple (“¿Cuál es
la respuesta a la vida, el universo y todo lo demás?”), arrojó una
respuesta simple (“42”), aunque, después de varios millones de años
de procesamiento y una pequeña pausa desconcertadora al final del
proceso.
Sin embargo, la realidad es que es muy probable que los cálculos
significativos que requieren una gran cantidad de procesamiento
impliquen importantes cantidades de datos a lo largo de todo el ciclo
de vida del cálculo. Aún, con la simplicidad del ingreso de datos y el
resultado del estilo de Deep Thought, los grupos de datos operativos
dentro del espacio de problema durante el cálculo, pueden ser
significativos. Se deben desarrollar estrategias para administrar estos
datos y sus metadatos. Dada la necesidad de la información
documentada, estas estrategias deben ser flexibles y eficaces, y
deben estar integradas dentro procesos de flujo de trabajo utilizados
para coordinar los cálculos.
No hay comentarios:
Publicar un comentario