Académique Documents
Professionnel Documents
Culture Documents
Computación Científica
http://www.wtec.org/sbes/
Computación Científica
Algoritmos/Aplicaciones
Datos
Infraestructura de cómputo
Predicción climática
Docking de proteínas
Simulación Montecarlo
Aplicaciones
Coarse computation for fine grained parallelism Generate
configurations
Barridos de parámetros
(ejemplo Stellerator TJ-II en la Grid)
Evaluate
configurations
Paralelización de algoritmos
• Naturaleza de los algoritmos
Paralelización de algoritmos
Ejemplos de algoritmos
Procesamiento de imágenes operaciones en regiones (i.e. contraste)
Ejemplos de algoritmos
Particionamiento no trivial por algoritmo
(otra estrategia por datos para muchas imágenes, pero cada una
tiene que caber en memoria)
Ejemplos de algoritmos
Particionamiento no trivial
Paralelización de KMeans
…
Universidad Nacional, Bogotá, Enero 2013 12
Computación científica
Map-reduce, Hadoop
Map-reduce, Hadoop
Escalabilidad
• Ley de Amdahl
N: Núm. nodos paralelos P: Proporción paralelizable del código S(N): speedup máximo
Infraestructuras de computación
• Clusters
• Supercomputadores
• Clouds
• Grids
• GPUs
• Computación oportunista
Clusters
• Planificación de tareas Batch jobs
• Sistema compartido de archivos
• Fast inter-networking for inter-process communication
Shared storage
Supercomputadores
• Planificación de tareas Batch jobs
• Memoria compartida
• Procesos multi-nodo
Grids
• Redes de datacenters
• Particiones de procesos independientes
• Heterogéneos
• Federación vs distribución
• Middleware propio
Clouds
• Desacoplamiento infraestructura física
• Modelo de cómputo no fijo: IaaS, PaaS, SaaS
Computación oportunista
• Sobre recursos no propios
• Computación voluntaria, labs de escuelas, etc.
GPUs
• Computación matricial
• Procesadores simples y masivos
Datos científicos
• Colecciones de datos
• Adquisición de datos
Datos científicos
• Orígenes
• Distribución
• Estándares y formatos
• Propiedad y responsabilidades
Datos científicos
• Orígenes
• Distribución
• Estándares y formatos
• Propiedad y responsabilidades
Big Data
• manejo de datasets de tamaño >> capacidad de las
herramientas tradicionales de bases de datos
• según la tecnología avanza con el tiempo, el tamaño de
los conjuntos de datos a los que denomina el término
también crecerán, si cabe, a un aún ritmo mayo
Arquitectura HBase
La Gente
Científicos
Ingenieros
Programadores
Gestores de proyecto
Administrativos
Formación multidisciplinar
http://www.wtec.org/sbes/
Escenarios y Retos
Código sucio o poco
estructurado
Falta de
documentación
Arquitecturas de
software y datos
espontáneas Código mezclado
(paralelo, seq, …) Procesos de desarrollo
informal
Comunidades científicas
tradicionales
Procesos de desarrollo
informal
Decisiones
Cloud? Grid?
Modificar
algoritmos? Adaptarse al
hardware
Me dedico a
disponible?
otra cosa?
Contribuir al
software? Duplico
datasets?
Comprar Comunidad
hardware? científica? GPU?
Universidad Nacional, Bogotá, Enero 2013 34
Computación científica
Cambios generacionales
A corto plazo
Medir el alcance del sw/hw
disponible
A medio/largo plazo
Construir equipos Actualizar programas de
multidisciplinares capacitación (BSc Msc PhD)
Conclusiones
EL USO DEL CÓMPUTO CIENTÍFICO ES INEVITABLE