Estudo sobre o Impacto de Diferentes Arquiteturas Paralelas na Dinâmica de Fluidos

July 4, 2017 | Autor: Matheus Serpa | Categoria: Computer Science, Parallel Computing, High Performance Computing
Share Embed


Descrição do Produto

Estudo sobre o Impacto de Diferentes Arquiteturas Paralelas na Dinâmica de Fluidos Matheus da Silva Serpa, Claudio Schepke Através do estudo das propriedades dos líquidos e gases é possível determinar diferentes tipos de fenômenos físicos, tais como: simulação de furacões, previsão de tempo, aerodinâmica e gerenciamento térmico. A evolução dos sistemas computacionais tornou possível resolver estes problemas de forma eficiente através de novas técnicas de simulação. Com isso, alguns métodos e algoritmos foram desenvolvidos para simulações numéricas. Normalmente, o domínio de um problema da dinâmica de fluidos é discretizado, gerando um conjunto de equações lineares que é resolvido através de métodos numéricos. Devido a isso, sistemas multi-core e many-core foram avaliados, para indicar a melhor abordagem para aplicações da dinâmica de fluidos, como o Método de Lattice Boltzmann. O método de Lattice Boltzmann é considerado uma representação discreta da Equação de Boltzmann, sendo esta, a base da teoria cinética dos gases. Nesse método, o comportamento das partículas é representado por uma malha, ou seja, um conjunto de células ou pontos. Os problemas que podem ser modelados pelo método são relevantes, e as simulações podem exigir altos custos computacionais. Devido a isto, é importante definir e analisar arquiteturas apropriadas para melhorar o desempenho do método. A fim de compreender o desempenho paralelo, foram feitas execuções utilizando o processador Intel Xeon E5, o novo coprocessador Intel Xeon Phi e a unidade de processamento gráfico Tesla C2075. As implementações foram feitas de acordo com a interface de programação disponível para a arquitetura. No Xeon E5 e Xeon Phi foi utilizada a interface OpenMP, e na Tesla o modelo de programação CUDA. Os resultados computacionais foram obtidos a partir da média de 20 execuções, onde o desvio padrão foi menor que 1s. O coprocessador teve os piores resultados para todos os casos. Esse resultado se deve ao fato de o coprocessador ser indicado para aplicações que tirem proveito de operações vetoriais, o que não é o caso da nossa implementação do Método de atice Boltzmann. Em nossos experimentos o Xeon Phi teve eficiência de 6,01% enquanto a Tesla teve 9,86 o que representa que a Tesla foi 39,08% melhor que o coprocessador. Em relação ao tempo de execução, para uma malha de 1824 x 1824 pontos, o tempo sequencial é de 3570s. Nas arquiteturas paralelas o tempo de execução foi até 43 vezes menor. No Intel Xeon E5, Intel Xeon Phi e Tesla C2075 o tempo de execução foi de 228s, 260s, 82s, respectivamente, o equivalente a uma redução de 15.66, 13.70 e 43.40 vezes em relação ao tempo sequencial. Os resultados nas três arquiteturas mostraram que o coprocessador Xeon Phi não tem melhor desempenho que outras arquiteturas em aplicações da dinâmica de fluidos computacional. Trabalhos futuros incluem estudos de técnicas de otimização para unidades de processamento gráfico, como a Tesla C2075. Este trabalho foi desenvolvido recebendo fomento da PROBIC-FAPERGS / UNIPAMPA. Gostaríamos de agradecer ao Intel Manycore Testing Lab que nos permitiu utilizar os seus sistemas de computação. Palavras-chave: Arquiteturas Paralelas, Intel Xeon Phi, GPUs, Método de Lattice Boltzmann.

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.