Une structure de données pour maillages cartésiens creux

application à l'adaptation dynamique de maillage par multirésolution

Loïc Gouarin

Journée de rentrée du CMAP - 2019

La multirésolution

Idée générale

s'apparente à de la compression d'image
représentation multiéchelle d'une solution
indicateurs pour mesurer la régularité
multirésolution (MR)

par valeurs moyennes
par valeurs ponctuelles

Exemple

Prenons un domaine $\Omega \in [0, 1] \times [0, 1]$.

Pour un niveau $l$ donné, une cellule $C^l_{i,j}$ est donnée par $[2^{-l}i,2^{-l}(i+1)] \times [2^{-l}j,2^{-l}(j+1)]$ pour $i, j=0, \cdots, 2^j-1$.

Exemple

On définit les détails $$ d_{i,j}^l = u_{i,j}^l - \hat{u}_{i, j}^l $$ L'ensemble des indices et des niveaux appartenant au maillage compressé $$ \Lambda_{\epsilon_l} = \left\{ (i, j, l) \; \text{tel que} \; |d_{i,j}^l| \geq \epsilon_l \right\} $$ avec $$ \epsilon_l = 2^{N_{dim}(l-l_{max})}\epsilon. $$

$l_{max}=6$, $\epsilon=10^{-2}$,
taux de compression de 80%

Exemple

Calcul de la valeur prédite $\hat{u}_{i, j}^l$

un opérateur de projection ($\mathbf{P}_{l+1\rightarrow l}$)

moyenne

un opérateur de prédiction ($\mathbf{P}_{l\rightarrow l+1}$)

opérateur local à la cellule avec un stencil

Contrainte

$$ \mathbf{P}_{l+1\rightarrow l}\circ \mathbf{P}_{l\rightarrow l+1} = \mathit{Id} $$

Simulation complète

Navier-Stokes incompressible avec transport d'un scalaire
$l_{max}=2^9$, $\epsilon=5\cdot 10^{-3}$, taux de compression autour de 90%

Les avantages

Peut réduire considérablement les temps de calcul

Contrôle fin de l'erreur

S'adapte bien aux méthodes volumes finis

Les difficultés

Le maillage change tout le temps.
(insertion et suppression de cellules)

Une recherche fréquente des parents et des générations précédentes

Le parcours en profondeur peut être important

La structure de données

Crée le lien entre la méthode numérique,
l'algorithme et la machine

Les enjeux

Essayer de réconcilier les accès mémoire et la phase de calcul

Exploiter les architectures cibles au maximum

Faciliter l'abstraction

Structure de données naïve

Courbe de Lebesgue

Les intervalles

Première construction


                                level: 0
                                    y: 0
                                        x: [0, 4[
                                    y: 1
                                        x: [0, 1[, [3, 4[
                                    y: 2
                                        x: [0, 1[, [3, 4[
                                    y: 3
                                        x: [0, 4[

                                level: 1
                                    y: 2
                                        x: [2, 6[
                                    y: 3
                                        x: [2, 6[
                                    y: 4
                                        x: [2, 6[
                                    y: 5
                                        x: [2, 6[

Passage à un stockage compressé


                                    level: 0
                                        x: [0, 4[  , [0, 1[  , [3, 4[  ,
                                           [0, 1[  , [3, 4[  , [0, 4[
                                        y: [0, 4[  
                                        offset: [0, 1, 3, 5, 6]

                                    level: 1
                                        x: [2, 6[   , [2, 6[   , [2, 6[   ,
                                           [2, 6[   
                                        y: [2, 6[@0
                                        offset: [0, 1, 2, 3, 4]

Passage à un stockage compressé


                                        level: 0
                                            x: [0, 4[@0, [0, 1[@4, [3, 4[@2,
                                               [0, 1[@6, [3, 4[@4, [0, 4[@8
                                            y: [0, 4[@0
                                            offset: [0, 1, 3, 5, 6]

                                        level: 1
                                            x: [2, 6[@10, [2, 6[@14, [2, 6[@18,
                                               [2, 6[@22
                                            y: [2, 6[@0
                                            offset: [0, 1, 2, 3, 4]

Passage à un stockage compressé

Les cellules utiles

Les cellules utiles

cellules qui nous intéressent + cellules fictives

Les cellules utiles

cellules qui nous intéressent + projection

Les cellules utiles

Opérateurs sur des ensembles

Intersection

Union

Différence

Projection

Translation

...

Opérateurs sur des ensembles

Algorithme récursif sur les dimensions

Composable à l'infini

Toujours travailler sur des espaces comparables

Attention à l'opérateur différence en multi D

Avantages des intervalles

Information compacte du maillage

Meilleure localité dans la direction x et par niveau

Facile à découper et à paralléliser

Recherche par direction

Moins de tests conditionnels !

Analyse des gains

Test de compression réalisé par Hugo Leclerc
Code	Mémoire (MB)	Speedup
Code maison (Z-curve)	365	1
p4est	160	2.7
Intervalles	16	19.2

MuRe

écrit en C++
implémente
- les intervalles
- les operateurs sur ces espaces
flexible
interface simple
utilise xtensor et sa philosophie

Exemple d'utilisation pour la projection


                            auto expr = intersection(mesh[all_cells][level],
                                                     mesh[proj_cells][level - 1])
                                        .on(level - 1);
                            expr.apply_op(projection(field));


                            class projection_op: ...
                            {
                            public:
                                template< class T >
                                void operator()(Dim<1>, T &field) const
                                {
                                    field(level, i) =
                                        .5 * (field(level + 1, 2 * i) + field(level + 1, 2 * i + 1));
                                }
                        
                                template< class T >
                                void operator()(Dim<2>, T &field) const
                                {
                                    field(level, i, j) = .25 * (field(level + 1, 2 * i, 2 * j) +
                                                                field(level + 1, 2 * i, 2 * j + 1) +
                                                                field(level + 1, 2 * i + 1, 2 * j) +
                                                                field(level + 1, 2 * i + 1, 2 * j + 1));
                                }
                                ...
                            };

L'écriture du schéma volume fini


                            template
                            class upwind_op : ...
                            {
                            public:
                                // 1D
                                template< class T >
                                auto left_flux(Dim<1>, double a, const T &u) const
                                {
                                    return ((a < 0) ? a : 0) / dx * (u(level, i + 1) - u(level, i));
                                }
                        
                                template< class T >
                                auto right_flux(Dim<1>, double a, const T &u) const
                                {
                                    return ((a > 0) ? a : 0) / dx * (u(level, i) - u(level, i - 1));
                                }
                                ...
                            };

L'écriture du schéma volume fini


                            u = u - dt * upwind(a, u);

L'écriture du schéma volume fini


                                    u = u - dt * upwind(a, u);

La suite

Refaire les cas tests de la thèse de Marc-Arthur N'Guessan
Parallélisation et répartition de charge sur CPU et GPU
Les méthodes lattice Boltzmann et la multirésolution
(Thèse de Thomas Bellotti + projet ESA pour les écoulement hypersoniques)
Appliquer la structure de données sur d'autres cas que la multirésolution
(milieu poreux, navette spatiale, ...)
Avoir une interface Python

Merci pour votre attention