:: Enseignements :: ESIPE :: E3INFO :: 2016-2017 :: Algorithmique ::
![[LOGO]](http://igm.univ-mlv.fr/ens/resources/mlv.png) | Tris |
Le TP 4 se déroule en deux temps: 1) une première partie qui a lieu en TP et qui
doit conduire au dépôt, à la fin de la séance, des codes C réalisés sur la
plateforme Moodle et 2) une seconde partie, en autonomie, qui vous conduit à
poursuivre des tests comparatifs et à réaliser un rapport en pdf qui devra à
nouveau être déposé sur la plateforme Moodle. Ce rapport contiendra une
analyse comparative de la complexité de vos algorithmes et les diagrammes qui
les illustrent.
Exercice 1 - Tri par sélection d'un tableau
Commencer par récupérer l'archive
Base.zip
et extraire les fichiers dans votre répertoire de travail. Les fichiers
array.h
et
array.c contiennent des fonctions de base sur les tableaux, les fichiers
sort.h et
sort.c des fonctions de tri et le fichier
tp04.c contient
une fonction
main qui va nous permettre de tester les tris.
Les fichiers
visualarray.h,
visualarray.c,
demo1.c et
demo2.c
contiennent des fonctions pour visualiser l'exécution d'un algorithme de tri.
Le fichier
Makefile permet de générer un exécutable de nom
./tp04.
- Tester par make que cela fonctionne et exécuter ./tp04 pour
constater que la fonction selection_sort() appelée dans tp04.c à la ligne
34 ne fonctionne pas correctement.
- Aller voir dans sort.c et faire ce qu'il faut pour que le
tri sélection soit correctement réalisé.
Tester à nouveau l'exécution après avoir relancé le Makefile.
- Dans tp04.c, changer la valeur de MAX_SIZE en début de fichier.
Par exemple, essayer avec 0: est-ce que votre fonction de tri fonctionne correctement?
Essayer maintenant avec 1000: est-ce que votre fonction de tri fonctionne correctement?
- L'archive contient aussi des fonctions pour faciliter la visualisation de tableaux.
Taper make demo1 et exécuter ./demo1 ou
taper make demo2 et exécuter ./demo2 pour voir des
exemples pour un tri à bulles simple.
Vous pouvez vous inspirer de ces deux exemples pour visualiser vos propres algorithmes
dans ce tp.
Exercice 2 - Tests
-
Regarder à l'oeil nu si l'affichage du tableau est correct n'est pas satisfaisant
dès que le nombre d'éléments dépasse une dizaine.
Comment pouvez-vous vous assurer que les implémentations de vos algorithmes de tri
sont correctes, c'est-à-dire qu'ils trient bien tous les tableaux
correctement ?
-
Suggérer des tests pour vérifier que vos
algorithmes fonctionnent dans des cas de bornes (cas "aux limites"),
pour des petits tableaux et pour des grands... et implémenter ces tests dans une ou plusieurs fonctions.
-
On peut utiliser une fonction de tri déjà existante de la bilbiothèque C
comme qsort pour vérifier si notre fonction selection_sort
produit exactement le même résultat.
Exemple d'utilisation de cette fonction :
#include <stdio.h>
#include <stdlib.h>
int values[] = {3, 1, 4, 1, 5, 9, 2, 6, 5, 3};
int compare(const void *a,const void *b)
{
int aint = *(int*)a;
int bint = *(int*)b;
if (aint == bint)
return 0;
else
if (aint < bint)
return -1;
else
return 1;
}
int main()
{
int i;
for (i=0; i < 10; i++)
printf("%d ", values[i]);
printf("\n");
qsort (values, 10, sizeof(int), compare);
for (i=0; i < 10; i++)
printf ("%d ", values[i]);
printf("\n");
return 0;
}
Exercice 3 - Implémentation d'autres tris
On peut maintenant poursuivre l'implémentation dans
sort.c de nos tris dont les prototypes
de fonction sont décrits dans le fichier
sort.h.
- Tri par insertion (vu en cours)
- Tri rapide (quicksort, vu en cours)
Exercice 4 - Quicksort amélioré [FACULTATIF]
Dans cet exercise vous allez améliorer votre
quicksort.
Après chaque ajustement, il est important de vérifier que la fonction
est toujours correcte.
-
Introduire l'amélioration suivante :
si la taille du tableau diminue en dessous d'un certain seuil CUTOFF,
alors vous appelez insertion_sort sur ce tableau.
Noter qu'il faut modifier les arguments à la fonction insertion_sort
pour qu'elle puisse trier une partie d'un tableau commencant et terminant
par des indices quelconques.
-
Mesurer le temps d'exécution sur un tableau aléatoire de taille 10^7
pour des valeurs de CUTOFF entre 1 et 100 et choisir le meilleur seuil.
-
Introduire d'autres améliorations vues au cours.
Vérifier la performance sur des
types de données différentes,
en particulier sur des tableaux déjà triés, des tableaux inversés
et des tableaux avec peu de clés distinctes
(même avec 1 ou 2 clés).
Rendez la version la plus rapide que vous avez obtenue.
Exercice 5 - Comptage et comparaison visuelle des tris
On souhaite maintenant pouvoir comparer les différentes fonctions de tri
en nombre de comparaisons ou en nombre d'affectations effectuées.
Plutôt que de modifier les fonctions déjà écrites, que nous avons testé précédement,
nous allons les recopier dans des fonctions
instrumentées ayant des
paramètres supplémentaires qui vont nous permettre de réaliser ces mesures.
-
Recopier chacune des fonctions de tri dans sort.h
en les renommant avec l'extension _instr
et en leur ajoutant deux paramètres permettant de calculer
- le nombre de comparaisons (appels à less),
- le nombre d'échanges (appels à swap)
requis pour le tri du tableau.
Par exemple:
void selection_sort(int t[], int size);
void selection_sort_instr(int t[], int size, int *nb_comp, int *nb_swap);
Sur la base des fonctions de tri réalisées précédemment, implémenter dans
sort.c les versions instrumentées de chacune d'entre elle.
-
Vous pouvez alors créer un nouveau fichier, tp04-instr.c pour éviter de casser votre
programme précédent, et ajouter les règles et dépendances nécessaires à votre fichier Makefile,
pour pouvoir produire un nouvel exécutable tp04-instr dont l'execution vous affichera le
nombre de comparaisons et le nombre d'affectations des tris effectués. Par exemple, pour le
fichier tp04-instr.c suivant, vous aurez les compteurs du tri sélection.
#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#include "array.h"
#include "sort.h"
#define MAX_VALUE 1000000
#define MAX_SIZE 1000
int main(int argc, char *argv[]) {
srand(time(NULL));
int size = MAX_SIZE;
int max_value = MAX_VALUE;
/* tableau de référence */
int* tab_ref = NULL;
/* tableau de travail */
int* tab = NULL;
/* compteurs */
int nb_comp = 0;
int nb_swap = 0;
/* allocation et initialisation de la référence avec des valeurs aléatoires */
tab_ref = create_array(size);
fill_random_array(tab_ref, size, max_value);
/* allocation et initialisation du tableau de travail avec les valeurs de référence */
tab = create_array(size);
copy_array(tab_ref, tab, size);
/* tri du tableau de travail */
selection_sort_instr(tab, size, &nb_comp, &nb_swap);
printf("%d comparaisons\n", nb_comp);
printf("%d échanges\n", nb_swap);
/* libération des tableaux de la taille courante */
free(tab);
tab = NULL;
free(tab_ref);
tab_ref = NULL;
return EXIT_SUCCESS;
}
Et il suffirait de réaliser plusieurs appels à différents tris pour avoir un comparatif
du nombre de comparaisons (ou d'affectation) qu'ils nécessitent.
-
Pour visualiser le nombre de comparaisons et d'échanges
des différents algorithmes, on va utiliser le programme gnuplot
pour tracer au format postscript des données présentes dans
des fichiers. Les quelques instructions suivantes devraient vous permettre
de comprendre comment il fonctionne.

Il vous suffit maintenant de modifier votre programme tp04-instr.c
pour qu'il effectue les mesures souhaitées et réalise les affichages correspondant
dans le format requis pour le fichier plot, et vous pourrez obtenir les courbes
comparatives des différents algorithmes de tri.
Vous commenterez les différents graphiques obtenus et comparerez
les différents algorithmes de tri.
Effectuez vos tests sur plusieurs copies d'un même tableau, pour apprécier
les différences, avec des valeurs aléatoires relativement
grandes par rapport à la taille du tableau.
Voyez-vous toutes les courbes? Essayez différents ordres de grandeurs du nombre
d'éléments à trier afin de percevoir des différences plus subtiles.
-
Écrire un court rapport du tp contenant les éléments suivants :
-
Un diagramme avec le nombre de comparaisons de
tri par sélection, tri par insertion et tri rapide sur des tableaux de
taille 10 à 10 000 avec une valeur maximale d'au moins 20 000.
Commenter le résultat en quelques phrases.
-
Un diagramme avec le nombre de comparaisons de
tri par sélection, tri par insertion et tri rapide sur des tableaux de
taille 10 à 100 avec une valeur maximale d'au moins 200.
Commenter le résultat en quelques phrases.
-
Un diagramme avec le nombre d'échanges de
tri par sélection et tri par insertion sur des tableaux de
taille 10 à 10 000 avec une valeur maximale d'au moins 20 000.
Commenter le résultat en quelques phrases.
-
Pour chaque algorithme de tri différent,
le nombre d'entiers que vous pouvez trier en 10 secondes et en 20 secondes.
Pour mesurer, vous pouvez utiliser time ./un_prog
dans le terminal pour lancer le programme un_prog et afficher le temps de son
exécution.
© Université de Marne-la-Vallée