On demande d’implanter les algorithmes de calculs suivants (dans ce qui suit rule est une règle quelconque):
Calcul de la valuation d’une grammaire (ce qui permet de vérifier la grammaire);
méthode rule.count_naive(self, n) qui calcule le nombre d’objets d’un poids donné n par la méthode naïve;
méthode rule.count(self, n) qui calcule le nombre d’objets de poids n par la méthode des séries génératrices;
méthode rule.list(self, n) qui calcule la liste des objets de poids n;
méthode rule.unrank(self, n) qui calcule le i-ème élément de la liste des objets de poids n, sans calculer la liste;
Attention
Note importante: en Sage la position dans une liste commence à 0;
méthode rule.random(self, n) qui choisit équitablement au hasard un objet de poids n (on utilisera rule.unrank(self, n, i) où i sera choisi aléatoirement).
Le calcul de la valuation est nécessaire aux étapes suivantes qui sont indépendantes. Je les ai néanmoins classé par ordre croissant de difficulté.
La valuation du non-terminal nt est la taille du plus petit objet qui en dérive. La valuation d’une grammaire est l’ensemble des valuations des terminaux. Elle vérifie les quatres règles suivantes:
Pour la calculer, on utilise l’algorithme de point fixe suivant. On part de la valuation (incorrecte) qui associe à chaque non-terminal la valeur . En appliquant une fois non récursivement (pour éviter les boucles infinies) les règles précédentes à partir de , on calcule une nouvelle valuation . On calcule ensuite de même une valuation a partir de . On recommence tant que la valuation est différente de . La valuation cherchée est obtenue quand .
Note
Si pour un certain non terminal , alors aucun objet ne dérive de ce non-terminal. On considère alors que la grammaire est incorrecte.
Par exemple, sur les arbres, le calcul se fait en étapes:
n: Tree Leaf Node Règle: 0 1 2 3 4 Final:
Le comptage du nombre d’objets de poids se fait en appliquant récursivement les règles suivantes: Soit un non-terminal. On note le nombre d’objet de poids .
si est un Singleton alors et si est différent de ;
si est un Epsilon alors alors et si est différent de ;
si est l’union Union des non-terminaux et alors
si est le produit Prod des non-terminaux et
Note
Pour aller plus vite et éviter des boucles infinies, on ne considérera dans la somme précédente que les cas où et , où désigne la valuation du non-terminal . En effet, par définition si .
On applique récursivement les définitions des constructeurs Singleton, Epsilon, Union et Prod pour construire la liste des objets de taille . En particulier, si est le produit Prod des non-terminaux et , la liste des objets dérivant de et de poids est la concaténation des listes de tous les produits cartésiens d’éléments dérivant de et de taille et d’éléments dérivant de et de taille , pour tous les couples tels que , et (comme précédemment désigne la valuation du non-terminal ).
Par exemple, pour obtenir les arbres de taille , on procède de la manière suivante
Calcul de Tree = Union (Leaf, Node) avec .
Application de Leaf = Singleton Leaf avec , on retourne la liste vide [];
Application de Node = Prod(Tree, Tree) avec . La valuation de Tree est 1. Il y a donc deux possibilités ou .
- Application de Tree = Union (Leaf, Node) avec .
- Leaf est vide avec on retourne la liste vide.
- Application de Node = Prod(Tree, Tree) avec . La valuation de Tree est 1. Une seule décomposition est possible . On appelle donc deux fois Tree avec dots(Je n’écrit pas les appels récursifs) qui retourne la liste [Leaf]. On retourne donc la liste [Node(Leaf, Leaf)]
- Application de Tree = Union (Leaf, Node) avec . On retourne la liste [Leaf]
Le produit cartésien des deux listes précédentes est la liste formée du seul élément [Node(Node(Leaf, Leaf), Leaf)]
- Application de Tree = Union (Leaf, Node) avec . On retourne donc la liste [Leaf]
- Application de Tree = Union (Leaf, Node) avec . On retourne donc la liste [Node(Leaf, Leaf)]
Le produit cartésien des deux listes précédentes est la liste formée du seul élément [Node(Leaf, Node(Leaf, Leaf))]
On retourne donc la liste des deux arbres:
[Node(Leaf, Node(Leaf, Leaf)), Node(Node(Leaf, Leaf), Leaf)]
Pour , il faut essayer les décompositions , , , et . Étudions le cas . Par appel récursif on trouve deux arbres de poids :
[Node(Node(Leaf, Leaf), Leaf); Node(Leaf, Node(Leaf, Leaf))]
Le produit cartésien est donc formé de éléments qui correspondent aux arbres suivants:
Node(Node(Leaf, Node(Leaf, Leaf)), Node(Node(Leaf, Leaf), Leaf));
Node(Node(Node(Leaf, Leaf), Leaf), Node(Node(Leaf, Leaf), Leaf));
Node(Node(Leaf, Node(Leaf, Leaf)), Node(Leaf, Node(Leaf, Leaf)));
Node(Node(Node(Leaf, Leaf), Leaf), Node(Leaf, Node(Leaf, Leaf)));
En sage, chaque variable formelle doit être déclarée à l’aide de la commande var. On peut ensuite manipuler des expressions où la variable apparaît. Voici par exemple la résolution à la main du cas des arbres binaires:
sage: var("tr")
sage: sys = [tr == x + tr*tr]
sage: sol = solve(sys, tr, solution_dict=True)
sage: sol
[{tr: -1/2*sqrt(-4*x + 1) + 1/2}, {tr: 1/2*sqrt(-4*x + 1) + 1/2}]
On a alors deux solutions:
sage: s0 = sol[0][tr]
sage: s1 = sol[1][tr]
sage: taylor(s0, x, 0, 5)
14*x^5 + 5*x^4 + 2*x^3 + x^2 + x
sage: taylor(s1, x, 0, 5)
-14*x^5 - 5*x^4 - 2*x^3 - x^2 - x + 1
Pour trouver quelle est la bonne on peut remplacer par zéro:
sage: s0.subs(x=0), s1.subs(x=0)
(0, 1)
Dans le cas où la série est une fraction rationnelle, on sait que le dénominateur encode la récurrence. Ceci permet un calcul beaucoup plus rapide. Pour savoir si une expression est une fraction rationnelle, il faut la factoriser, extraire le numérateur et le dénominateur et vérifier que ce sont bien des polynômes.
Note
Dans le cas des arbres binaires, cette méthode ne marche pas
sage: s0
-1/2*sqrt(-4*x + 1) + 1/2
sage: s0.factor().numerator().is_polynomial(x)
False
Voici un exemple d’une fraction rationnelle:
sage: ex = x*2/(2*x^2+x+1) + 2*x+1
sage: ex = ex.factor(); ex
(4*x^3 + 4*x^2 + 5*x + 1)/(2*x^2 + x + 1)
sage: ex.numerator().is_polynomial(x)
True
sage: ex.denominator().is_polynomial(x)
True
On peut alors extraire les coefficients:
sage: ex.denominator().coefficients(x)
[[1, 0], [1, 1], [2, 2]]
Puisque la grammaire est supposée rationnelle, le système ainsi obtenu est linéaire. La fonction solve permet de résoudre un tel système, elle fonctionne essentiellement par pivot de Gauss. La solution est alors une fraction rationnelle.
La fonction taylor permet alors de calculer les premiers coefficients. Pour calculer les suivants, on utilise le fait que le dénominateur encode une récurrence vérifiée par les coefficients de la série. Ainsi, si
et si est supérieur au degré du numérateur, alors le coefficient de de est nul. On peut sans perte de généralité supposer . On obtient donc les équations pour tout ,
Il est possible d’abaisser la complexité du calcul de utilisant une matrice. En effet, la récurrence s’écrit
Pour calculer coefficient il suffit donc d’élever la matrice à la puissance par exponentiation binaire.
Pour calculer l’élément de taille et de rang , on fait appel à la méthode unrank. Voici par exemple l’arbre de taille et de rang :
sage: treeGram['Tree'].unrank(6, 12)
Node(Leaf, Node(Node(Node(Leaf, Node(Leaf, Leaf)), Leaf), Leaf))
Attention
La numérotation commence à zéro.
On procédera récursivement comme suit:
si l’on demande un objet dont le rang est supérieur au nombre d’objet on lève une exception ValueError.
dans le cas EpsilonRule ou SingletonRule, on retourne l’objet.
dans le cas d’une union: "U" : UnionRule("A", "B"), on suppose connu les nombres d’objets: . Alors l’objet de de rang est l’objet de de rang si et l’objet de de rang sinon.
dans le cas d’un produit: "U" : ProductRule("A", "B"), on suppose connu les nombres d’objets:
En s’inspirant de l’union, on calcule la valeur de :
Il reste finalement à trouver l’élément de rang d’un produit cartésien d’ensemble où est de cardinalité et est de cardinalité . Si l’on choisi l’ordre lexicographique pour énumérer :
alors l’élément est où et sont respectivement le quotient et le reste de la division euclidienne de par que l’on peut calculer en sage par la méthode quo_rem des entiers.
Par exemple, pour les arbre de taille :
0
1
2
3
4
5
6
7
0
42
14
10
10
14
42
0
Ainsi, si l’on veut l’arbre de rang , comme . On prendra et l’on retournera l’arbre de rang du produit cartésien On a maintenant , , . On retournera donc l’arbre Node(u,v) où est l’arbre de taille et de rang et l’arbre de taille de rang .