Dictionnaires, fonctions, code de Vigenère (correction)#
Le notebook ne fait que crypter et décrypter un message sachant le code connu.
Exercice 1#
[1]:
def lettre_suivante(lettre):
c = ord(lettre) - ord("a")
c = (c + 1) % 26
return chr(c + ord("a"))
print(lettre_suivante("m"), lettre_suivante("z"))
n a
Exercice 2#
[2]:
mots = [
"eddard",
"catelyn",
"robb",
"sansa",
"arya",
"brandon",
"rickon",
"theon",
"rorbert",
"cersei",
"tywin",
"jaime",
"tyrion",
"shae",
"bronn",
"lancel",
"joffrey",
"sandor",
"varys",
"renly",
"a",
]
def mots_lettre_position(liste, lettre, position):
res = []
for mot in liste:
if position < len(mot) and mot[position] == lettre:
res.append(mot)
return res
r = mots_lettre_position(mots, "y", 1)
print(r)
['tywin', 'tyrion']
Exercice 3 : utilisation d’un dictionnaire#
L’énoncé suggère d’utiliser comme clé de dictionnaire le couple (position, lettre)
et la fonction doit retourne la liste des mots qui ont tous la même lettre à la même position. Le dictionnaire dictionnaire_bien_choisi
de l’énoncé doit avoir pour clés des couples (position, lettre)
et pour valeurs des listes de prénoms.
[3]:
def dictionnaire_choisi(liste):
d = {}
for mot in liste:
for i, c in enumerate(mot):
d[i, c] = d.get((i, c), []) + [mot]
return d
def mots_lettre_position(d, lettre, position):
return d.get((position, lettre), [])
d = dictionnaire_choisi(mots)
r = mots_lettre_position(d, "y", 1)
print("résultat=", r)
print("dictionnaire=", d)
résultat= ['tywin', 'tyrion']
dictionnaire= {(0, 'e'): ['eddard'], (1, 'd'): ['eddard'], (2, 'd'): ['eddard'], (3, 'a'): ['eddard', 'arya'], (4, 'r'): ['eddard', 'joffrey'], (5, 'd'): ['eddard'], (0, 'c'): ['catelyn', 'cersei'], (1, 'a'): ['catelyn', 'sansa', 'jaime', 'lancel', 'sandor', 'varys'], (2, 't'): ['catelyn'], (3, 'e'): ['catelyn', 'shae'], (4, 'l'): ['catelyn'], (5, 'y'): ['catelyn'], (6, 'n'): ['catelyn', 'brandon'], (0, 'r'): ['robb', 'rickon', 'rorbert', 'renly'], (1, 'o'): ['robb', 'rorbert', 'joffrey'], (2, 'b'): ['robb'], (3, 'b'): ['robb', 'rorbert'], (0, 's'): ['sansa', 'shae', 'sandor'], (2, 'n'): ['sansa', 'lancel', 'sandor', 'renly'], (3, 's'): ['sansa', 'cersei'], (4, 'a'): ['sansa'], (0, 'a'): ['arya', 'a'], (1, 'r'): ['arya', 'brandon', 'bronn'], (2, 'y'): ['arya'], (0, 'b'): ['brandon', 'bronn'], (2, 'a'): ['brandon', 'shae'], (3, 'n'): ['brandon', 'bronn'], (4, 'd'): ['brandon'], (5, 'o'): ['brandon'], (1, 'i'): ['rickon'], (2, 'c'): ['rickon'], (3, 'k'): ['rickon'], (4, 'o'): ['rickon', 'tyrion', 'sandor'], (5, 'n'): ['rickon', 'tyrion'], (0, 't'): ['theon', 'tywin', 'tyrion'], (1, 'h'): ['theon', 'shae'], (2, 'e'): ['theon'], (3, 'o'): ['theon'], (4, 'n'): ['theon', 'tywin', 'bronn'], (2, 'r'): ['rorbert', 'cersei', 'tyrion', 'varys'], (4, 'e'): ['rorbert', 'cersei', 'jaime', 'lancel'], (5, 'r'): ['rorbert', 'sandor'], (6, 't'): ['rorbert'], (1, 'e'): ['cersei', 'renly'], (5, 'i'): ['cersei'], (1, 'y'): ['tywin', 'tyrion'], (2, 'w'): ['tywin'], (3, 'i'): ['tywin', 'tyrion'], (0, 'j'): ['jaime', 'joffrey'], (2, 'i'): ['jaime'], (3, 'm'): ['jaime'], (2, 'o'): ['bronn'], (0, 'l'): ['lancel'], (3, 'c'): ['lancel'], (5, 'l'): ['lancel'], (2, 'f'): ['joffrey'], (3, 'f'): ['joffrey'], (5, 'e'): ['joffrey'], (6, 'y'): ['joffrey'], (3, 'd'): ['sandor'], (0, 'v'): ['varys'], (3, 'y'): ['varys'], (4, 's'): ['varys'], (3, 'l'): ['renly'], (4, 'y'): ['renly']}
S’il permet d’aller beaucoup plus vite pour effectuer une recherche, le dictionnaire d
contient beaucoup plus de mots que la liste initiale. Si on suppose que tous les mots sont uniques, il en contient exactement autant que la somme des longueurs de chaque mot.
A quoi ça sert ? Tout dépend du nombre de fois qu’on n’effectue ce type de recherche. Il faut d’abord décomposer les deux méthodes en coût fixe (préparation du dictionnaire) et coût recherche puis regarder la page Time Complexity. On obtient :
liste de l’exercice 2 : coût fixe = 0, coût variable
dictionaire de l’exercice 3 : coût fixe , coût variable
Où :
est le nombre de mots,
est la somme des nombres de lettres de chaque mot,
est la longueur maximale d’un mot.
Les dictionnaires en Python utilisent une table de hashage pour stocker les clés. L’objet map
de Python ne rapproche plus de l’objet unordered_map
de C++ que de l’objet map
. Ce dernier (C++ uniquement) est un tableau trié. L’accès à chaque élément se fait par dichotomie en (voir Standard C++ Containers. Le coût dans ce cas serait
(toujours en C++) :
dictionaire de l’exercice 3 : coût fixe , coût variable
Si on effectue cette recherche un grand nombre de fois, l’utilisation d’un dictionnaire permet d’être beaucoup plus rapide même si on doit créer une structure intermédiaire. Ce schéma revient régulièrement : représenter autrement les données pour accélérer un traitement effectué un grand nombre de fois.
Vous pouvez lire également :
Exercice 4 : crypter et décrypter selon Vigenère#
Tout d’abord le code de César :
[4]:
def code_cesar(m):
s = "".join([chr((ord(l) - 65 + 3) % 26 + 65) for l in m])
return s
m = "JENESUISPASCODE"
print(code_cesar(m))
MHQHVXLVSDVFRGH
Et le code de Vigenère :
[5]:
def code_vigenere(message, cle):
message_code = ""
for i, c in enumerate(message):
d = cle[i % len(cle)]
d = ord(d) - 65
message_code += chr((ord(c) - 65 + d) % 26 + 65)
return message_code
m = "JENESUISPASCODE"
print(code_vigenere(m, "DOP"))
MSCHGJLGEDGRRRT
Et le décryptage du code de Vigenère pour lequel on modifie la fonction précédente qui pourra alors coder et décoder.
[6]:
def code_vigenere(message, cle, decode=False): # ligne changée
message_code = ""
for i, c in enumerate(message):
d = cle[i % len(cle)]
d = ord(d) - 65
if decode:
d = 26 - d # ligne ajoutée
message_code += chr((ord(c) - 65 + d) % 26 + 65)
return message_code
m = "JENESUISPASCODE"
c = code_vigenere(m, "DOP")
d = code_vigenere(c, "DOP", True)
print(c, d)
MSCHGJLGEDGRRRT JENESUISPASCODE
Pour retrouver le code de César, il suffit de choisir une clé d’une seule lettre :
[7]:
c = code_vigenere(m, "D")
print(c)
MHQHVXLVSDVFRGH
On peut casser le code de Vigenère.
[ ]: