Module ou extension

Il est souvent préférable de répartir le code d’un grand programme sur plusieurs fichiers. Parmi tous ces fichiers, un seul est considéré comme fichier principal, il contient son point d’entrée, les premières instructions exécutées. Les autres fichiers sont considérés comme des modules, en quelque sorte, des annexes qui contiennent tout ce dont le fichier principal a besoin.

Un module

Exemple

Cet exemple montre comment répartir un programme sur deux fichiers. Le premier est appelé module car il n’inclut pas le point d’entrée du programme.

Définition D1 : point d’entrée du programme

Le point d’entrée d’un programme est la première instruction exécutée par l’ordinateur lors de l’exécution de ce programme.

Cet exemple de module contient une fonction, une classe et une variable. Ces trois éléments peuvent être utilisés par n’importe quel fichier qui importe ce module. Le nom d’un module correspond au nom du fichier sans son extension.

<<<

"""
exemple de module, aide associée
"""

exemple_variable = 3


def exemple_fonction():
    """exemple de fonction"""
    return 0


class exemple_classe:
    """exemple de classe"""

    def __str__(self):
        return "exemple_classe"

>>>

    

Pour l’utiliser, il suffit de l’importer avec le mot clé import :

import module_exemple

c = module_exemple.exemple_classe ()
print(c)
print(module_exemple.exemple_fonction())
help(module_exemple)

Et le résultat est :

    exemple_classe
    0

La dernière instruction affiche l’aide du module :

Help on module module_exemple:

NAME
    module_exemple - exemple de module, aide associée

CLASSES
    builtins.object
        exemple_classe

    class exemple_classe(builtins.object)
     |  exemple de classe
     |
     |  Methods defined here:
     |
     |  __str__(self)
     |      Return str(self).
     |
     |  ----------------------------------------------------------------------
     |  Data descriptors defined here:
     |
     |  __dict__
     |      dictionary for instance variables (if defined)
     |
     |  __weakref__
     |      list of weak references to the object (if defined)

FUNCTIONS
    exemple_fonction()
        exemple de fonction

DATA
    exemple_variable = 3

FILE
    module_exemple.py

Pour importer un module, il suffit d’insérer l’instruction import nom_module avant d’utiliser une des choses qu’il définit. Ces importations sont souvent regroupées au début du programme, elles sont de cette façon mises en évidence même s’il est possible de les faire n’importe où. L’exemple ci-dessus à droite importe le module défini à gauche. Les modules commencent le plus souvent par une chaîne de caractères comme dans l’exemple précédent, celle-ci contient l’aide associée à ce module. Elle apparaît avec l’instruction help(module_exemple).

Rien ne différencie les deux fichiers module_exemple.py et exemple.py excepté le fait que le second utilise des éléments définis par le premier. Dans un programme composé de plusieurs fichiers, un seul contient le point d’entrée et tous les autres sont des modules.

La syntaxe d’appel d’un élément d’un module est identique à celle d’une classe. On peut considérer un module comme une classe avec ses méthodes et ses attributs à la seule différence qu’il ne peut y avoir qu’une seule instance d’un même module. La répétition de l’instruction import module_exemple n’aura aucun effet : un module n’est importé que lors de la première instruction import nom_module rencontré lors de l’exécution du programme.

L’utilisation d’un module qu’on a soi-même conçu provoque l’apparition d’un répertoire __pycache__ qui contient des fichiers d’extension pyc. Il correspond à la traduction du module en bytecode plus rapidement exploitable par l’interpréteur python. Ce fichier est généré à chaque modification du module. Lorsqu’un module est importé, python vérifie la date des deux fichiers d’extension py et pyc. Si le premier est plus récent, le second est recréé. Cela permet un gain de temps lorsqu’il y a un grand nombre de modules. Il faut faire attention lorsque le fichier source d’extension py est supprimé, il est alors encore possible de l’importer tant que sa version d’extension pyc est présente.

Le module module_exemple contient une variable exemple_variable peut être modifiée au cours de l’exécution du programme. Il est possible de revenir à sa valeur initiale en forçant python à recharger le module grâce à la fonction import.reload elle même implémentée dans le module importlib.

Syntaxe S1 : importer un module (1)

import importlib
import module_exemple
module_exemple.exemple_variable = 10
importlib.reload(module_exemple)
print(module_exemple.exemple_variable)      # affiche 3

Importer un module

Il existe trois syntaxes différentes pour importer un module. La première est décrite au paragraphe précédent. Il en existe une autre qui permet d’affecter à un module un identificateur différent du nom du fichier dans lequel il est décrit. En ajoutant l’instruction as suivi d’un autre nom alias, le module sera désigné par la suite par l’identificateur alias comme le montre l’exemple suivant.

Syntaxe S2 : importer un module (2)

import module_exemple as alias

c = alias.exemple_classe()
print(c)
print(alias.exemple_fonction())

La syntaxe suivante n’est pas recommandée car elle masque le module d’où provient une fonction en plus de tout importer.

Syntaxe S3 : importer un module (3)

from module_exemple import *  # décommmandé
from module_exemple import exemple_classe, exemple_fonction

c = exemple_classe()
print(c)
print(exemple_fonction())

De plus, la partie import * permet d’importer toutes les classes, attributs ou fonctions d’un module mais il est possible d’écrire from module_exemple import exemple_class pour n’importer que cette classe. Dernier moyen, il est possible d’importer un module dont on ne connaît le nom que lors de l’exécution :

alias = __import__("module_exemple")

c = alias.exemple_classe()
print(c)
print(alias.exemple_fonction())

Nom d’un module

Le nom d’un module est défini par le nom du fichier sous lequel il est enregistré. Dans l’exemple du paragraphe précédent, le module avait pour nom de fichier module_exemple.py, le nom de ce module est donc module_exemple.

Néanmoins, ce module peut également être exécuté comme un programme normal. Si tel est le cas, son nom devient __main__. C’est pourquoi, les quelques lignes qui suivent apparaissent souvent. Elles ne sont exécutées que si ce fichier a pour nom __main__. Un seul fichier peut porter ce nom : celui qui contient le point d’entrée.

if __name__ == "__main__":
    print("ce fichier est le programme principal")

Cette astuce est régulièrement utilisée pour tester les fonctions et classes définies dans un module. Etant donné que cette partie n’est exécutée que si ce fichier est le programme principal, ajouter du code après le test if __name__ == "__main__": n’a aucune incidence sur tout programme incluant ce fichier comme module.

Modules et fichiers

Emplacement d’un module

Lorsque le module est placé dans le même répertoire que le programme qui l’utilise, l’instruction import nom_module_sans_extension suffit. Cette instruction suffit également si ce module est placé dans le répertoire site-packages présent dans le répertoire d’installation de python. Si ce n’est pas le cas, il faut préciser à l’interpréteur python où il doit chercher ce module :

import sys
sys.path.append("répertoire où se trouve le module à importer")
import nom_module

La variable sys.path contient les répertoires où python va chercher les modules. Le premier d’entre eux est le répertoire du programme. Il suffit d’ajouter à cette liste le répertoire désiré. Il est conseillé d’utiliser le plus souvent possible des chemins relatifs et non absolus. Il est aussi déconseillé d’utiliser cette technique. Il vaut mieux utiliser des import relatifs.

Aparté. Depuis un répertoire, les chemins relatifs permettent de faire référence à d’autres répertoires sans avoir à prendre en compte leur emplacement sur le disque dur contrairement aux chemins absolus comme C:\Python36_x64\python.exe qui parte de la racine. De cette façon, on peut recopier le programme et ses modules à un autre endroit du disque dur sans altérer leur fonctionnement.

Attributs communs à tout module

Une fois importés, tous les modules possèdent cinq attributs qui contiennent des informations comme leur nom, le chemin du fichier correspondant, l’aide associée.

__all__

Contient toutes les variables, fonctions, classes du module

__builtins__

Ce dictionnaire contient toutes les fonctions et classes inhérentes au langage python utilisées par le module.

__doc__

Contient l’aide associée au module.

__file__

Contient le nom du fichier qui définit le module.

__name__

Cette variable contient a priori le nom du module sauf si le module est le point d’entrée du programme auquel cas cette variable contient __main__.

Ces attributs sont accessibles si le nom du module est utilisé comme préfixe. Sans préfixe, ce sont ceux du module lui-même.

<<<

import os

print(os.__name__, os.__doc__)
if __name__ == "__main__":
    print("ce fichier est le point d'entrée")
else:
    print("ce fichier est importé")

>>>

    os OS routines for NT or Posix depending on what system we're on.
    
    This exports:
      - all functions from posix or nt, e.g. unlink, stat, etc.
      - os.path is either posixpath or ntpath
      - os.name is either 'posix' or 'nt'
      - os.curdir is a string representing the current directory (always '.')
      - os.pardir is a string representing the parent directory (always '..')
      - os.sep is the (or a most common) pathname separator ('/' or '\\')
      - os.extsep is the extension separator (always '.')
      - os.altsep is the alternate pathname separator (None or '/')
      - os.pathsep is the component separator used in $PATH etc
      - os.linesep is the line separator in text files ('\r' or '\n' or '\r\n')
      - os.defpath is the default search path for executables
      - os.devnull is the file path of the null device ('/dev/null', etc.)
    
    Programs that import and use 'os' stand a better chance of being
    portable between different platforms.  Of course, they must then
    only use functions that are defined by all platforms (e.g., unlink
    and opendir), and leave all pathname manipulation to os.path
    (e.g., split and join).
    
    ce fichier est importé

Cas pratiques

Ce qui ne marche pas : les import cycliques

Deux modules ne peuvent s’importer l’un l’autre.

# module1.py
from .module2 import B
def A():
    return ...
# module2.py
from .module1 import A
def B():
    return ...

Le module module1 import le module module2 qui cherche à son tour à importer le module module1 et c’est sans fin. Il est possible d’éviter de cela en retardant l’un des deux imports.

# module1.py
from .module2 import B
def A():
    return ...
# module2.py
def B():
    from .module1 import A
    return ...

Le second import n’a lieu qu’à la première exécution de la fonction B. Ca marche mais cela veut dire aussi que la fonction B contiendra une instruction de plus.

Ajouter un module en cours d’exécution

De la même façon que python est capable d’inclure de nouvelles portions de code en cours d’exécution (fonction exec), il est également capable d’inclure en cours d’exécution des modules dont on ne connaît pas le nom au début de l’exécution. Cela s’effectue grâce à la fonction __import__ déjà présentée ci-dessus. Néanmoins, cette fonction ne peut pas importer un module si celui-ci est désigné par un nom de fichier incluant son répertoire. Il faut d’abord déterminer le répertoire où est le module grâce à la fonction split du module os.path. Le programme suivant illustre cette possibilité en proposant une fonction qui importe un module connaissant le nom du fichier qui le contient. Il ne faut pas oublier d’enlever l’extension et ne pas garder aucun répertoire.

alias = __import__("module_exemple.py".replace(".py", ""))

c = alias.exemple_classe()
print(c)
print(alias.exemple_fonction())

Liste des modules importés

Le dictionnaire sys.modules du module sys contient l’ensemble des modules importés. Le programme suivant affiche cette liste.

<<<

import sys

i = 0
for m in sys.modules:
    print(m, " " * (14 - len(str(m))), sys.modules[m])
    if i > 5:
        break
    i += 1

>>>

    sys             <module 'sys' (built-in)>
    builtins        <module 'builtins' (built-in)>
    _frozen_importlib  <module '_frozen_importlib' (frozen)>
    _imp            <module '_imp' (built-in)>
    _thread         <module '_thread' (built-in)>
    _warnings       <module '_warnings' (built-in)>
    _weakref        <module '_weakref' (built-in)>

Lorsque le programme stipule l’import d’un module, python vérifie s’il n’est pas déjà présent dans cette liste. Dans le cas contraire, il l’importe. Chaque module n’est importé qu’une seule fois. La première instruction import module_exemple rencontrée introduit une nouvelle entrée dans le dictionnaire sys.modules :

module_exemple  <module 'module_exemple' from 'D:\python_cours\module_exemple.py'>

Le dictionnaire sys.modules peut être utilisé pour vérifier la présence d’un module ou lui assigner un autre identificateur. Un module est un objet qui n’autorise qu’une seule instance.

if "module_exemple" in sys.modules:
    m = sys.modules["module_exemple"]
    m.exemple_fonction()

Plusieurs modules et fichiers

Arborescence de modules, paquetage

Lorsque le nombre de modules devient conséquent, il est parfois souhaitable de répartir tous ces fichiers dans plusieurs répertoires. Il faudrait alors inclure tous ces répertoires dans la liste sys.path ce qui paraît fastidieux. python propose la définition de paquetage, ce dernier englobe tous les fichiers python d’un répertoire à condition que celui-ci contienne un fichier __init__.py qui peut être vide. La figure suivante présente une telle organisation et l’exemple suivant explicite comment importer chacun de ces fichiers sans avoir à modifier les chemins d’importation.

../../_images/arbo.png

Les répertoires sont grisées tandis que les fichiers apparaissent avec leur extension.

import mesmodules.extension
import mesmodules.part1.niveaudeux
import mesmodules.part2.niveaudeuxbis

Lors de la première instruction import mesmodules.extension, le langage python ne s’intéresse pas qu’au seul fichier extension.py, il exécute également le contenu du fichier __init__.py. Si cela est nécessaire, c’est ici qu’il faut insérer les instructions à exécuter avant l’import de n’importe quel module du paquetage.

Import relatif

Les modules permettent d’écrire des programmes dans une succession de petits fichiers et c’est plus lisible comme cela. Les imports relatifs Voici un ensemble de fichier avec une fonction implémentée dans chacun.

package/
    __init__.py       # fonction A
    subpackage1/
        __init__.py   # fonction B
        moduleX.py    # fonction C
    subpackage2/
        __init__.py   # fonction D
        moduleY.py    # fonction E
    moduleA.py        # fonction F

La fonction A peut utiliser la fonction B ou C en les important de la façon suivante :

from .subpackage1 import B
from .subpackage1.moduleX import C

La fonction E peut utiliser la fonction F ou A ou C en les important de la façon suivante :

from ..moduleA import F
from .. import A
from ..subpackage1.moduleX import C

Ce qu’il faut retenir :

  • Le symbole . permet d’importer un module dans le même répertoire.

  • Le symbole .. permet d’importer un module dans le répertoire parent.

  • Le fichier __init__.py est essentiel pour signifier qu’un répertoire contient des fichiers python.

  • Il n’existe qu’une syntaxe : from .<module> import.

Modules internes

python dispose de nombreux modules préinstallés. La page Python Module Index recense tous les modules disponibles par défaut avec python. Cette liste est trop longue pour figurer dans ce document, elle est aussi susceptible de s’allonger au fur et à mesure du développement du langage python. La table qui suit regroupe les modules les plus utilisés.

asyncio

Thread, socket, protocol.

calendar

Gérer les calendriers, les dates.

cgi

Utilisé dans les scripts CGI (programmation Internet).

cmath

Fonctions mathématiques complexes.

copy

Copies d’instances de classes.

csv

Gestion des fichiers au format CSV

datetime

Calculs sur les dates et heures

gc

Gestion du garbage collector

getopt

Lire les options des paramètres passés en arguments d’un programme python

glob

Chercher des fichiers

hashlib

Fonctions de cryptage

htmllib

Lire le format HTML

importlib

Pour importer des modules.

math

Fonctions mathématiques standard telles que cos, exp, log

os

Fonctions systèmes dont certaines fonctions permettant de gérer les fichiers

os.path

Manipulations de noms de fichiers

pathlib

Manipulation de chemins.

pickle

Sérialisation d’objets, la sérialisation consiste à convertir des données structurées de façon complexe en une structure linéaire facilement enregistrable dans un fichier

profile

Etudier le temps passé dans les fonctions d’un programme

random

Génération de nombres aléatoires

re

Expressions régulières

shutil

Copie de fichiers

sqlite3

Accès aux fonctionnalités du gestionnaire de base de données SQLite3

string

Manipulations des chaînes de caractères

sys

Fonctions systèmes, fonctions liées au langage python

threading

Utilisation de threads

time

Accès à l’heure, l’heure système, l’heure d’une fichier

tkinter

Interface graphique

unittest

Tests unitaires (ou comment améliorer la fiabilité d’un programme)

urllib

Pour lire le contenu de page HTML sans utiliser un navigateur

xml.dom

Lecture du format XML.

xml.sax

Lecture du format XML.

zipfile

Lecture de fichiers ZIP.

Certains de ces modules sont présentés dans les chapitres qui suivent. Le programme suivant par exemple utilise les modules random math pour estimer le nombre \(\pi\). Pour cela, on tire aléatoirement deux nombres \(x,y\) dans l’intervalle \([0,1]\), si \(\sqrt{x^2+y^2} \infegal 1\), on compte 1 sinon 0. Au final, \(\hat{\pi} = \esp{\indicatrice{\sqrt{x^2+y^2} \infegal 1}}\).

<<<

import random
import math

somme = 0
nb = 1000000
for i in range(0, nb):
    x = random.random()  # nombre aléatoire entre [0,1]
    y = random.random()
    r = math.sqrt(x * x + y * y)  # racine carrée
    if r <= 1:
        somme += 1

print("estimation ", 4 * float(somme) / nb)
print("PI = ", math.pi)

>>>

    estimation  3.140752
    PI =  3.141592653589793

Le programme suivant calcule l’intégrale de Monte Carlo de la fonction \(f(x)=\sqrt{x}\) qui consiste à tirer des nombres aléatoires dans l’intervalle \([a,b]\) puis à faire la moyenne des \(\sqrt{x}\) obtenu.

<<<

import random  # import du module random : simulation du hasard
import math  # import du module math : fonctions mathématiques


def integrale_monte_carlo(a, b, f, n):
    somme = 0.0
    for i in range(0, n):
        x = random.random() * (b - a) + a
        y = f(x)
        somme += f(x)
    return somme / n


def racine(x):
    return math.sqrt(x)


print(integrale_monte_carlo(0, 1, racine, 100000))

>>>

    0.6679715979916946

Modules externes

Les modules externes ne sont pas fournis avec python, ils nécessitent une installation supplémentaire. Il serait impossible de couvrir tous les thèmes abordés par ces extensions. La simplicité d’utilisation du langage python et son interfaçage facile avec le langage C contribue à sa popularité. Il permet de relier entre eux des projets conçus dans des environnements différents, dans des langages différents. Depuis les versions 2.3, 2.4 du langage python, la plupart des modules externes sont faciles à installer, faciles à utiliser d’après les exemples que fournissent de plus en plus les sites Internet qui les hébergent. De plus, il s’écoule peu de temps entre la mise à disposition d’une nouvelle version du langage python et la mise à jour du module pour cette version

De nombreux modules ont été conçus pour un besoin spécifique et ne sont plus maintenus. Cela convient lors de l’écriture d’un programme qui remplit un besoin ponctuel. Pour une application plus ambitieuse, il est nécessaire de vérifier quelques informations comme la date de création, celle de la dernière mise à jour, la présence d’une documentation, une prévision pour la sortie de la future version, si c’est une personne lambda qui l’a conçu ou si c’est une organisation comme celle qui fournit le module tensorflow. Tout va souvent très vite. Le nombre de modifications est un critère assez simple pour s’assurer qu’un module est maintenu : commit. La plupart des modules sont sur Github aujourd’hui. S’il ne l’est pas, passez votre chemin.

L’installation de modules externes n’est pas toujours simple, certains comme scipy incluent des fichiers C++ qui doivent être compilés. Dans tous les cas, le code source des fichiers inclut un fichier setup.py. Le langage python fournit une procédure d’installation standard :

python setup.py install

Ce procédé marche la plupart du temps. Il échoue lorsque le module inclut des fichiers écrits dans un autre langage. L’installation dépend alors du système d’exploitation. Il est plus simple dans le cas d’installation des modules précompilés. La plupart sont disponibles sous cette forme sur PyPi, le site de publication des packages python.