Vous pouvez me contacter via Facebook pour questions & suggestions : Page Facebook relative à mon site
Dans ce chapitre, je vais approfondir les structures déjà évoquées précédemment (chaines, listes, ensembles, dictionnaires, tuples). Je vais aussi présenter les "arrays" en Python dans la fin du chapitre.
La liste (objet "list") est bien sûr la structure la plus utilisée mais les autres structures ont des particularités qui peuvent être
intéressantes en programmation.
Ainsi on utilise un tuple pour créer des constantes.
On construit une liste d'entiers à partir d'un objet "range".
On utilise un set si on veut une liste avec valeurs uniques.
Le sens de ces différents qualificatifs doit être connu.
Un itérable est une structure de données qui peut être parcourue par une boucle FOR.
Les types itérables sont : str, list, tuple, dict, set & range
On appelle séquence un itérable indexable : on peut associer à chaque élément un indice. Les chaines, listes, objets 'range' , tuples sont des séquences mais pas les dictionnaires et les ensembles. On dit aussi que les séquences sont "sliceables" (on peut extraire une tranche).
Un tuple, une chaine & objet 'range' sont immuables : on ne peut pas modifier leur contenu.
Les autres structures (liste, dictionnaire, ensemble) sont mutables : on peut modifier leur contenu.
Quelles méthodes puis-je employer pour chaque type de structure ?
Pour connaitre les méthodes d'une classe il suffit de taper dans la console de Python : dir(nomClasse) ou help(nomClasse)
Ci-dessus, j'affiche les méthodes pour chaque type de structure à l'exclusion des méthodes magiques
(celles qui sont précédées et suivies de deux "underscores"). Nous n'avons pas à nous préoccuper de celles-ci pour l'instant.
Notez le nombre impressionnant de méthodes que l'on peut appliquer à une instance de la classe 'str'.
Par contre les méthodes de la classe "tuple" ne sont qu'au nombre de 2 ... et 5 pour un objet "range".
Notez que certaines méthodes sont communes à plusieurs classes. Ainsi on retrouve la méthode clear() pour
les listes, les ensembles et les dictionnaires. La méthode count() est présente aussi dans plusieurs classes.
On trouve également la méthode index() pour les classes "list", "tuple", "str" mais pas pour les dictionnaires et les ensembles q
ui ne sont pas des structures indexables.
Pour avoir des infos plus détaillées sur la syntaxe et le rôle de chaque méthode de classe il est préférable d'utiliser la commande help.
Je l'ai déjà signalé dans le chapitre 8, mais je pense qu'il pas inutile de faire une piqure de rappel.
Il ne faut pas confondre fonctions génériques avec méthodes de classe.
Par exemple, ne confondez pas : sort() et sorted() ; de même ne confondez pas reverse() et reversed().
sort() & reverse() sont de méthodes de la classe 'list' tandis que sorted() & reversed() sont des
fonctions génériques qui peuvent donc s'appliquer à n'importe quelle séquence et qui ne modifie la série d'origine (se contente d'afficher
une liste ordonnée.
Etudiez bien les commandes ci-dessous !
La fonction sorted() affiche toujours une liste ordonnée mais ne modifie pas la série d'origine.
Les méthodes sort() & reverse() ne peuvent s'appliquer qu'à une liste et modifient cette séquence.
Par contre on peut appliquer la fonction générique sorted() à n'importe quelle séquence (liste, chaine, tuple,set).
Cette différence de syntaxe découle de la POO (Programmation Orienté Objet ; pour les attributs et méthodes d'une classe il faut utiliser la notation pointée.
J'apporte quelques précisions complémentaires sur cette classe.
Donc pour obtenir une séquence d'entiers mutable l'astuce consiste à convertir un objet "range" en objet "list" ou "set".
L'image est grivoise mais le discours qui suit est des plus sérieux.
Je rappelle que dans un chapitre précédent, nous avons vu qu'il était facile de produire une chaine à partir d'une liste OU d'un tuple OU d'un dictionnaire OU d'un ensemble) via la méthode join(). Il est en effet, souvent plus simple de manipuler une chaine qu'une énumération d'éléments.
La liste des méthodes applicable à une chaine est impressionnante.
Pour réchercher un caractère (ou plusieurs) dans une chaine, vous pensez à index() mais il existe aussi find(), rindex()
et rfind(), startswith(), endswidth() ainsi que les opérateurs "in" et "not in".
Attention la méthode find() n'existe que pour la classe "str".
Exemple :
lstrip() efface les espaces en début de chaine, rstrip() efface les espaces en fin de chaine ;
strip() équivaut à lstrip().rstrip().
Pour effacer les espaces en milieu de chaine il faut utiliser de la façon suivante : replace(" " ."") (remplacer espace par rien).
Les apparences sont trompeuses ; l'objet machaine n'a pas été modifié ! Cet objet "str" contient toujours des espaces au début comme l'indique la commande 5
Un objet string est immuable ! Vous ne pouvez pas modifier le contenu d'une chaine.
Vous devez donc créer une nouvelle chaine bénéficiant
des modifications (commande 6) ; la nouvelle chaine peut avoir le même nom que la chaine d'origine (commande 7).
Les méthodes strip(), lstrip() & lstrip() sans arguments effacent les espaces. Mais vous pouvez argumenter ces méthodes.
Exemple : on souhaite débarasser une chaine des espaces,étoiles et tirets.
Pour effacer des caractères parasites en milieu de de chaine l'astuce consiste à utiliser replace()
avec en deuxième argument une chaine vide.
Exemple ci-dessous.
Le 'slicing" a déjà été évoqué. Une simple expression entre crochets dit beaucoup de choses. Aussi la compréhension de cette expression n'est pas toujours facile. Sachez que l'indice peut être une valeur négative afin d'extraire à partir de la fin (ou droite de la chaine).
Donc le cadre du "slicing", l'indice peut avoir une valeur négative ; ce qui veut dire : extraire à partir de la fin (ou de la droite).
Dans des chaines on trouve le mon d'une espèce animal, nom précédé OU suivi d'un code indiquant le taxon : "bi" comme bivalve ;
"ga" comme gastéropode.
On veut afficher seulement le nom de l'espèce ; il faut donc pratiquer le "slicing" pour se débarasser du code.
On affiche uniquementn le nom de l'espèce.
Rappelez vous, dans le chapitre 6 j'ai évoqué le code de César : un système de cryptage simple reposant sur un décalage de n lettres.
Grâce au "slicing" j'obtiens la table de conversion ("a" devient "c" , "b" devient "d" ... "z" devient "b") dans l'hypothèse d'un décalage de 2 (valeur de n).
Notez que l'expression entre crochets peut être une variable.
Voilà une problèmatique que vous allez rencontrer souvent en programmation Python.
En effet la fonction input() retourne toujours une donnée de type 'str' même si vous n'avez saisi que des chiffres.
Tests dans la console :
La fonction int(chaine) convertit une chaine en entier si celle-ci ne contient qu'une suite de chiffres mais "plante" si
le format de la chaine est celle d'un flottant.
La fonction eval(chaine) peut convertir une chaine en flottant.
Employer la fonction générique 'list' n'est pas la bonne solution : chaque caractère de la chaine devient un item de la liste.
Par contre la méthode split() produit une liste où chaque mot de la chaine d'origine devient un item de la liste.
Je vais maintenant revenir sur les listes au sens strict : objet "list".
Une liste est mutable : on peut modifier son contenu initial.
Il s'agit ici d'une "piqure de rappel". Toutes ces méthodes ont déjà été évoquées dans des chapitres précédents.
Je signale qu'il existe aussi les méthodes extend() pour ajout N éléments en fin de liste et insert(position, valeur) pour
insérer un élément au milieu d'une liste.
Il s'agit aussi de rappels.
Pour créer un objet 'tuple' à partir d'une liste il faut utiliser la fonction tuple()
Pour produire un ensemble à partir d'une liste il faut utiliser la fonction set()
Notez que la fonction set() est "intelligente" : produit bien un ensemble (pas de doublons même s'ils existe dans la série d'origine).
Un ensemble est une liste qui interdit les doublons.
Un ensemble est une structure triable mais pas réversible.
Un ensemble est itérable : peut être parcourue par un FOR.
Si vous tentez d'ajouter dans une séquence un élément qui existe déjà, il y a échec mais sans message d'erreur.
Attention la méthode n'est pas "append" mais "add".
La méthode remove() peut s'appliquer à un ensemble mais il faut lui préférer la méthode discard() : pas de message éventuel
d'erreur
Pour terminer je vous montre aussi qu'un ensemble n'est ni tranchable ni indexable.
Je rappelle que concernant les ensembles il existe auss les opérations union & intersection qui ont déjà été abordées dans le chapitre 8.
Je vous renvoie à ce chapitre : Tuto Python - chapitre 8
Un dictionnaire (tableau associatif dans d'autres langages) est une structure qui comprend non pas des éléments mais des paires "clé : valeur" appelées items.
Un dictionnaire est une structure itérable mais la syntaxe de l'itération est un peu plus complexe que pour les autres types d'itérables.
Selon que vous voulez afficher les items (clé-valeur) OU seulement les clés OU seulement les valeurs il faut écrire :
nomDict.items() / nomDict.keys() / nomDict.values avec "nomDict" : nom de la variable contenant le dictionnaire.
Un array Python c'est une liste qui ne comprend qu'un seul type d'élément ; le type défini lors de la création du "tableau".
Pour créer et manipuler un array il faut importer le module array.
Les types possibles sont limités : caractère, entier, flottant.
Commandes à saisir pour vous familiariser avec cette structure :
J'ai importé la totalité du module array.
J'ai créé un "array" nommé "tab" ne pouvant contenir que des entiers grâce à la fonction range().
Je vous montre qu'un array est sliceable ; il est aussi indexable.
J'ai tenté d'ajouter 'r' à l'array : échec. Par contre je peux ajouter l'entier 10.
J'ai ensuite créé un array nommé "voyelles" composé de lettres (type vaut 'u').
On peut parcourir un array selon les mêmes techniques qu'une liste (for ... in ... OU for ... in enumerate ...).
Il s'agit donc d'une structure itérable.