Pandas

Besoin

Faire de la data science en Python.

Analyse

Bibliothèque logicielle de PyData.

Pandas manipule le concept de Data Frame (df), qui est un tableau de données.

Implémentation

Le module Panda doit avant tout être importé. Par exemple :import pandas as pd

API Commentaire
Lecture de fichier df = pd.read_csv('path/to/myFile.csv', sep ='|', encoding='iso-8859-1')<br> df = pd.read_excel('path/to/myFile.xls') CSV, Excel
Affichage d'un extrait df.head() 5 premières lignes, premières et dernières colonnes
Fusion de df fusion = df1.merge(df2, on='colonne1')
Appliquer une fonction sur une colonne df['MyColumn'].apply(lambda x: someTransform(x)))

Déploiement