Pandas

Pandas
Description de l'image Pandas logo.svg.
Description de l'image Dataframe manipulation.png.
Informations
Créateur Wes McKinneyVoir et modifier les données sur Wikidata
Développé par Wes McKinney, J. Brock Mendel (d), Joris Van den Bossche (d) et Jeff Reback (d)Voir et modifier les données sur Wikidata
Dernière version 2.2.2 ()[1]Voir et modifier les données sur Wikidata
Dépôt github.com/pandas-dev/pandasVoir et modifier les données sur Wikidata
Assurance qualité Intégration continueVoir et modifier les données sur Wikidata
Écrit en PythonVoir et modifier les données sur Wikidata
Système d'exploitation MultiplateformeVoir et modifier les données sur Wikidata
Type Bibliothèque logicielle Python (d)
Numerical software (d)Voir et modifier les données sur Wikidata
Licence Licence BSDVoir et modifier les données sur Wikidata
Documentation pandas.pydata.org/docs/user_guide/index.html#user-guideVoir et modifier les données sur Wikidata
Site web pandas.pydata.orgVoir et modifier les données sur Wikidata

modifier - modifier le code - voir Wikidata (aide) Consultez la documentation du modèle

Pandas est une bibliothèque écrite pour le langage de programmation Python permettant la manipulation et l'analyse de données. Elle propose en particulier des structures de données et des opérations de manipulation de tableaux numériques et de séries temporelles.

Pandas est un logiciel libre sous licence BSD[2]. Son nom est dérivé du terme Panel Data (en français "données de panel", un terme d'économétrie pour les jeux de données qui comprennent des observations sur plusieurs périodes de temps pour les mêmes individus). Son nom est également un jeu de mots sur l'expression "Python Data Analysis".

Entre 2007 à 2010, Wes McKinney a commencé à construire ce qui allait devenir Pandas alors qu'il était chercheur dans la société américaine AQR Capital.

Structures de données

Les principales structures de données gérées par cette bibliothèque sont :

  • Séries : stockage des données selon une dimension - grandeur en fonction d'un index
  • DataFrames : stockage des données selon 2 dimensions - lignes et colonnes
  • Panels : représentation des données selon 3 dimensions
  • Panels4D ou DataFrames avec des index hiérarchiques aussi nommés MultiIndex : représentation des données selon plus de 3 dimensions - hypercube.

Fonctionnalités de la bibliothèque

Les principales fonctionnalités de la bibliothèque sont :

Les voies critiques de la bibliothèque sont écrits en Cython ou C[3].

Exemples

Courbes

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

df = pd.DataFrame(np.random.randn(100, 5), columns=list('ABCDE'))
df=df.cumsum() # Return cumulative sum over a DataFrame or Series axis
df.plot()
plt.show()

Diagramme à barres

df = pd.DataFrame(np.random.rand(10, 5), columns=list('ABCDE'))
df.plot.bar(stacked=True)
plt.show()

Box plot

df = pd.DataFrame(np.random.rand(7, 5), columns=list('ABCDE'))
df.plot.box()
plt.show()

Histogramme

data = pd.Series(np.random.normal(size=100))
data.hist(grid=False)
plt.show()

Voir également

Références

  1. « Pandas 2.2.2 »,
  2. http://pandas.pydata.org/pandas-docs/stable/overview.html#license
  3. Andreas C. Müller, Sarah Guido, Introduction to Machine Learning with Python, O'Reilly, (ISBN 978-1449369415, lire en ligne)

Liens externes

  • Site web Pandas
  • https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.html
  • Dépôt GitHub de Pandas
  • Livre Python for Data Analysis
  • Livre Analyse de données en Python - Manipulation de données avec pandas, NumPy et IPython (traduction française de Python for Data Analysis)
  • https://en.wikipedia.org/wiki/AQR_Capital
  • Pandas and Python : Top 10
  • Pandas, une bibliothèque pour manipuler facilement des données (article sur le site LinuxFr)
v · m
Bibliothèques (Python)
Général Bibliothèque standard Python (Tkinter (Interface graphique standard) - Gadfly (BD)- Python Imaging Library (Traitement d'images) )
Interface graphique, manipulation d'images, de vidéos et de sons
Interface graphiques
Manipulation d'images et de vidéos
  • OpenCV
  • CV2
  • GDmodule
  • MoviePy
  • pyscreenshot
  • VideoCapture
  • Pillow(Python)
Manipulation de sons
  • pySonic
  • PyMedia
  • PMIDI
  • Mutagen
Sciences des données et mathématiques
Datascience
Mathématiques et calcul scientifique
Développement Web et Bases de données
Développement Web
Bases de donnée
Articles liés
  • icône décorative Portail de la programmation informatique
  • icône décorative Portail des logiciels libres