« Python pour le calcul scientifique/Statistiques » : différence entre les versions

Un livre de Wikilivres.
Contenu supprimé Contenu ajouté
intro
→‎Méthodes de matrices : Statistiques descriptives
Ligne 15 : Ligne 15 :
* <code>mean()</code> : moyenne ;
* <code>mean()</code> : moyenne ;
* <code>std()</code> : écart type ''({{lang|en|standard deviation}})''.
* <code>std()</code> : écart type ''({{lang|en|standard deviation}})''.

== Statistiques descriptives ==

NumPy fournit la fonction <code>quantile()</code> qui détermine les quantiles avec la syntaxe :
<source lang="python">
np.quantile(M, q)
</source>
où <code>M</code> est une matrice (ou une liste, un n-uplet, bref un itérable de nombres) et <code>q</code> est un quantile ou un vecteur de quantiles sous la forme d'un nombre entre 0 et 1. Par exemple, pour avoir les quartiles :
<source lang="python">
np.quantile(M, [0, 0.25, 0.5, 0.75, 1])
</source>
Si un des éléments de la matrice est un NaN, le résultat est un NaN. Pour éviter cela, on peut utiliser la fonction <code>nanquantile()</code> qui ignore les NaN.

Les fonctions <code>percentile()</code> et <code>nanpercentile()</code> donnent les centiles ; on indique alors le centile que l'on veut sous la forme d'un nombre entier entre 0 et 100.

Nous disposons également des fonctions suivantes :
* <code>amin()</code>, <code>nanmin()</code> : minimum ;
* <code>amax()</code>, <code>nanmax()</code> : maximum ;
* <code>ptp()</code> : amplitude.

Notons que pour toutes les fonctions, il est possible d'indiquer l'axe selon lequel on effectue le calcul. Par exemple,
<source lang="python">
M = np.arange(9).reshape(3, 3)
# [[0, 1, 2]
# [3, 4, 5]
# [6, 7, 8]]
print(np.quantile(M, [0.25, 0.5], 0))
# [[1.5 2.5 3.5] : 1er quartile des colonnes
# [3. 4. 5. ]] : médiane des colonnes
print(np.quantile(M, [0.25, 0.5], 1))
# [[0.5 3.5 6.5] : 1er quartile des lignes
# [1. 4. 7. ]] : médiane des lignes
</source>


== Notes et références ==
== Notes et références ==

Version du 23 mars 2019 à 01:53

Le module NumPy fournit des fonctions statistiques.

Rappelons que dorénavant les programmes commencent tous par :

import numpy as np
import matplotlib.pyplot as plt

Méthodes de matrices

Rappel : la classe des matrices (ndarray) dispose de méthodes permettant de calculer des statistiques sur les éléments des matrices :

  • min() : minimum des valeurs ;
  • max() : maximum des valeurs ;
  • ptp() : écart amplitude « max – min » (peak to peak) ;
  • mean() : moyenne ;
  • std() : écart type (standard deviation).

Statistiques descriptives

NumPy fournit la fonction quantile() qui détermine les quantiles avec la syntaxe :

np.quantile(M, q)

M est une matrice (ou une liste, un n-uplet, bref un itérable de nombres) et q est un quantile ou un vecteur de quantiles sous la forme d'un nombre entre 0 et 1. Par exemple, pour avoir les quartiles :

np.quantile(M, [0, 0.25, 0.5, 0.75, 1])

Si un des éléments de la matrice est un NaN, le résultat est un NaN. Pour éviter cela, on peut utiliser la fonction nanquantile() qui ignore les NaN.

Les fonctions percentile() et nanpercentile() donnent les centiles ; on indique alors le centile que l'on veut sous la forme d'un nombre entier entre 0 et 100.

Nous disposons également des fonctions suivantes :

  • amin(), nanmin() : minimum ;
  • amax(), nanmax() : maximum ;
  • ptp() : amplitude.

Notons que pour toutes les fonctions, il est possible d'indiquer l'axe selon lequel on effectue le calcul. Par exemple,

M = np.arange(9).reshape(3, 3)
# [[0, 1, 2]
#  [3, 4, 5]
#  [6, 7, 8]]
print(np.quantile(M, [0.25, 0.5], 0))
# [[1.5 2.5 3.5]  : 1er quartile des colonnes
#  [3.  4.  5. ]] : médiane des colonnes
print(np.quantile(M, [0.25, 0.5], 1))
# [[0.5 3.5 6.5]  : 1er quartile des lignes
#  [1.  4.  7. ]] : médiane des lignes

Notes et références


Polynômes < >