Vous êtes sur la page 1sur 2

Kernel Density Estimation

Unknown Author
February 17, 2014

1 Estimation par noyau gaussien avec SciPy: illustration


Lestimation par noyau gaussien est une technique de lissage de donnes. Elle permet de trouver une estimation de la densit de probabilit des valeurs dun chantillon. Nous allons voir comment la mettre en oeuvre avec SciPy.Dabord, on importe Numpy (calcul sur les tableaux de nombres) et Pylab (qui nous servira surtout pour les reprsentations graphiques). import numpy as np In [5]: import pylab as pl On gnre des donnes alatoires qui vont constituer un chantillon provenant de deux populations gaussiennes, dcart-types et moyennes diffrentes. MyData1 = np.random.randn(1000) # m = 0, sd = 1 In [20]: MyData2 = 3.0*np.random.randn(1000) + 5. # m = 5, sd = 3 Quelle est la densit de probabilit associe cet chantillon? Pour le savoir, on importe la fonction gaussian_kde du module SciPy.stats : from scipy.stats.kde import gaussian_kde In [14]: my_pdf = gaussian_kde(np.append(MyData1, MyData2)) In [15]: fig1 = pl.figure() In [19]: ax1 = fig1.add_subplot(111) ax1.hist(np.append(MyData1, MyData2),bins = 50, label = "Noisy data",normed = True) x = np.linspace(-10,15.,3000) ax1.plot(x, my_pdf(x), --, linewidth = 2, color = red, label="Fitted density") ax1.grid() ax1.legend() <matplotlib.legend.Legend at 0x54d8c10> Out [19]:

In []:

Vous aimerez peut-être aussi