Vous êtes sur la page 1sur 1

Dans cette vidéo, nous allons parler de la corrélation entre les différentes

variables. La corrélation est une mesure statistique pour qui mesure dans quelle
mesure différentes variables sont interdépendantes. En d'autres termes, lorsque
nous examinons deux variables au fil du temps, si une variable change comment cela
affecte-t-il le changement dans l'autre variable ? Par exemple, on sait que le
tabagisme est corrélé au cancer du poumon puisque vous avez plus de chances de
contracter un cancer du poumon si vous fumez. Dans un autre exemple, il existe une
corrélation entre les variables parapluies et de pluie, où plus de précipitations
signifie que plus de gens utilisent des parapluies. Aussi, s'il ne pleut pas, les
gens ne porteraient pas de parapluies. Par conséquent, nous pouvons dire que les
parapluies et la pluie sont interdépendants et par définition ils sont corrélés. Il
est important de savoir que la corrélation n'implique pas de causalité. En fait,
nous pouvons dire que le parapluie et la pluie sont corrélés, mais nous n'aurions
pas assez d'informations pour dire si le parapluie a causé la pluie ou la pluie a
causé le parapluie. En science des données, nous traitons généralement plus de
corrélation. Regardons la corrélation entre la taille du moteur et le prix. Cette
fois, nous allons visualiser ces deux variables en utilisant un diagramme de points
et une ligne linéaire ajoutée appelée une ligne de régression, qui indique la
relation entre les deux. L'objectif principal de cette parcelle est de voir si la
taille du moteur a un impact sur le prix. Dans cet exemple, vous pouvez voir que la
ligne droite à travers les points de données est très raide , ce qui montre qu'il y
a une relation linéaire positive entre les deux variables. Avec l'augmentation des
valeurs de la taille du moteur, les valeurs du prix augmentent aussi et la pente de
la ligne est positive. Il y a donc une corrélation positive entre la taille du
moteur et le prix. Nous pouvons utiliser seaborn.regplot pour créer le diagramme de
dispersion. À titre d'exemple, examinons maintenant la relation entre miles
autoroutes par gallon pour voir son impact sur le prix de la voiture. Comme nous
pouvons le voir dans cette parcelle, lorsque la valeur des miles routiers par
gallon augmente le prix de la valeur diminue. Il y a donc une relation linéaire
négative entre les miles routiers par gallon et le prix. Bien que cette relation
soit négative, la pente de la ligne est raide , ce qui signifie que les milles
routiers par gallon sont toujours un bon prédicteur du prix. Ces deux variables
auraient une corrélation négative. Enfin, nous avons un exemple de faible
corrélation. Par exemple, les régimes de pointe bas et les valeurs élevées de
régime de pointe ont des prix bas et élevés. Par conséquent, nous ne pouvons pas
utiliser RPM pour prédire les valeurs.

Vous aimerez peut-être aussi