Vous êtes sur la page 1sur 16

Présentation du cours de

Statistique de première
année AgroParisTech
Définition de l’ingénieur AgroParisTech
Une formation à la complexité du vivant
•La spécificité de l’ingénieur AgroParisTech repose sur
une formation intégrant les sciences et technologies du
vivant et de l’environnement aux sciences de
l’ingénieur et aux sciences humaines, économiques et
sociales. …

•Au terme de son cursus, il possède, en particulier, des


capacités à : analyser et modéliser des systèmes
complexes et incertains
Pourquoi des modèles
mathématiques de la réalité ?
Propriétés du langage mathématique

pas ambigu, oblige à la rigueur


donne des prédictions chiffrées
international
modélise les phénomènes complexes
modélise l’aléatoire
permet de tester des hypothèses
réfutable
pluridisciplinaire
Les méthodes Statistiques à
AgroParisTech : Pourquoi?
Pour comprendre : elles sont nécessaires dans le domaine
des sciences : l’expérimentation et les enquêtes en
Biologie, Agronomie, Sciences alimentaires,
Environnement, Climat…donne des résultats chiffrés
qu’il faut analyser en tenant compte de la variabilité du
matériel expérimental
Pour agir : évaluation des incertitudes, gestion des
risques, analyse et prédiction de l ’environnement
économique, contrôle de qualité
Une opportunité pour le premier emploi : les agros sont
connus comme « bons en statistique », compétence
recherchée par les employeurs. L ’ histoire des
méthodes statistiques a commencé en agronomie,
biométrie, biostatistique,
Les méthodes statistiques sont
demandées par les autres disciplines
SVS SIAFFE SESG
génomique, bioinformatique agriculture de Enquêtes, SPAB
écologie, précision, amélioration Marketing, Génie des
génétique quantitative des plantes, gestion de gestion équipements,
nutrition humaine l’espace agricole, industrielle et procédés,
épidémiologie évaluation des risques financière, chaîne du froid
environnementaux prévision

Modélisation
Statistique, Mécanique Bases de
mathématique
Analyse des des fluides, Optimisation données,
des
données thermody- mathématique Algorithmique
systèmes
expérimentales namique
dynamiques
Quel genre de Mathématiques ?
• Contenu
Probabilité
Statistique Mathématique
Algèbre linéaire, calcul matriciel
• Pédagogie
• Mathématique formalisée: définition,
démonstration, conclusion
• Mathématique appliquée : on vise des
résultats opérationnels, basée sur des
exemples réels
– peu de démonstrations
– utilisation de logiciels professionnels (EXCEL,
MATLAB, SAS, R)
– travail sur projet (en deuxième année)
Enseignement des Probabilités et
des Statistiques à AgroParistech
Première année
• Tronc commun (22h) : Inférence statistique, estimations et tests
d’hypothèses, régression simple
• Module intégratif: Modélisation en biologie des populations : de la
structure des génomes à l’extinction des populations

Seconde année
• Tronc commun de statistique (25h) : modèle linéaire, analyse des
données, apprentissage du logiciel R
• Modules optionnels :
• Gestion de la qualité,
• Méthodes Statistiques pour l’Environnement
• Méthodes et modèles d ’aide à la décision,
Enseignement des Probabilités et
des Statistiques à AgroParisTech

• Troisième année : Master M2 Mathématique pour


les Sciences du Vivant avec Paris-Sud, l’X, l’ENS

– 1-8 étudiants AgroParisTech par an font l’option


Statistique Appliquée, biostatistiques ;
– recherche : Ens. Sup, INRA, CNRS, INSERM,
CIRAD, IRD, IRSTEA.
– Bureaux d’études environnement, climat,
banques, compagnies d’assurances, industrie
alimentaire, sociétés pharmaceutiques
Pourquoi des modèles statistiques ?

Entrée, X Processus (biologique) Sortie, Y


trop complexe pour
être décrit en détail

Modèle Statistique : Y = f(X) + E


E est une variable aléatoire qui traduit la
variabilité (biologique)
Idée

Entrée X Sortie Y
Processus biologique

Modèle Statistique : Y = m +
E
On connaît certains éléments de fonctionnement du
processus mais pas tous. De plus les éléments sont
reliés entre eux (boucles de rétroaction…) trop
complexes. On renonce (provisoirement) à tout
comprendre et prédire.
On remplace le modèle détaillé fondamental par un
modèle grossier.
E contient tous les phénomènes volontairement
ignorés
Intérêt

1. on peut répondre à des questions simples :


le traitement est-il efficace? Quelle est la
précision du résultat?
2. on peut intégrer des connaissances de type
biologique dans le modèle
3. on peut utiliser le modèle pour prédire le
comportement du processus
sans le comprendre complètement
Applications:

Agronomie (rendement, teneur en protéines, …)


Génétique (amélioration des plantes, sciences animales)
Epidémiologie végétale ou animale,
Pollution (des eaux, de l’air, du sol …),
Climat (crues, avalanches, vagues de chaleur,…),
Santé: diagnostic automatique,
Indicateurs économiques,
Comportement d’un consommateur,...
Plan des cours-TD

• 0. Rappels de probabilité (TD)


• 1. Estimation de paramètres
• 2. Tests d’hypothèse
• 4. Régression
Y = m +aX + E
Travail autonome à faire en
plus du cours et des TD
• Lire le chapitre du livre avant le cours et avant le TD
correspondant

• QUIZ après chaque chapitre

• Devoirs

• Faire les exercices du livre avant l’examen

• Soutien:
– pour les admissions parallèles
– matériel sur la plateforme Tice
Contrôle des connaissances
La note du module de Statistique est la moyenne
de la note du contrôle écrit et de celle des
devoirs, quizz, avec un seuil éliminatoire
appliqué à la note de l’examen

• Z = 0.5[Y+0.2(Q1+Q2+Q3+
• 0.5(X1+X2+X3+X4))] si Y >=6
• Z = Y si Y < 6

où Y est la note du contrôle écrit, Xi est la note du


devoir i, Qi la note du Quizz i
puis intégration de la note dans la note ECTS du bloc
Sciences de l’Ingénieur Modélisation Mathématiques
Date COURS/TD Contenu Chapitre à lire Devoi
avant le TD

16/10 TD 1 Probabilités Chapitre 7 Devoir


23/10 TD 2 Probabilités Chapitre 7
28/10 COURS 1 Présentation générale
+ Estimation
30/10 TD 3 Estimation Chapitre 3 Devoir
31/11 COURS 2 Estimation et tests
4/11 TD 4 Intervalle de confiance Chapitre 3
13/11 TD 5 QUIZ+ test Chapitre 3 Devoir
25/11 TD 6 Tests d'hypothèses Chapitre 4
26/11 COURS 3 Tests d'hypothèses Chapitre 4
27/11 TD 7 Comparaison Chapitre 5 Devoir
4/12 TD 8 QUIZ + Khi2 Chapitre 5
6/12 TD 9 Régression linéaire Chapitre 6
11/12 TD 10 QUIZ + Régression linéaire Chapitre 6
18/12 TD 11 Regression linéaire

16/1 Examen écrit Seul document autorisé : le livre, calculette conseillée