Vous êtes sur la page 1sur 10

Machine Learning (ML) est un modèle d’intelligence artificielle qui apprend seul grâce à l’analyse

d’un jeu de données

Type d’apprentissage :
Apprentissage étiqueté :

Les données sont étiquetées

Consiste à superviser l’apprentissage de la machine on lui montre des exemples des données de la
tâche qu’elle doit réaliser

Application : reconnaissance vocale

vision par ordinateur

Etapes :

1. Importer les données


2. Modéliser
3. Calculer la fonction coût
4. Développer un algorithme d’apprentissage

Apprentissage non étiqueté :


Les résultats qu’on cherche à prédire ne sont pas disponibles dans le jeu de données

On applique un algorithme permettant de trouver les similarités et distinctions au sein des
données et à regrouper ensemble les data qui partagent des caractéristiques communes

Apprentissage par renforcement :


Régression linéaire (RL) :

Objectif :
Trouver une fct de prédiction qui décrit la relation entre X et Y

X : est une variable quantitative ou qualitative

Y : variable cible quantitative

La fct f(X)=Y (Avec f est une fct linéaire)

Les données d’entrainement : servent pendant la phase d’apprentissage

Les données de test : permettent d’évaluer la qualité de prédictions

Modélisation : RL Simple Vs RL Multiple


RL SIMPLE : une seule variable explicative X

RL MULTIPLE : Plusieurs variables explicative Xi (i=1,….n)


On cherche à trouver la meilleure approximation de couple (a,b) ,tel que la fct
soit le plus proche de l’ensemble des points des données => Trouver la
meilleure relation linéaire reliant la valeur d’entrée x et la variable cible y

La fct cout : est la moyenne de toutes les erreurs

Méthodes d’optimisation :
-Méthodes de moindres carrés (des prb simples)

-Gradient descend

Différence entre reg linéaire et reg logistique


Ce fascicule est dédié à la Régression Logistique. Il s'agit d'une technique de modélisation qui, dans
sa version la plus répandue, vise à prédire et expliquer les valeurs d'une variable catégorielle binaire
Y (variable à prédire, variable expliquée, variable dépendante, attribut classe, variable endogène) à
partir d'une collection de variables X continues ou binaires (variables prédictives, variables
explicatives, variables indépendantes, descripteurs, variables exogènes). Elle fait partie des méthodes
d'apprentissage supervisé [13] ; elle peut s'inscrire dans le cadre de la régression linéaire généralisée
[7] (Chapitre 5, pages 83-97) ; elle peut être vue comme une variante de la régression linéaire
multiple, bien connue en économétrie [6] (Chapitre IV, pages 67-77).

167 zi pratique_regression_logistique.pdf (planchet.net)

Les similitudes entre la régression linéaire et la régression logistique


 La régression linéaire et la régression logistique sont des algorithmes
d'apprentissage automatique supervisés.
 Régression linéaire et régression logistique, les deux modèles sont une
régression paramétrique, c'est-à-dire, les deux modèles utilisent des
équations linéaires pour les prédictions.
Ce sont toutes les similitudes que nous avons entre ces deux
modèles.

Cependant, en termes de fonctionnalité, ces deux sont


complètement différents. Ci-dessous les différences.

Différences entre la régression linéaire et la régression logistique


 La régression linéaire est utilisée pour gérer les problèmes de régression,
tandis que la régression logistique est utilisée pour gérer les problèmes de
classification.
 La régression linéaire fournit une sortie continue, mais la régression
logistique fournit une sortie discrète.
 Le but de la régression linéaire est de trouver la meilleure droite
d'ajustement, tandis que la régression logistique a une longueur d'avance et
ajuste les valeurs de la ligne à la courbe sigmoïde.
 La méthode pour calculer la fonction de perte en régression linéaire est
l'erreur quadratique moyenne, alors que pour la régression logistique c'est
l'estimation du maximum de vraisemblance.
Noter: Lors de la rédaction de cet article, J'ai supposé

X2

Un aperçu rapide des algorithmes de régression dans l'apprentissage automatique | Haut-parleur de


données (datapeaker.com)

Régression linéaire vs régression logistique : différences et fonctionnement - Voxco

Ma rédaction :

Dans le cadre d’étude d’apprentissage automatique supervisé, on peut également citer la régression linéaire comme un algorithme couramment utilisée pour prédire des

résultats numériques en fonction des variables indépendantes

différence entre régression logistique et régression linéaire La


régression logistique et la régression linéaire sont toutes deux des
méthodes statistiques utilisées pour prédire des résultats
numériques en fonction des variables indépendantes. Cependant, il
existe quelques différences clés entre ces deux méthodes :
Régression logistique : 1. Le modèle de régression logistique est un
modèle de classification. Il est utilisé pour prédire la probabilité
d'une variable cible prenant une valeur binaire (0 ou 1). 2. Il prédit la
probabilité d'une réponse binaire (ou catégorique) en fonction des
variables indépendantes. 3. Les données de régression logistique
sont transformées en une courbe sigmoidale. Régression linéaire : 1.
La régression linéaire est un modèle prédictif qui est utilisé pour
prédire
La régression logistique est une version spécialisée de la régression
linéaire qui est spécifique à la prédiction des probabilités. Elle est utilisée
pour prédire une variable binaire (par exemple, une prédiction de classe ou
vrai/faux). Elle est très similaire à la régression linéaire, mais elle est plus
appropriée pour les problèmes de classification. D'un autre côté, la
régression linéaire est une méthode de prédiction qui utilise une relation
linéaire entre les variables indépendantes et la variable dépendante pour
prédire une valeur continue. Elle est principalement utilisée pour des
problèmes de prédiction de type régression.

La régression logistique est un type de modèle de régression utilisé pour


prédire des variables catégoriques à l'aide de variables indépendantes. La
régression logistique est un modèle de prédiction binaire, car elle prédit un
résultat binaire, à savoir "1" ou "0". La régression linéaire est un modèle
de régression qui prédit une variable cible numérique à l'aide de variables
indépendantes. La régression linéaire est un modèle de prédiction à
plusieurs variables, car elle peut prédire une variable cible à l'aide de
plusieurs variables indépendantes.

La régression linéaire est une méthode de modélisation statistique qui est


utilisée pour trouver une relation entre une variable dépendante et une ou
plusieurs variables indépendantes. La régression linéaire tente de trouver
la meilleure droite de régression, qui représente une ligne qui représente
le mieux les données. Dans la régression linéaire, la variable dépendante
est une variable quantitative continue. La régression logistique est une
méthode de modélisation statistique qui est utilisée pour estimer la
probabilité d'occurrence d'un événement qui est lié à une ou plusieurs
variables indépendantes. La régression logistique tente de trouver une
fonction logistique qui représente le mieux les données. Dans la régression
logistique, la variable dépendante est une variable qualitative binaire
(c'est-à-dire 0 ou 1).
La régression logistique et la régression linéaire sont deux types de
modèles de régression utilisés pour prédire des variables continues ou
catégorielles. La principale différence entre les deux est que la régression
logistique est utilisée pour prédire des variables catégorielles, tandis que
la régression linéaire est utilisée pour prédire des variables continues. La
régression logistique est également plus robuste aux erreurs de
modélisation que la régression linéaire, ce qui signifie qu'elle peut gérer
plus facilement les données manquantes ou aberrantes. La régression
logistique est souvent plus appropriée pour les modèles à prédiction
binaire, tandis que la régression linéaire est plus appropriée pour les
modèles à prédiction multi-classes.

estimation de la vraisemblance maximale

Cette méthode repose sur la dérivation de la fonction de la vraisemblance


ou de la fonction de log vraisemblance. À chaque itération, un point est
calculé et comparé avec le précédent pour vérifier si la fonction a atteint
son optimum. Si ce n'est pas le cas, le processus est répété jusqu'à ce que
l'optimum soit atteint. Une fois cet optimum atteint, les valeurs des
paramètres sont considérées comme les estimations du maximum de
vraisemblance.

Plan

I. Introduction A. Définition du diabète B. Définition de la régression


logistique II. Démarche méthodologique A. Détermination des
variables d'intérêt B. Évaluation des données C. Analyse des
données D. Choix des modèles E. Construction et analyse des
modèles III. Résultats A. Présentation des résultats B. Discussion
des résultats IV. Conclusion A. Résumé des résultats B. Limites
de l'étude C. Pistes de recherche futures

Introduction generale :
Cette étude visait à analyser les facteurs pouvant être associés à
la présence d'une maladie diabétique. Pour cela, nous utilisons la
régression logistique, une méthode statistique pour déterminer la
relation entre les variables indépendantes et dépendantes. En
particulier, nous chercherons les variables les plus susceptibles
de prédire la présence d'une maladie diabétique. Nous
examinerons également la relation entre différentes variables et
la présence d'une maladie diabétique, et leur impact sur la
prévalence de cette maladie. Enfin, nous discutons des
implications pratiques et des recommandations qui peuvent être
tirées de nos résultats

Le projet de fin d'études (PFE) visait à explorer les facteurs


associés à la présence d'une maladie diabétique à l'aide d'une
analyse de régression logistique. Le diabète est une maladie
grave qui touche de nombreuses personnes dans le monde. Par
conséquent, il est important que nous comprenions les causes de
cette maladie afin de mieux la prévenir et la traiter. La régression
logistique est un outil puissant d'analyse de données binaires et
catégorielles pour aider à identifier les facteurs associés à la
présence d'une maladie diabétique. Dans cette étude, nous
examinerons les données sur le diabète et les facteurs connexes
en utilisant la régression logistique pour mieux comprendre le
rôle du diabète et des facteurs connexes.

Le diabète est une maladie chronique qui touche des millions de


personnes dans le monde. Les complications associées à cette
maladie entraînent chaque année de nombreux handicaps et
décès. Il est donc important de comprendre les facteurs associés
à la présence de cette maladie afin de mieux l'identifier et de
faciliter des interventions ciblées pour la prévenir et la traiter.
Dans cette optique, les modèles de régression logistique sont un
outil analytique puissant qui peut être utilisé pour étudier les
facteurs associés au diabète. . La régression logistique est un
modèle statistique utilisé pour déterminer la relation entre les
variables indépendantes et dépendantes. Il fonctionne sur des
données binaires ou catégorielles où la variable dépendante est
représentée par une variable binaire ou catégorique. En cas
d'étude des facteurs associés à la présence d'une maladie
diabétique, la variable dépendante sera la présence ou l'absence
de diabète. Les variables indépendantes seront des facteurs
considérés comme associés à la présence du diabète, tels que x,
x, etc.

La régression logistique peut fournir des informations précieuses sur la


relation entre les variables indépendantes et dépendantes, ce qui peut
aider à développer des stratégies de prévention et de traitement du
diabète. Il peut également aider à identifier les facteurs de risque et à
évaluer leur impact sur le diabète. Enfin, la régression logistique peut
également être utilisée pour tester et comparer différents modèles et
hypothèses sur les facteurs associés au diabète. En un mot, la régression
logistique est un outil analytique qui peut être utilisé pour étudier les
facteurs associés au diabète. Sa force réside dans sa capacité à identifier
les relations entre les variables indépendantes et dépendantes et à fournir
des informations précieuses sur les facteurs de risque qui peuvent être
utilisées pour concevoir des interventions ciblées pour prévenir et traiter le
diabète.

Show Changes
Check For Plagiarism
PdfWord

L'objectif de ce projet de fin d'études est d'étudier la présence de


la maladie du diabète et les facteurs potentiels associés à cette
maladie. Pour ce faire, nous allons utiliser une technique
statistique appelée régression logistique. La régression logistique
est un type d'analyse statistique qui permet de quantifier le lien
entre une variable dépendante (le diabète) et une ou plusieurs
variables indépendantes (les facteurs associés). La régression
logistique est particulièrement utile car elle peut être utilisée
pour prédire le risque de développer une maladie et évaluer les
effets des interventions. Afin de mener à bien cette étude, nous
utiliserons une base de données à grande échelle qui contient les
données médicales de plus de 10 000 patients. Nous allons
extraire des données sur les facteurs associés à la présence de
diabète, tels que l'âge, le poids, le mode de vie, les antécédents
médicaux et les antécédents familiaux. Ensuite, nous allons
utiliser la régression logistique pour estimer la probabilité de
présence de diabète en fonction des variables indépendantes.
Nous allons également examiner les variables qui sont associées
à un risque accru de diabète et les variables qui sont associées à
un risque réduit de diabète. De plus, nous allons évaluer
l'efficacité des interventions médicales pour réduire le risque de
diabète en utilisant la régression logistique. Nous allons
également examiner comment les interventions médicales et les
facteurs environnementaux peuvent être combinés pour réduire le
risque de diabète. Enfin, nous allons discuter des implications de
cette étude pour le dépistage et le traitement du diabète. Nous
souhaitons que ce projet de fin d'études fournisse un aperçu
important de la présence de la maladie du diabète et des facteurs
associés à cette maladie. Nous espérons également que cette
étude pourra être utile pour informer les décisions cliniques et les
stratégies de prévention et de traitement du diabète.

Vous aimerez peut-être aussi