Bienvenue sur Scribd !

Modern Multivariate Statistical Techniques: - Nonparametric Density Estimation Xi Chen Nov 6

Transféré par

0% ont trouvé ce document utile (0 vote)

19 vues20 pages

This document discusses modern multivariate statistical techniques, specifically nonparametric density estimation (NPDE). NPDE allows estimation of a probability density function without specifying a parametric structure, making no distributional assumptions. Two common NPDE methods are discussed: kernel density estimation and histograms. Kernel density estimation provides a smoother density estimate than histograms by using a kernel function and window width to determine smoothness. Several methods for selecting the optimal window width are presented, including rule-of-thumb, cross-validation, and plug-in methods. The document provides an example applying NPDE to estimate the density of risk factors for coronary heart disease.

Description originale:

Nov 6 Lab Presentation

Titre original

Nov 6 Lab Presentation

Copyright

Formats disponibles

PPTX, PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

Droits d'auteur :

Formats disponibles

Téléchargez comme PPTX, PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

19 vues20 pages

Modern Multivariate Statistical Techniques: - Nonparametric Density Estimation Xi Chen Nov 6

Transféré par

Xi Chen

Droits d'auteur :

Formats disponibles

Téléchargez comme PPTX, PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 20

Rechercher à l'intérieur du document

Modern Multivariate

Statistical Techniques
--Nonparametric Density Estimation
Xi Chen
Nov 6

Multivariate Analysis
Classical Analysis:
Poor results for huge and complex data sets
The questions become more different
Computational cost of storing and processing data goes down

We need Modern Multivariate Analysis Techniques

Modern Data
Exploratory data analysis (EDA) 1977 Data mining
From simple dirty techs to big data.
Internet traffic data are described as ferocious
Human Genome Project has to deal with gigabytes (230 ( 109)
bytes) of genetic information
earth sciences have terabytes (240 ( 1012) bytes) and soon,
petabytes (250 ( 1015) bytes), of data for processing
Etc.

What is Data Mining?

Descriptive data mining: Search massive data sets
and discover the locations of unexpected structures or
relationships, patterns, trends, clusters, and outliers in
the data.
Predictive data mining: Build models and procedures
for regression, classification, pattern recognition, or
machine learning tasks, and assess the predictive
accuracy of those models and procedures when applied
to fresh data.
In machine-learning terms, descriptive data mining is known
as unsupervised learning, whereas predictive data mining is

Nonparametric Density Estimation

(NPDE)
What makes NPDE techniques so appealing to the data
analyst is:
they make no specific distributional assumptions and,
thus, can be employed as an initial exploratory look at the
data.

Suppose we wish to estimate a continuous probability

density function p of a random r-vector variate X ,
where
(1)

Nonparametric Density Estimation

(NPDE)
Any p that satisifies (1) is called a bona fide density.
Problem:
To estimate p without specifying a formal parametric structure

Loads of p is bona fide,

No finite number of parameters!
Is the density function a smooth or not (i.e. continuous), we
hope so, but certain application (X-ray transition tomography)
is discrete.

Nonparametric Density Estimation

(NPDE)
Earliest NPDE of a univariate density p was the
histogram. (Most time this is the first step for
analyzing data.)
Further: (np discrimination and time series)
Kernel
Orthogonal series
Nearest neighbor methods

NPDE Example: Coronary Heart

Disease

Statistical Properties of Density

Estimators
i.e. why we can claim certain estimators are better than
others (since they are not finite numbered.)
Unviased:
Consistency

The Histogram

Kernel Density Estimation

Given n iid univariate observations, x1, x2, , xn, drawn
from the density p, the kernel density estimator (2) of
p(x), xis used to obtain a smoother density estimate
than the histogram.
(2)
K is the kernel function, and the window width h
determines the smoothness of the density estimate.
h is too small density estimate too dependent upon the
sample values
h is too large oversmooths of removing interesting

Kernel Density Estimation

Popular ones: Gaussian Kernel with unbounded support,
and the polynomial kernels

Kernel Density Estimation

Kernel Density Estimation Example

Estimating the Window Width

Automated method to deterining the optimal window
width for any given data set
Rule-of-Thumb Method
Cross-Validation
Plug-in Methods

Rule-of-Thumb Method
We take p to be and K to be a standard Gaussian
kernel.
The optimal (ROT) window width for the above density
would be

S is the usual estimate for \

Become how to pick the s problem

Cross-Validation
In
the univariate case, the basic algorithm removes a single value, say xi, from
the sample, computes the appropriate density estimate at that xi from the
remaining n1 sample values,

and then chooses h to optimize some given criterion involving all values of i =
1,2,...,n.
The unbiased cross-validation choice of window width is the h that minimizes

g(x): standarlizing function

The End

Vous aimerez peut-être aussi

Infusion Therapy Study Guide Questions
Document94 pages
Infusion Therapy Study Guide Questions
Vin Lorenzo Campbell
Pas encore d'évaluation
Skills Reading
Document18 pages
Skills Reading
Himanshu Jain
Pas encore d'évaluation
July 22,2019
Document2 pages
July 22,2019
Eldie Ocariza
Pas encore d'évaluation
Alternative Delivery Modes of Education: School Heads' Development Program - Foundational Course - Module 1
Document47 pages
Alternative Delivery Modes of Education: School Heads' Development Program - Foundational Course - Module 1
Ruth Ribot
100% (1)
Beca FIU
Document3 pages
Beca FIU
Julio Altamirano
Pas encore d'évaluation
Machine Learning CNN
Document28 pages
Machine Learning CNN
abcd efgh
Pas encore d'évaluation
Surya International School Business Plan Final PDF
Document36 pages
Surya International School Business Plan Final PDF
Bahati Richardson
80% (5)
Constructive Alignment in A Curriculum
Document3 pages
Constructive Alignment in A Curriculum
MaryamLi
Pas encore d'évaluation
Parameter Estimation - PR
Document66 pages
Parameter Estimation - PR
anilipg07
Pas encore d'évaluation
w5 Classification
Document34 pages
w5 Classification
Swastik Sindhani
Pas encore d'évaluation
Data Mining: Review
Document13 pages
Data Mining: Review
ANMAR JAMEEL NAJI
Pas encore d'évaluation
MachineLearning - Algorithms - Tagged
Document35 pages
MachineLearning - Algorithms - Tagged
Anthony Corneau
Pas encore d'évaluation
Introduction To Data Science Exploratory Data Analysis
Document55 pages
Introduction To Data Science Exploratory Data Analysis
hunt4nothing
Pas encore d'évaluation
Data Preprocessing Part 3
Document31 pages
Data Preprocessing Part 3
new acc jeet
Pas encore d'évaluation
Enhancement of Qualities of Clusters by Eliminating Outlier For Data Mining Application in Education
Document27 pages
Enhancement of Qualities of Clusters by Eliminating Outlier For Data Mining Application in Education
diptipatil20
Pas encore d'évaluation
Introduction To Data Science Unsupervised Learning: CS 194 Fall 2015 John Canny
Document54 pages
Introduction To Data Science Unsupervised Learning: CS 194 Fall 2015 John Canny
Pedro Jesús García Ramos
Pas encore d'évaluation
Information Fusion For Wireless Sensor Networks: Methods, Models, and Classifications
Document26 pages
Information Fusion For Wireless Sensor Networks: Methods, Models, and Classifications
Bryan Ng
Pas encore d'évaluation
Data Mining: Kabith Sivaprasad (BE/1234/2009) Rimjhim (BE/1134/2009) Utkarsh Ahuja (BE/1226/2009)
Document32 pages
Data Mining: Kabith Sivaprasad (BE/1234/2009) Rimjhim (BE/1134/2009) Utkarsh Ahuja (BE/1226/2009)
Rule2
Pas encore d'évaluation
RNN LSTM
Document72 pages
RNN LSTM
5049 Harishchandra Kumar
Pas encore d'évaluation
Data Science Course Content
Document8 pages
Data Science Course Content
Qshore online training
Pas encore d'évaluation
Soft Computing-Unit1
Document28 pages
Soft Computing-Unit1
namak sung lo
Pas encore d'évaluation
17 dm2 Anomaly Detection 2022 23
Document113 pages
17 dm2 Anomaly Detection 2022 23
nimra
Pas encore d'évaluation
UNIT2SVMKNN
Document31 pages
UNIT2SVMKNN
Aditya Sharma
Pas encore d'évaluation
w2 - Fundamentals of Learning
Document37 pages
w2 - Fundamentals of Learning
Swastik Sindhani
Pas encore d'évaluation
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
Document42 pages
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
Dineshkannan Ravi
Pas encore d'évaluation
4701 f17 Final Summary 2
Document6 pages
4701 f17 Final Summary 2
Kaylah Kennedy
Pas encore d'évaluation
Data Mining 1
Document56 pages
Data Mining 1
Sidharth
Pas encore d'évaluation
Clustering
Document47 pages
Clustering
سارة شعير
Pas encore d'évaluation
Data Mining
Document26 pages
Data Mining
Jam One
Pas encore d'évaluation
CS194 Lec 06 EDA
Document40 pages
CS194 Lec 06 EDA
vijayust
Pas encore d'évaluation
Yum Yum D Giga
Document368 pages
Yum Yum D Giga
Siddhant Singhania
Pas encore d'évaluation
DES-IBM Certificate in Data Science
Document3 pages
DES-IBM Certificate in Data Science
Rupa Gupta
Pas encore d'évaluation
Estimation Theory Lec 1 - InTRODUCTION
Document21 pages
Estimation Theory Lec 1 - InTRODUCTION
Mohamed Sayed 201-600-075
Pas encore d'évaluation
Bia Unit-3 Part-2
Document43 pages
Bia Unit-3 Part-2
Nishant Gupta
Pas encore d'évaluation
A Short Course in Multivariate Statistical Methods With R
Document11 pages
A Short Course in Multivariate Statistical Methods With R
qwety300
Pas encore d'évaluation
DuongToGiangSon 517H0162 HW2 Nov-26
Document17 pages
DuongToGiangSon 517H0162 HW2 Nov-26
Son Tran
Pas encore d'évaluation
w6 Clustering
Document29 pages
w6 Clustering
Srisha Prasad Rath
Pas encore d'évaluation
W6 Clustering
Document29 pages
W6 Clustering
5599RAJNISH SINGH
Pas encore d'évaluation
Machine Learning: Dr. Windhya Rankothge (PHD - Upf, Barcelona)
Document44 pages
Machine Learning: Dr. Windhya Rankothge (PHD - Upf, Barcelona)
Ayola Jayamaha
Pas encore d'évaluation
Lecture 3: Handwriting Recognition and Classification
Document51 pages
Lecture 3: Handwriting Recognition and Classification
kunal13
Pas encore d'évaluation
A Comparative Study of The Rule of Thumb, Umbiased Cross Validation and The Shearther Jones-Direct Plug-In Approaches of Kernel Density Estimation Using Real Life Data
Document9 pages
A Comparative Study of The Rule of Thumb, Umbiased Cross Validation and The Shearther Jones-Direct Plug-In Approaches of Kernel Density Estimation Using Real Life Data
International Journal of Innovative Science and Research Technology
Pas encore d'évaluation
Unit 2 Mathematical Foundation of Big Data: - Syllabus
Document26 pages
Unit 2 Mathematical Foundation of Big Data: - Syllabus
sunandanpt21020
Pas encore d'évaluation
Mean-Shift Tracking: R.Collins, CSE, PSU CSE598G Spring 2006
Document93 pages
Mean-Shift Tracking: R.Collins, CSE, PSU CSE598G Spring 2006
nguyenduong994
Pas encore d'évaluation
8ad59658 1701235711480
Document36 pages
8ad59658 1701235711480
kashyaputtam7
Pas encore d'évaluation
Machine Learning, AI & Its Applications: Live Online Instructor-Led Training On
Document6 pages
Machine Learning, AI & Its Applications: Live Online Instructor-Led Training On
arekpanjen
Pas encore d'évaluation
Machine Learning For Astronomy: Rob Fergus
Document80 pages
Machine Learning For Astronomy: Rob Fergus
Mastering Zinc Oxide
Pas encore d'évaluation
Colloquium - Bayesian Optimization Algorithm - Sajib Kumar Biswas
Document25 pages
Colloquium - Bayesian Optimization Algorithm - Sajib Kumar Biswas
cs
Pas encore d'évaluation
7 - Conceptual Data Science
Document22 pages
7 - Conceptual Data Science
Putri Anisa
Pas encore d'évaluation
Data Mining What Is Data Mining?
Document11 pages
Data Mining What Is Data Mining?
james russell west brook
Pas encore d'évaluation
STMs and LSTM Variations For Prediction
Document16 pages
STMs and LSTM Variations For Prediction
Nikhil Saini
Pas encore d'évaluation
Datamining and Analytics Unit V
Document102 pages
Datamining and Analytics Unit V
Abinaya C
Pas encore d'évaluation
Machine Learning Fundamentals (Updated)
Document42 pages
Machine Learning Fundamentals (Updated)
slowkimo
Pas encore d'évaluation
Clustering Data Streams Theory Practice
Document33 pages
Clustering Data Streams Theory Practice
Sharvari Gundawar
Pas encore d'évaluation
DSS06-DS5 - CLS-Rule Induction, K-NN, Naive Bayesian
Document40 pages
DSS06-DS5 - CLS-Rule Induction, K-NN, Naive Bayesian
Thịnh Thái
Pas encore d'évaluation
MLCH9
Document45 pages
MLCH9
sam33rdhakal
Pas encore d'évaluation
Creating Surfaces: Esri International User Conference
Document51 pages
Creating Surfaces: Esri International User Conference
carlos adrian
Pas encore d'évaluation
Probability: by Zhichun Li
Document25 pages
Probability: by Zhichun Li
Deepa Shree
Pas encore d'évaluation
Week 04 Lecture Material
Document52 pages
Week 04 Lecture Material
Meer Hassan
Pas encore d'évaluation
Data Preparation: KIT306/606: Data Analytics A/Prof. Quan Bai University of Tasmania
Document49 pages
Data Preparation: KIT306/606: Data Analytics A/Prof. Quan Bai University of Tasmania
Jason Zeng
Pas encore d'évaluation
Novelty Detection Scope
Document27 pages
Novelty Detection Scope
d5rmyywhfq
Pas encore d'évaluation
CS 464 Introduction To Machine Learning: Feature Selection
Document36 pages
CS 464 Introduction To Machine Learning: Feature Selection
Mathias Bueno
Pas encore d'évaluation
CERN Statistics Tutorial 2018 PDF
Document157 pages
CERN Statistics Tutorial 2018 PDF
kevinchu021195
Pas encore d'évaluation
Lecture Slides-Week15,16
Document50 pages
Lecture Slides-Week15,16
moazzam kiani
Pas encore d'évaluation
04-Data Reduction New
Document39 pages
04-Data Reduction New
Lakshmi Priya B
Pas encore d'évaluation
AI Expert Roadmap - 2021
Document23 pages
AI Expert Roadmap - 2021
Raymon Arnold
Pas encore d'évaluation
data science course training in india hyderabad: innomatics research labs
D'Everand
data science course training in india hyderabad: innomatics research labs
innomatics research labs
Pas encore d'évaluation
Track-Before-Detect Using Expectation Maximisation: The Histogram Probabilistic Multi-hypothesis Tracker: Theory and Applications
D'Everand
Track-Before-Detect Using Expectation Maximisation: The Histogram Probabilistic Multi-hypothesis Tracker: Theory and Applications
Samuel J. Davey
Pas encore d'évaluation
MCAT OUtline
Document34 pages
MCAT OUtline
Xi Chen
100% (1)
Detecting Cliques of Maximum and Minimum Centrality in Information and Social Networks
Document74 pages
Detecting Cliques of Maximum and Minimum Centrality in Information and Social Networks
Xi Chen
Pas encore d'évaluation
Longitudinal Data Analysis - Note Set 14
Document13 pages
Longitudinal Data Analysis - Note Set 14
Xi Chen
Pas encore d'évaluation
Useful Functions From C // Output Manipulator For Formatting TH Eprinted Output
Document1 page
Useful Functions From C // Output Manipulator For Formatting TH Eprinted Output
Xi Chen
Pas encore d'évaluation
Description of Protein Function
Document1 page
Description of Protein Function
Xi Chen
Pas encore d'évaluation
Qualities of A Leader
Document47 pages
Qualities of A Leader
Reynald Antaso
Pas encore d'évaluation
Phed Week Pre-Lim Module
Document21 pages
Phed Week Pre-Lim Module
Ferndale Alimondo
Pas encore d'évaluation
KCSS Administration and Interpretation Manual
Document5 pages
KCSS Administration and Interpretation Manual
Annisa Rahma
Pas encore d'évaluation
Vcap-Dcv-2018 Exam-Prep Guide-Jan-2020
Document6 pages
Vcap-Dcv-2018 Exam-Prep Guide-Jan-2020
camilojaraba
Pas encore d'évaluation
Physical Education Quarter 2 - Module 1: Invasion Games (Agawan NG Base)
Document27 pages
Physical Education Quarter 2 - Module 1: Invasion Games (Agawan NG Base)
Mark Euan B. Doloso
Pas encore d'évaluation
Cognitive Abilities
Document2 pages
Cognitive Abilities
Ichigo Gaara
Pas encore d'évaluation
Ai Index 2019 Report PDF
Document291 pages
Ai Index 2019 Report PDF
taner Dörtyaprak
Pas encore d'évaluation
Cyberbullying Academic Paper Revised PDF
Document6 pages
Cyberbullying Academic Paper Revised PDF
api-258925897
Pas encore d'évaluation
1423550686857batch 46 A B C Lot - Phase 3 Result
Document28 pages
1423550686857batch 46 A B C Lot - Phase 3 Result
NAGENDRA JHA
0% (1)
4 - CBSE-list of Books Recommended For The Reading Programme PDF
Document15 pages
4 - CBSE-list of Books Recommended For The Reading Programme PDF
Vijay Soni
Pas encore d'évaluation
Grade8 3RD Grading S1 S2 Final
Document3 pages
Grade8 3RD Grading S1 S2 Final
Janford Baculi
Pas encore d'évaluation
A Multidimensional Approach To Individual
Document20 pages
A Multidimensional Approach To Individual
dcaguenas
Pas encore d'évaluation
How Far Ill Go Moana
Document3 pages
How Far Ill Go Moana
api-370091709
Pas encore d'évaluation
En Banc July 12, 2016 A.C. No. 11316 PATRICK A. CARONAN, Complainant Richard A. Caronan A.K.A. "Atty. Patrick A. Caronan," Respondent Decision
Document69 pages
En Banc July 12, 2016 A.C. No. 11316 PATRICK A. CARONAN, Complainant Richard A. Caronan A.K.A. "Atty. Patrick A. Caronan," Respondent Decision
mohawxz357
Pas encore d'évaluation
UNIT I Phonological Processes
Document25 pages
UNIT I Phonological Processes
Aurimar Hernández Barrientos
Pas encore d'évaluation
Workshop Evaluation Form Tourism
Document1 page
Workshop Evaluation Form Tourism
Dwayne Devonish
Pas encore d'évaluation
Project Management Team
Document9 pages
Project Management Team
Francis Jerome Cuarteros
Pas encore d'évaluation
1B - Kindergarten Unit Plan 2017-2018
Document45 pages
1B - Kindergarten Unit Plan 2017-2018
kait boisnard
Pas encore d'évaluation
UCLA MSW Comprehensive Exam
Document3 pages
UCLA MSW Comprehensive Exam
Laura
Pas encore d'évaluation
World English 3e Level 3 Grammar Activities Unit 11 Lesson C
Document1 page
World English 3e Level 3 Grammar Activities Unit 11 Lesson C
Jesus Calizaya Sabino
Pas encore d'évaluation
Assignment 2 Last
Document34 pages
Assignment 2 Last
api-455660717
Pas encore d'évaluation
Daily Routines Student Horn Sample
Document8 pages
Daily Routines Student Horn Sample
Gaspare Balconi
Pas encore d'évaluation