Bienvenue sur Scribd !

Ignorer le carrousel

Epsilon Grid Order: An Algorithm For The Similarity Join On Massive High-Dimensional Data

Transféré par

acnon

0% ont trouvé ce document utile (0 vote)

11 vues17 pages

Titre original

Ego Vortrag

Copyright

Formats disponibles

PPT, PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

Droits d'auteur :

Attribution Non-Commercial (BY-NC)

Formats disponibles

Téléchargez comme PPT, PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

11 vues17 pages

Epsilon Grid Order: An Algorithm For The Similarity Join On Massive High-Dimensional Data

Transféré par

acnon

Droits d'auteur :

Attribution Non-Commercial (BY-NC)

Formats disponibles

Téléchargez comme PPT, PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 17

Rechercher à l'intérieur du document

1 17

Christian Bhm, Bernhard Braunmller, Florian Krebs, and Hans-Peter Kriegel,

University of Munich

Epsilon Grid Order: An Algorithm for the Similarity Join on Massive High-Dimensional Data

2 17

Feature Based Similarity

3 17

Simple Similarity Queries

Specify query object and
Find similar objects range query Find the k most similar objects nearest neighbor q.

4 17

Join Applications: Catalogue Matching

Catalogue matching
E.g. Astronomic catalogues

R S

5 17

Join Applications: Clustering

Clustering (e.g. DBSCAN)

Similarity self-join

6 17

Grid partitioning
General idea: Grid approximation where grid line distance = e
Similar idea in the e-kdB-tree
[Shim, Srikant, Agrawal: High-dimensional Similarity Joins, ICDE 1997]

Disadvantage of any grid approach: Number of neighboring grid cells: 3d - 1

7 17

Scalability of the e-kdB-tree

Assumption: 2 adjacent e-stripes fit in main mem. Unrealistic for large data sets which are ...
clustered, skewed and high-dimensional data

8 17

Epsilon Grid Order

9 17

e-Grid-Order Is a Total Strict Order

Strict Order:
Irreflexivity Transitivity Asymmetry

e-grid-order can be used in any sorting algorithm

10 17

e-Interval
Coarse approximation of join mates: Used for I/O processing

11 17

I/O Processing for the Self Join

Decompose the sorted file into I/O units

12 17

Epsilon Grid Order

13 17

CPU Processing
I/O units are further decomposed before joining Simple divide-and-conquer: No further sorting Decomposition: maximize active dimensions

14 17

CPU Processing
Point distance computations: Order of dimensions
Neighboring inactive dimensions Unspecified dimensions Active dimension Aligned inactive dimensions

15 17

Experimental Results
8-dimensional uniformly distributed vectors

16 17

Experimental Results (2)

16-d feature vectors from CAD application

17 17

Conclusions
Summary
High potential for performance gains of the similarity join by page capacity optimization Necessary to separately optimize I/O and CPU

Future research potential

Similarity join for metric index structures Approximate similarity join Parallel similarity join algorithms

Vous aimerez peut-être aussi

Comparison of Density-Based Clustering Algorithms: Mariam Rehman
Document5 pages
Comparison of Density-Based Clustering Algorithms: Mariam Rehman
suser
Pas encore d'évaluation
Overset Grids Literature Review - Overture
Document11 pages
Overset Grids Literature Review - Overture
Somdeb Bandopadhyay
Pas encore d'évaluation
CENG3300 Lecture 10
Document20 pages
CENG3300 Lecture 10
huichloemail
Pas encore d'évaluation
Shorting
Document27 pages
Shorting
RatnakarVarun
Pas encore d'évaluation
05 K-Nearest Neighbors
Document15 pages
05 K-Nearest Neighbors
Lalaloopsie The Great
Pas encore d'évaluation
10.introduction To Data-Parallel Architectures
Document21 pages
10.introduction To Data-Parallel Architectures
Ashok Ashokbyadav
Pas encore d'évaluation
CSE4014 - High Performance Computing (EPJ) : Submitted by Project Guide
Document12 pages
CSE4014 - High Performance Computing (EPJ) : Submitted by Project Guide
Ashish Paudel
Pas encore d'évaluation
Pres 0911 Regrid Update
Document9 pages
Pres 0911 Regrid Update
Salam Faith
Pas encore d'évaluation
05 Networks
Document48 pages
05 Networks
Ng Yiu Fai
Pas encore d'évaluation
Lecture Slides-Week15,16
Document50 pages
Lecture Slides-Week15,16
moazzam kiani
Pas encore d'évaluation
Algorithms For Fast Vector Quantization: Proc. Data Compression Conference, J. A. Storer
Document17 pages
Algorithms For Fast Vector Quantization: Proc. Data Compression Conference, J. A. Storer
Rex Jim
Pas encore d'évaluation
Introduction To Parallel Algorithms and Parallel Program Design
Document91 pages
Introduction To Parallel Algorithms and Parallel Program Design
Ganesh Gajengi
Pas encore d'évaluation
Random Graph Models of Social Networks: Paper Authors: M.E. Newman, D.J. Watts, S.H. Strogatz
Document21 pages
Random Graph Models of Social Networks: Paper Authors: M.E. Newman, D.J. Watts, S.H. Strogatz
smjain
Pas encore d'évaluation
03-Task Decomposition and Mapping
Document62 pages
03-Task Decomposition and Mapping
Houri melkonian
Pas encore d'évaluation
Dendro: Parallel Algorithms For Multigrid and AMR Methods On 2:1 Balanced Octrees
Document20 pages
Dendro: Parallel Algorithms For Multigrid and AMR Methods On 2:1 Balanced Octrees
lanwatch
Pas encore d'évaluation
Introduction
Document10 pages
Introduction
Boul chandra Garai
Pas encore d'évaluation
A Multi-Block Orthogonal Grid Generation Using Cad System
Document8 pages
A Multi-Block Orthogonal Grid Generation Using Cad System
Mohammad Haddadi
Pas encore d'évaluation
Using Area Hierarchy For Multi-Resolution Storage and Search in Large Wireless Sensor Networks
Document27 pages
Using Area Hierarchy For Multi-Resolution Storage and Search in Large Wireless Sensor Networks
Ionela Neacsu
Pas encore d'évaluation
Interpolation: Dr. B. Santhosh Department of Mechanical Engineering
Document21 pages
Interpolation: Dr. B. Santhosh Department of Mechanical Engineering
Achyuth G S
Pas encore d'évaluation
Overview of 3D Object Representations: Modeling
Document16 pages
Overview of 3D Object Representations: Modeling
mbhuvana_eshwari
Pas encore d'évaluation
3d Shape Analysis-Machine Learning
Document41 pages
3d Shape Analysis-Machine Learning
Alexander Saldarriaga
Pas encore d'évaluation
Dimensionality Reduction: Principal Component Analysis (PCA)
Document11 pages
Dimensionality Reduction: Principal Component Analysis (PCA)
tanmayi nandiraju
Pas encore d'évaluation
Sequence Alignment
Document92 pages
Sequence Alignment
arsalan
Pas encore d'évaluation
Unit 3: Databases & SQL: Developed By: Ms. Nita Arora Kulachi Hansraj Model School Ashok Vihar
Document18 pages
Unit 3: Databases & SQL: Developed By: Ms. Nita Arora Kulachi Hansraj Model School Ashok Vihar
Athira Soman
Pas encore d'évaluation
Final Clustering
Document21 pages
Final Clustering
NEEL GHADIYA
Pas encore d'évaluation
Introduction To Data Science Unsupervised Learning: CS 194 Fall 2015 John Canny
Document54 pages
Introduction To Data Science Unsupervised Learning: CS 194 Fall 2015 John Canny
Pedro Jesús García Ramos
Pas encore d'évaluation
(KtabPDF Com) xrwA7TEBGp
Document32 pages
(KtabPDF Com) xrwA7TEBGp
شجن الزبير
Pas encore d'évaluation
EC657 Digital System Design (3 - 0 - 0) 3 Pre-Requisite: EC209 Digital Circuits and Systems Course Objective
Document2 pages
EC657 Digital System Design (3 - 0 - 0) 3 Pre-Requisite: EC209 Digital Circuits and Systems Course Objective
Avinash Kumar
Pas encore d'évaluation
Mesh Generation: Advances and Applications in Computer Vision Mesh Generation
D'Everand
Mesh Generation: Advances and Applications in Computer Vision Mesh Generation
Fouad Sabry
Pas encore d'évaluation
Printed Circuit Board Design Flow: CS194-5, Spring 2008
Document24 pages
Printed Circuit Board Design Flow: CS194-5, Spring 2008
KaranSingh
Pas encore d'évaluation
Constructing Suitable Planar
Document38 pages
Constructing Suitable Planar
smarttelgroup1
Pas encore d'évaluation
Graph500 BigData2016 Paper
Document8 pages
Graph500 BigData2016 Paper
Miguel Angel
Pas encore d'évaluation
Web Graphs: Modeling The Internet and The Web
Document40 pages
Web Graphs: Modeling The Internet and The Web
Shamna Krishnan
Pas encore d'évaluation
Lecture 3: Handwriting Recognition and Classification
Document51 pages
Lecture 3: Handwriting Recognition and Classification
kunal13
Pas encore d'évaluation
Social Network Analysis Unit-2
Document24 pages
Social Network Analysis Unit-2
Guribilli Varaprasad
Pas encore d'évaluation
Graph DB
Document63 pages
Graph DB
Vinod Reddy
Pas encore d'évaluation
Parallel & Distributed Databases: C S 5 6 1 - S P R I N G 2 0 1 2 Wpi, Mohamed Eltabakh
Document23 pages
Parallel & Distributed Databases: C S 5 6 1 - S P R I N G 2 0 1 2 Wpi, Mohamed Eltabakh
Dibas Sil
Pas encore d'évaluation
Comp422 534 2020 Lecture1 Introduction
Document49 pages
Comp422 534 2020 Lecture1 Introduction
Sadia Mughal
Pas encore d'évaluation
Physical Design - Overall Flow
Document40 pages
Physical Design - Overall Flow
shabbir470
Pas encore d'évaluation
Towards Efficient Routing WSN
Document34 pages
Towards Efficient Routing WSN
ajyshow
Pas encore d'évaluation
FLANN Presnetation For Group
Document26 pages
FLANN Presnetation For Group
Firma Firmansyah Adi
Pas encore d'évaluation
ML Application in Signal Processing and Communication Engineering
Document27 pages
ML Application in Signal Processing and Communication Engineering
aniruddh nain
Pas encore d'évaluation
Custer Analysis: Prepared by Navin Ninama
Document20 pages
Custer Analysis: Prepared by Navin Ninama
Nishith Lakhlani
Pas encore d'évaluation
Structured Pruning of Deep Convolutional Neural Netw Orks: Sajid Anwar, Kyuyeon Hwang and Wonyong Sung
Document11 pages
Structured Pruning of Deep Convolutional Neural Netw Orks: Sajid Anwar, Kyuyeon Hwang and Wonyong Sung
ali shaarawy
Pas encore d'évaluation
Multi-Level Bézier Extraction For Hierarchical Local Refinement of Isogeometric Analysis
Document28 pages
Multi-Level Bézier Extraction For Hierarchical Local Refinement of Isogeometric Analysis
Luis Alberto Fuentes
Pas encore d'évaluation
Lecture 1
Document18 pages
Lecture 1
wmanjonjo
Pas encore d'évaluation
GIS Data Model
Document46 pages
GIS Data Model
FAizal Abdillah
Pas encore d'évaluation
MR Databases
Document52 pages
MR Databases
raj9523493430
Pas encore d'évaluation
ParallelDBs PDF
Document23 pages
ParallelDBs PDF
heyramzz
Pas encore d'évaluation
DuongToGiangSon 517H0162 HW2 Nov-26
Document17 pages
DuongToGiangSon 517H0162 HW2 Nov-26
Son Tran
Pas encore d'évaluation
Classification Algorithms in Achieving Partitioning Optimization For VLSI Applications
Document3 pages
Classification Algorithms in Achieving Partitioning Optimization For VLSI Applications
Sudheer Reddy
Pas encore d'évaluation
1 s2.0 S0031320317303497 Main
Document14 pages
1 s2.0 S0031320317303497 Main
ajgallego
Pas encore d'évaluation
Parallel Algorithms
Document21 pages
Parallel Algorithms
Mvm Fatehpur
Pas encore d'évaluation
CUDPP Slides
Document26 pages
CUDPP Slides
bkr
Pas encore d'évaluation
Data Analytics CSE704 Module-2
Document42 pages
Data Analytics CSE704 Module-2
suryanshmishra425
Pas encore d'évaluation
SQLDM - Implementing K-Means Clustering Using SQL: Jay B.Simha
Document5 pages
SQLDM - Implementing K-Means Clustering Using SQL: Jay B.Simha
Moh Ali M
Pas encore d'évaluation
PST 02
Document37 pages
PST 02
sergiosvieira
Pas encore d'évaluation
Bicubic Interpolation Wiki PDF
Document4 pages
Bicubic Interpolation Wiki PDF
braulio.dantas
Pas encore d'évaluation
Analisa Spasial Data Vektor Sederhana: Pertemuan 7
Document60 pages
Analisa Spasial Data Vektor Sederhana: Pertemuan 7
ratihokebgt
Pas encore d'évaluation
Ian Talks Algos & Data Structures A-Z: WebDevAtoZ, #2
D'Everand
Ian Talks Algos & Data Structures A-Z: WebDevAtoZ, #2
Ian Eress
Pas encore d'évaluation
3-D Stream Restoration Design, Monitoring and Beyond
Document93 pages
3-D Stream Restoration Design, Monitoring and Beyond
acnon
Pas encore d'évaluation
Data Visualization Using STEP Lothar Klein
Document31 pages
Data Visualization Using STEP Lothar Klein
acnon
Pas encore d'évaluation
Chapter7 New
Document22 pages
Chapter7 New
acnon
Pas encore d'évaluation
Current and Emerging Trends Transparencies: © Pearson Education Limited, 2004 1
Document85 pages
Current and Emerging Trends Transparencies: © Pearson Education Limited, 2004 1
acnon
Pas encore d'évaluation
Architecture Overview: W W W - C o M
Document3 pages
Architecture Overview: W W W - C o M
acnon
Pas encore d'évaluation
R2 Imagechecker CT Cad Pma: Clinical Results: Nicholas Petrick, Ph.D. Office of Science and Technology
Document25 pages
R2 Imagechecker CT Cad Pma: Clinical Results: Nicholas Petrick, Ph.D. Office of Science and Technology
acnon
Pas encore d'évaluation