Académique Documents
Professionnel Documents
Culture Documents
1
1/-Qu'est-ce que la programmation R :
R est un langage de programmation informatique interprété qui a été créé par Ross Ihaka et
Robert Gentleman à l'Université d'Auckland, en Nouvelle-Zélande." L’équipe principale de
développement de R développe actuellement R. Il s'agit également d'un environnement logiciel
utilisé pour analyser les informations statistiques, la représentation graphique, les rapports et la
modélisation des données. R est l'implémentation du langage de programmation S, qui est
combiné avec la sémantique de portée lexicale.
améliorer l'efficacité.
À l'ère actuelle, R est l'un des outils les plus importants utilisés par les chercheurs, les
2/-Histoire de la programmation R :
L'histoire de R remonte à environ 20-30 ans. R a été développé par Ross lhaka et Robert
Gentleman à l'Université d'Auckland, en Nouvelle-Zélande, et l'équipe de développement R
développement le développe actuellement. Ce nom de langage de programmation est tiré du
nom des deux développeurs. Le premier projet a été envisagé en 1992. La version initiale a été
publiée en 1995 et en 2000, une version bêta stable a été publiée.
3/-caractéristiques de la programmation R :
R est un langage de programmation spécifique à un domaine qui vise à analyser des données. Il
a des caractéristiques uniques qui le rendent très puissant. Le plus important étant sans doute la
notation des vecteurs. Ces vecteurs nous permettent d'effectuer une opération complexe sur un
ensemble de valeurs en une seule commande.
2
2. Calculs à l'aide de vecteurs.
4. Il s'agit d'un langage bien conçu, simple et efficace qui comprend les concepts de
fonctions d'E/S définies par l'utilisateur, en boucle, conditionnelles et diverses.
5. Il dispose d'un ensemble d'outils cohérents et intégrés qui sont utilisés pour l'analyse des
données.
6. Pour différents types de calcul sur des tableaux, des listes et des vecteurs, R contient
une suite d'opérateurs.
Il existe plusieurs outils disponibles sur le marché pour effectuer l'analyse des
données. Apprendre de nouvelles langues prend du temps. Le data scientist peut utiliser deux
excellents outils, à savoir R et Python. Nous n'aurons peut-être pas le temps de les apprendre
tous les deux au moment où nous commençons à apprendre la science des données. Apprendre
la modélisation statistique et l'algorithme est plus important que d'apprendre un langage de
programmation. Un langage de programmation est utilisé pour calculer et communiquer notre
découverte.
La tâche importante en science des données est la façon dont nous traitons les données :
nettoyage, ingénierie des fonctionnalités, sélection des fonctionnalités et importation. Cela
devrait être notre objectif principal. Le travail du data scientiste consiste à comprendre les
données, les manipuler et exposer la meilleure approche. Pour la machine Learning, les
meilleurs algorithmes peuvent être implémentés avec R. Karas et TensorFlow nous
permettent de créer des techniques de machine Learning haut de gamme. R a un package pour
effectuer Xgboost . Xgboost est l'un des meilleurs algorithmes pour la compétition Kaggle .
R communique avec les autres langages et appelle éventuellement Python, Java, C++. Le
monde du big data est également accessible à R. On peut connecter R avec différentes bases de
données comme Spark ou Hadoop .
3
En bref, R est un excellent outil pour étudier et explorer les données. Les analyses élaborées
telles que le regroupement, la corrélation et la réduction des données sont effectuées avec .
5/-Applications de R :
o Facebook.
o Google.
o Twitter.
o HRDAG.
o Fondation Sunlight.
o Réel Climat.
o NDAA.
o XBOX O.
que de nombreux inconvénients disparaîtront lentement avec les futures mises à jour
de R.
6-1-/les Avantages :
6-1-1/Open Source
Un langage open source est un langage sur lequel nous pouvons travailler sans avoir besoin
de licence ou de frais. R est un langage open source. Nous pouvons contribuer au
développement de R en optimisant nos packages, en en développant de nouveaux et en résolvant
les problèmes.
4
6-1-2/ Indépendant de la plate-forme
R nous permet d'effectuer des conflits de données. R fournit des packages tels que
dplyrreadr qui sont capables de transformer des données désordonnées en une forme structurée.
6-1-7/ Statistiques
R est principalement connu comme le langage des statistiques. C'est la principale raison pour
laquelle R est prédominant par rapport aux autres langages de programmation pour le
développement d'outils statistiques.
5
6-1-8/ Croissance continue
6-2/les inconvénients :
6-2-1/ Traitement des données
Dans R, les objets sont stockés dans la mémoire physique. C'est en contraste avec d'autres
langages de programmation comme Python. R utilise plus de mémoire que Python. Il nécessite
toutes les données en un seul endroit qui est dans la mémoire. Ce n'est pas une option idéale
lorsque nous traitons du Big Data.
6-2-2/Langage compliqué
R est un langage très compliqué, et sa courbe d'apprentissage est abrupte. Les personnes qui
n'ont pas de connaissances préalables ou d'expérience en programmation peuvent avoir du mal
à apprendre R.
Le principal inconvénient de R est qu'il ne prend pas en charge les graphiques dynamiques
ou 3D. La raison derrière cela est son origine. Il partage son origine avec un langage de
programmation beaucoup plus ancien « S ».
Dans R, les algorithmes sont répartis sur différents packages. Les programmeurs qui n'ont
aucune connaissance préalable des packages peuvent avoir des difficultés à mettre en œuvre
des algorithmes.
6
6-2-5/ Sécurité de base
R manque de sécurité de base. C'est une partie essentielle de la plupart des langages de
programmation tels que Python. Pour cette raison, il existe de nombreuses restrictions avec R
car il ne peut pas être intégré dans une application Web.