LaDissertation.com - Dissertations, fiches de lectures, exemples du BAC
Recherche

Données massives

Cours : Données massives. Recherche parmi 298 000+ dissertations

Par   •  18 Mars 2019  •  Cours  •  399 Mots (2 Pages)  •  437 Vues

Page 1 sur 2

Données massives

Lien TD : datacrunch.sh

Lien CM : sur le bv

Programme : RStudio

X<-      🡪 affecter une variable

Ex : x<- 3    🡪x=3

Donc 3x = 9

C(12,12,32,56,13) 🡪 Concaténation – assemblage

« x(crochet) chiffre (crochet) » permet de prendre une valeur du vecteur

Length(x) 🡪 nombre dans un vecteur

Si x = 12 12 32 56 13

Alors x+2 = 14 14 34 58 15

Mean(x) 🡪 moyenne

Sum(x) 🡪 somme

X<- c(12,12,32,56,13)

Y<- x*x

Alors

Sample(c(‘’Femme’’ , ‘’Homme’’), 5, replace=TRUE) 🡪 pioche au hasard

ou

Sexe<- c(‘’Homme’’, ‘’Femme’’)

Sample(sexe,1)

Sample(sexe,5) 🡪 erreur

Sample(sexe,5, replace=TRUE) 🡪 good

Tableau de données :

Tableau <- data.frame(Pointure=x, QI=y, Sexe=z)

Entrer

Taper tableau

Summary(tableau) 🡪 résumé statistique

Str(tableau) 🡪 analyse variable par variable

Accéder aux éléments d’un tableau 🡪 tableau (4,2) CROCHETS, pas paranthèses

                                                Tableau (4, ) Toute la ligne

                                                Tableau ( ,2) toute la colonne

                                                Tableau$QI 🡪trouver colonne

With(tableau)

Tableau(tableau$QI>1000, ) CROCHETS 🡪 trouver les valeurs de QI >1000

[

CM4

Les variables représentent l’observation de caractères des individus (objet d’étude)

Exemple :

  • Individus : des personnes issues d’une population
  • Variables : représentation de caractères morphologiques

Poids

Taille

Individus

-

-

Individus

-

-

Individus

-

-

Exemple :

  • Individus : véhicules
  • Variables : représentations de caractéristiques qui nous intéressent

Prix

Cylindrée

Couleur

Vitesse max

Véhicule

-

-

-

-

Véhicule

-

-

-

-

Véhicule

-

-

-

-

Typologie des variables 🡪 2 types :

  • Quantitatives 🡪 valeur :

🡪 Notion discrète

🡪 Notion continue

  • Qualitatives (notion d’ordre) 🡪 modalités

Est-ce-que l’écart à du sens ?

1 variable d’intérêt (définie dans le problème posé) :

  • Apprentissage supervisé : est-elle disponible (et renseignée) dans le tableau de données ?
  • Apprentissage non supervisé : ou non ?

Apprentissage supervisé :

  • Explication (apprentissage du modèle)
  • Prédiction (utilisation du modèle appris)

  • Expliquer la variable d’intérêt en fonction des années
  • Prédire la variable d’intérêt sur des individus « nouveaux »

...

Télécharger au format  txt (2.7 Kb)   pdf (49.6 Kb)   docx (146.4 Kb)  
Voir 1 page de plus »
Uniquement disponible sur LaDissertation.com