Projet de statistique appliquée
Dissertation : Projet de statistique appliquée. Recherche parmi 298 000+ dissertationsPar Nolhan-Nathan Luzolo ADOHO • 7 Décembre 2019 • Dissertation • 1 262 Mots (6 Pages) • 402 Vues
REPUBLIQUE DU BENIN[pic 1][pic 2]
****
MINISTERE DE L’ENSEIGNEMENT SUPERIEURE ET DE LA RECHERCHE SCIENTIFIQUE (MESRS)
******
UNIVERSITE D’ABOMEY-CALAVI (UAC)
*********
INSTITUT NATIONAL DE L’EAU (INE)
************
DEPARTEMENT DE GENIE DE L’EAU ET ASSAINISSEMENT
*****************
MASTER 1 EAU, HYGIENE ET ASSAINISSEMENT[pic 3]
[pic 4]
[pic 5]
Présenté par : Enseignant :
EDALO Docteur
Houéfa Francine Belfrid DJIHOUESSI
[pic 6]
Table des matières
INTRODUCTION 3
1-METODOLOGIE 3
2-RESULTAS ET DISCUSSIONS 6
2-1 TABLEAU DESCRIPTIBLE SOMMAIRE 6
2-2 NORMALITE 6
2-3 HOMOGENIETE 7
2-4 LA REPARTITION DES VARIABLES 7
INTRODUCTION
Pour mieux se rassurer que les cours enseignés sont bien assimilés pas les étudiants, les enseignants de l’INE (Institut Nationale de l’Eau) organisent des devoirs de tables et des projets d’études. C’est dans ce cadre, qu’il nous a été donné un projet d’étude de statistique appliquée. La base de données qui et notre support de travail nous a été fournie. La compréhension de cette base nous a permis de les prélèvements ont commencé en Juin 2009 et ont pris fin Juin 2011. Les mois sont codés 1 à 12 selon le numéro du mois dans une année et à ce repère il est ajouté un code du temps de 1 à 25 qui est l’ordre selon lequel chaque mois a été prélevé. Sept localités ont été prélevés et sont numérotées de 1 à 7. Un seul point est prélevé par localité. Pour notre étude 11variables ont été considérés dont les 7 premiers sont explicatives et les 4 derniers sont d’observations (le PH, le NH3, Discharge :débit, dis.Statut :l’état du débit). Au total 175 observations ont été faites. Arrivé au laboratoire, un nouveau code est aussi donné à chaque échantillon.
1-METODOLOGIE
Les traitements des données de la base seront faits avec le logiciel R. Ce logiciel nous a permis de faire les analyses par la réalisation des graphes, les descriptions statistiques.
Pour la réalisation du travail, voici quelques fonctions de R que nous avons utilisées :
#Après ouverture de R, faire la ligne suite pour démarrer rm(list=ls())
#pour la prise en compte de toutes les valeurs de la base de données :
Options (max.print = .Machine$integer.max)
#pour importer les données dans R pour de les utiliser (dans notre cas) :
setwd('D:/statistique/données')
# donner un nom à la base de données pour faciliter son utilisation :
exam<-read.csv('donnée projet exam.csv',sep=";")
#préciser le nom :
names(exam)
#écrire le nom maintenant pour que la base s’affiche
Exam
#la fonction summary pour avoir une description sommaire de la base , ce qui permet d’avoir la moyenne ,la médiane, le maximum et le minimum, le premier et le deuxième quartil
summary(exo$EC)
summary(exo$NO3_NO2)
summary(exo$Discharge)
#Installer le package scriplot pour avoir la bargraph afin de faire les graphes après
install.packages("scriplot")
library(sciplot)
#pour mettre des couleurs au bargraph
col=rainbow(4)
#Faire le test de shapiro pour voir la normalité de la distribution
shapiro.test
shapiro.test(exam$ph)
shapiro.test(exam$NH3)
shapiro.test(exAM$Discharge)
#Faire le test de wilcoxon pour vérifier l'homogénéité de la distribution
wilcox.test
wilcox.test(exam$ph)
wilcox.test(exam$NH3)
wilcox.test(exAM$Discharge)
#la fonction par(mfrow=c(1,3))pour afficher diférents graphes ensemble pour une bonne lecture
par(mfrow=c(1,3))
...