Type: | Package |
Title: | Applied Statistics for Economics and Management with R |
Version: | 0.6.1 |
Date: | 2023-03-23 |
Depends: | R (≥ 3.5.0) |
Imports: | ggplot2 |
Suggests: | knitr, markdown, prettydoc, rmarkdown, testthat (≥ 3.0.0), covr, learnr, spelling, lattice, spatstat.data, Matrix, mgcv, PMCMRplus, devtools, extrafont, DescTools, GGally, VGAM, car, dplyr, tibble, ggiraphExtra, scales, spatstat, vcd, FactoMineR, cluster, caret, corrplot, actuar |
Author: | Frederic Bertrand |
Maintainer: | Frederic Bertrand <frederic.bertrand@utt.fr> |
Description: | Datasets and functions for the book "Statistiques pour l’économie et la gestion", "Théorie et applications en entreprise", F. Bertrand, Ch. Derquenne, G. Dufrénot, F. Jawadi and M. Maumy, C. Borsenberger editor, (2021, ISBN:9782807319448, De Boeck Supérieur, Louvain-la-Neuve). The first chapter of the book is dedicated to an introduction to statistics and their world. The second chapter deals with univariate exploratory statistics and graphics. The third chapter deals with bivariate and multivariate exploratory statistics and graphics. The fourth chapter is dedicated to data exploration with Principal Component Analysis. The fifth chapter is dedicated to data exploration with Correspondance Analysis. The sixth chapter is dedicated to data exploration with Multiple Correspondance Analysis. The seventh chapter is dedicated to data exploration with automatic clustering. The eighth chapter is dedicated to an introduction to probability theory and classical probability distributions. The ninth chapter is dedicated to an estimation theory, one-sample and two-sample tests. The tenth chapter is dedicated to an Gaussian linear model. The eleventh chapter is dedicated to an introduction to time series. The twelfth chapter is dedicated to an introduction to probit and logit models. Various example datasets are shipped with the package as well as some new functions. |
License: | GPL-3 |
Encoding: | UTF-8 |
LazyData: | true |
Config/testthat/edition: | 3 |
VignetteBuilder: | knitr, rmarkdown |
Language: | fr-FR |
RoxygenNote: | 7.2.1 |
URL: | https://fbertran.github.io/homepage/, https://fbertran.github.io/sageR/, https://github.com/fbertran/sageR/ |
BugReports: | https://github.com/fbertran/sageR/issues/ |
NeedsCompilation: | no |
Packaged: | 2023-03-23 18:08:36 UTC; fbertran |
Repository: | CRAN |
Date/Publication: | 2023-03-23 18:40:02 UTC |
sageR: Applied Statistics for Economics and Management with R
Description
Datasets and functions for the book "Statistiques pour l’économie et la gestion", "Théorie et applications en entreprise", F. Bertrand, Ch. Derquenne, G. Dufrénot, F. Jawadi and M. Maumy, C. Borsenberger editor, (2021, ISBN:9782807319448, De Boeck Supérieur, Louvain-la-Neuve). The first chapter of the book is dedicated to an introduction to statistics and their world. The second chapter deals with univariate exploratory statistics and graphics. The third chapter deals with bivariate and multivariate exploratory statistics and graphics. The fourth chapter is dedicated to data exploration with Principal Component Analysis. The fifth chapter is dedicated to data exploration with Correspondance Analysis. The sixth chapter is dedicated to data exploration with Multiple Correspondance Analysis. The seventh chapter is dedicated to data exploration with automatic clustering. The eighth chapter is dedicated to an introduction to probability theory and classical probability distributions. The ninth chapter is dedicated to an estimation theory, one-sample and two-sample tests. The tenth chapter is dedicated to an Gaussian linear model. The eleventh chapter is dedicated to an introduction to time series. The twelfth chapter is dedicated to an introduction to probit and logit models. Various example datasets are shipped with the package as well as some new functions.
Author(s)
Maintainer: Frederic Bertrand frederic.bertrand@utt.fr (ORCID)
Authors:
Myriam Maumy-Bertrand myriam.maumy@utt.fr (ORCID)
Other contributors:
Claire Borsenberger claire.borsenberger@sfr.fr [contributor]
Christian Derquenne chris.emr@wanadoo.fr [contributor]
Gilles Dufrénot gilles.dufrenot@univ-amu.fr [contributor]
Fredj Jawadi fredj.jawadi@univ-lille.fr [contributor]
See Also
Useful links:
Report bugs at https://github.com/fbertran/sageR/issues/
Population du Canada par classes d'âge et provinces et territoires en 2020
Description
Répartition en classes d'âge de la population des provinces et des territoires du Canada en 2020. Statistique Canada. Tableau 17-10-0005-01 Estimations de la population au 1er juillet, par âge et sexe.
Usage
AgevsProter_Canada_full
Format
Un jeu de données avec 21 observations de 13 variables.
- Terre.Neuve.et.Labrador
- Île.du.Prince.Édouard
- Nouvelle.Écosse
- Nouveau.Brunswick
- Québec
- Ontario
- Manitoba
- Saskatchewan
- Alberta
- Colombie.Britannique
- Yukon
- TerritoiresduNord.Ouest
- Nunavut
References
Population du Canada par classes d'âge et sexe en 2020
Description
Répartition en classes d'âge et sexe de la population du Canada en 2020. Statistique Canada. Tableau 17-10-0005-01 Estimations de la population au 1er juillet, par âge et sexe.
Usage
AgevsSexe_Canada_full
Format
Un jeu de données avec 21 observations de 2 variables.
- Hommes
- Femmes
References
Calcule les trajectoires par axe pour un diagramme en radar (Calculate Axis Path)
Description
Calculates x-y coordinates for a set of radial axes (one per variable being plotted in radar plot)
Usage
CalculateAxisPath(var.names, min, max)
Arguments
var.names |
list of variables to be plotted on radar plot |
min |
MININUM value required for the plotted axes (same value will be applied to all axes) |
max |
MAXIMUM value required for the plotted axes (same value will be applied to all axes) |
Value
a dataframe of the calculated axis paths
Examples
library(dplyr)
library(scales)
library(tibble)
mtcars_radar <- mtcars %>%
as_tibble(rownames = "group") %>%
mutate_at(vars(-group), rescale) %>%
tail(4) %>%
select(1:10)
plot.data <- as.data.frame(mtcars_radar)
if(!is.factor(plot.data[, 1])) {
plot.data[, 1] <- as.factor(as.character(plot.data[, 1]))
}
names(plot.data)[1] <- "group"
var.names <- colnames(plot.data)[-1]
grid.min = 0
grid.max = 1
centre.y = grid.min - ((1 / 9) * (grid.max - grid.min))
CalculateAxisPath(var.names, grid.min + abs(centre.y), grid.max + abs(centre.y))
Calcule les trajectoires par groupe pour un diagramme en radar (Calculate Group Path)
Description
Converts variable values into a set of radial x-y coordinates
Usage
CalculateGroupPath(df)
Arguments
df |
a dataframe with Col 1 is group ('unique' cluster / group ID of entity) and Col 2-n are v1.value to vn.value - values (e.g. group/cluser mean or median) of variables v1 to v.n |
Value
a dataframe of the calculated axis paths
Source
Code adapted from a solution posted by Tony M to https://stackoverflow.com/questions/9614433/creating-radar-chart-a-k-a-star-plot-spider-plot-using-ggplot2-in-r.
Examples
library(dplyr)
library(scales)
library(tibble)
mtcars_radar <- mtcars %>%
as_tibble(rownames = "group") %>%
mutate_at(vars(-group), rescale) %>%
tail(4) %>%
select(1:10)
plot.data <- as.data.frame(mtcars_radar)
if(!is.factor(plot.data[, 1])) {
plot.data[, 1] <- as.factor(as.character(plot.data[, 1]))
}
names(plot.data)[1] <- "group"
CalculateGroupPath(plot.data)
Correction de copies
Description
Notes de deux correcteurs (A et B) pour les mêmes trente copies.
Usage
Copies
Format
Un jeu de données avec 30 observations de 2 variables.
- Correcteur A
- Correcteur B
Emploi par niveau d’études et taux d’emploi par groupe d’âge
Description
Les colonnes 2, 3 et 4 du tableau 2.8 contiennent les taux d’emploi, au troisième trimestre 2020, selon le niveau d’études : premier cycle du second degré (PCSD), deuxième cycle du second degré (DCSD), supérieur (SUP). Le taux d’emploi est le pourcentage d’actifs occupés dans la population en âge de travailler. Les actifs occupés sont les personnes qui travaillent au moins une heure par semaine en tant que salarié ou à titre lucratif, ou qui ont un emploi, mais sont temporairement absentes de leur travail pour maladie, congé ou conflit social. Cet indicateur donne le pourcentage des actifs occupés âgés de 25 à 64 ans dans la population des individus âgés de 25 à 64 ans. Les trois dernières colonnes du tableau 2.8 contiennent le taux d’emploi, au troisième trimestre 2020, d’une classe d’âge. Cet indicateur se mesure en fonction du nombre des actifs occupés d’un âge donné rapporté à l’effectif total de cette classe d’âge. Les actifs occupés sont les personnes de 15 ans et plus qui, durant la semaine de référence, déclarent avoir effectué un travail rémunéré pendant une heure au moins ou avoir occupé un emploi dont elles étaient absentes. Les taux d’emploi sont présentés pour trois classes d’âge : les personnes âgées de 15 à 24 ans sont celles qui font leur entrée sur le marché du travail à l’issue de leur scolarité, les personnes âgées de 25 à 54 ans sont celles qui sont au plus fort de leur activité professionnelle, et les personnes âgées de 55 à 64 ans sont celles qui ont dépassé le pic de leur carrière professionnelle et approchent de l’âge de la retraite. Cet indicateur est désaisonnalisé et est mesuré en pourcentage de l’effectif total de la classe d’âge.
Usage
Emploi_Etude_Age
Format
A data frame with 37 observations on the following 6 variables.
- DCSD
a numeric vector
- PCSD
a numeric vector
- SUP
a numeric vector
- 15_24
a numeric vector
- 25_54
a numeric vector
- 55_64
a numeric vector
References
doi:10.1787/6e3d44f3-fr, doi:10.1787/b01db125-fr.
Examples
data(Emploi_Etude_Age)
str(Emploi_Etude_Age)
plot(Emploi_Etude_Age)
Prix de l'essence sans plomb 95
Description
Prix de l'essence sans plomb 95 en avril 2021 dans deux départements français, l'aube et la marne.
Usage
Essence
Format
Un jeu de données avec 60 observations de 2 variables.
- Aube
- Marne
Taux d'emploi en % de la classe d'age
Description
Le taux d'emploi d'une classe d'âge se mesure en fonction du nombre des actifs occupés d'un âge donné rapporté à l'effectif total de cette classe d'âge. Les actifs occupés sont les personnes de 15 ans et plus qui, durant la semaine de référence, déclarent avoir effectué un travail rémunéré pendant une heure au moins ou avoir occupé un emploi dont elles étaient absentes. Les taux d'emploi sont présentés pour quatre classes d'âge : les personnes âgées de 15 à 64 ans (personnes en âge de travailler); les personnes âgées de 15 à 24 ans sont celles qui font leur entrée sur le marché du travail à l'issue de leur scolarité, les personnes âgées de 25 à 54 ans sont celles qui sont au plus fort de leur activité professionnelle, et les personnes âgées de 55 à 64 ans sont celles qui ont dépassé le pic de leur carrière professionnelle et approchent de l'âge de la retraite. Cet indicateur est désaisonnalisé et est mesuré en pourcentage de l'effectif total de la classe d'âge. OCDE (2021), Taux d'emploi par groupe d'âge (indicateur).
Usage
Europe
Format
Un jeu de données avec 35 observations de 6 variables.
- Etats.membres
- Partiel_Ens
- Partiel_H
- Partiel_F
- Salariés
- NonSalariés
References
Flux bancaires
Description
Flux bancaires.
Usage
Flux
Format
Un vecteur avec 30 observations.
Personnes hospitalisées atteintes de la Covid 19 (21/02/2021)
Description
Répartition par région française du nombre de personnes hospitalisées et atteintes du Covid 19 le 21 février 2021.
Usage
HospitFull
Format
Un jeu de données avec 19 observations de 12 variables.
- Région
- Tous.âges
- X0.9
- X11.19
- X20.29
- X30.39
- X40.49
- X50.59
- X60.69
- X70.79
- X80.89
- X90.
Prix de vente en fonction de la marque, format long ou empilé
Description
Valeurs d'articles de qualité équivalente en fonction de leur marque.
Usage
Marque.Valeur
Format
Un jeu de données avec 90 observations de 2 variables.
- Marque
- Valeur
Prix de vente en fonction de la marque, format large ou dépilé
Description
Valeurs d'articles de qualité équivalente en fonction de leur marque.
Usage
Marque.Valeur.large
Format
Un jeu de données avec 30 observations de 3 variables.
- Marque.1
- Marque.2
- Marque.3
Nombre de personnes dans un foyer
Description
Ménages par taille du ménage en 2017, source INSEE.
Usage
Personnes_Foyer
Format
Un jeu de données avec 6 observations de 2 variables xi
et ni
.
- xi
Nombres de personnes dans un foyer
- ni
Nombres de foyers
Précipitations aux USA en 1975
Description
Précipitations relevées dans soixante villes aux États-Unis d'Amérique en 1975.
Usage
Precipitations_USA
Format
Un jeu de données avec 60 observations de 4 variables.
- Ville
- Precipitation..inches.
- Precipitation..cms.
- Etat
Population du Canada par provinces et territoires en 2020
Description
Répartition de la population des provinces et des territoires du Canada en 2020. Statistique Canada. Tableau 17-10-0005-01 Estimations de la population au 1er juillet, par âge et sexe.
Usage
Proter_Canada
Format
A data frame with 13 observations on the following 2 variables.
- ProTer
a character vector
- Population
a numeric vector
References
Examples
data(Proter_Canada)
str(Proter_Canada)
barplot(Proter_Canada$Population, names.arg=Proter_Canada$ProTer, las=2)
Population du Canada par classes d'âge et provinces et territoires en 2020
Description
Répartition en provinces et territoires et sexe de la population du Canada en 2020. Statistique Canada. Tableau 17-10-0005-01 Estimations de la population au 1er juillet, par âge et sexe.
Usage
ProtervsSexe_Canada
Format
Un jeu de données avec 13 observations de 2 variables.
- Hommes
- Femmes
References
Personnes en réanimation atteintes de la Covid 19 (21/02/2021)
Description
Répartition par région française du nombre de personne en réanimation et atteintes de la Covid 19 le 21 février 2021.
Usage
ReaFull
Format
Un jeu de données avec 19 observations de 12 variables.
- Région
- Tous.âges
- X0.9
- X11.19
- X20.29
- X30.39
- X40.49
- X50.59
- X60.69
- X70.79
- X80.89
- X90.
Résistance à l'éclatement
Description
Résistance à l'éclatement.
Usage
Resistance
Format
Un vecteur avec 30 observations.
Part du revenu national total équivalent en Euro en 2019
Description
Répartitition du revenu par quantiles - enquêtes EU-SILC et PCM (ILC_DI01).
Usage
Richesse
Format
Un jeu de données avec 10 observations de 36 variables.
- "Déciles"
- "Belgique"
- "Bulgarie"
- "Tchéquie"
- "Danemark"
- "Allemagne..jusqu.en.1990..ancien.territoire.de.la.RFA."
- "Estonie"
- "Irlande"
- "Grèce"
- "Espagne"
- "France"
- "Croatie"
- "Italie"
- "Chypre"
- "Lettonie"
- "Lituanie"
- "Luxembourg"
- "Hongrie"
- "Malte"
- "Pays.Bas"
- "Autriche"
- "Pologne"
- "Portugal"
- "Roumanie"
- "Slovénie"
- "Slovaquie"
- "Finlande"
- "Suède"
- "Islande"
- "Norvège"
- "Suisse"
- "Royaume.Uni"
- "Monténégro"
- "Macédoine.du.Nord"
- "Serbie"
- "Turquie"
Emploi par secteur et par pays dans les pays de l'OCDE en 2020-Q3.
Description
Emploi par secteur d'activité et par pays (indicateur). OCDE (2021). doi:10.1787/6b2fff89-fr. (Consulté le 11 février 2021). ‘INDUSCONSTR désigne l’activité industrielle AVEC la construction.
Usage
Secteur
Format
Un jeu de données avec 34 observations de 6 variables .
- PAYS
Nombres de personnes dans un foyer
- AGR
Nombres de foyers
- CONSTR
Nombres de foyers
- INDUSCONSTR
Nombres de foyers
- MFG
Nombres de foyers
- SERV
Nombres de foyers
Nombre de sièges et de voix dans l'Union européenne
Description
Nombre de sièges et de voix dans l'Union européenne.
Usage
Sieges_Voix
Format
Un jeu de données avec 27 observations de 4 variables.
- Etats.Membres
- Date.entrée
- Sièges.au.parlement
- Voix.au.conseil
Emploi total par pays dans les pays de l'OCDE en 2020-Q3.
Description
Emploi total par pays (indicateur). OCDE (2021). doi:10.1787/6b2fff89-fr. (Consulté le 11 février 2021).
Usage
Total_Pays
Format
Un jeu de données avec 34 observations de 2 variables.
- NameX
Acronyme du pays
- Effectif
Nombres de personnes
Emploi total par secteur dans les pays de l'OCDE en 2020-Q3.
Description
Emploi total par secteur d'activité (indicateur). OCDE (2021). doi:10.1787/6b2fff89-fr. (Consulté le 11 février 2021).
L'industrie (INDUSwithoutCONSTR
) désigne l'activité industrielle SANS la construction.
Usage
Total_Secteur
Format
Un jeu de données avec 5 observations de 3 variables.
- Secteur
Acronyme du secteur d'actvité
- NameX
Nom du secteur d'actvité
- Effectif
Nombres de personnes
Air pollution data
Description
Échantillon de 50 villes (individus) tirées aléatoirement sur la pollution de l'air aux États-Unis en 1960
Usage
air_pollution
Format
A data frame with 50 observations on the following 15 variables.
- CITY
a factor with levels
AUGUSTA
AUSTIN
BEAUMONT
BOSTON
BRIDGEPO
CHARLEST
CHARLOTT
CHATTANO
CHICAGO
CLEVELAN
COLUMBUS
DALLAS
DAYTON
DENVER
DES_MOIN
DETROIT
EL_PASO
FALL_RIV
FLINT
FORT_WOR
FRESNO
GALVESTO
HUNTINGT
INDIANAP
JACKSON
JERSEY_C
JOHNSTOW
KNOXVILL
MACON
MEMPHIS
MIAMI
MILWAUKE
MOBILE
NASHVIL
NORFOLK
OMAHA
PHOENIX
PROVIDEN
READING
ROCKFORD
SAVANNAH
SEATTLE
SIOUX_FA
SOUTH_BE
TOLEDO
TOPEKA
WINSTON
YORK
YOUNGSTO
. Ville où les données ont été observées.- TMR
a numeric vector. Taux de mortalité exprimé en 1/10000.
- SMIN
a numeric vector. Plus petite valeur des relevés réalisés deux fois par semaine de sulfate (micro-g/m3 multiplié par 10).
- SMEAN
a numeric vector. Moyenne arithmétique des relevés réalisés deux fois par semaine de sulfate (micro-g/m3 multiplié par 10).
- SMAX
a numeric vector. Plus grande valeur des relevés réalisés deux fois par semaine de sulfate (micro-g/m3 multiplié par 10).
- PMIN
a numeric vector. Plus petite valeur des relevés réalisés deux fois par semaine de particules suspendues dans l'air (micro-g/m3 multiplié par 10).
- PMEAN
a numeric vector. Moyenne arithmétique des relevés réalisés deux fois par semaine de particules suspendues dans l'air (micro-g/m3 multiplié par 10).
- PMAX
a numeric vector. Logarithme de la plus grande valeur des relevés réalisés deux fois par semaine de particules suspendues dans l'air (micro-g/m3 multiplié par 10).
- PM2
a numeric vector. Densité de la population par mile carré (multiplié par 0,1).
- PERWH
a numeric vector. Pourcentage de population blanche.
- NONPOOR
a numeric vector. Pourcentage de ménages avec un revenu au dessus du seuil de pauvreté.
- GE65
a numeric vector. Pourcentage (multiplié par 10) de la population des 65 ans et plus.
- LPOP
a numeric vector. Logarithme (en base 10 et multiplié par 10) de la population.
- l_pm2
a numeric vector. Logarithme de la densité de la population par mile carré (multiplié par 0,1).
- l_pmax
a numeric vector. Logarithme de la plus grande valeur des relevés réalisés deux fois par semaine de particules suspendues dans l'air (micro-g/m3 multiplié par 10).
Examples
data(air_pollution)
str(air_pollution)
library(ggplot2)
library(GGally)
GGally::ggpairs(air_pollution[,2:4],)
Indices d'attraction/répulsion
Description
Fonction de calcul et de représentation des indices d'attraction/répulsion
Usage
att_rep_ind(data)
Arguments
data |
Jeux de données |
Value
Liste à un élément qui content le tableau croisé des indices.
Examples
data(champignons)
champ_sel <- champignons[,c("couleur_chapeau","contusions","odeur",
"espacement_lamelle","habitat")]
sageR::att_rep_ind(champ_sel)
Évaluation du risque de défaut d'entreprises
Description
Les données de la base sont issues de Bloomberg. On s'intéresse au risque d'insolvabilité de 1060 entreprises cotées en bourse, durant l'année 2018, et appartenant à divers secteurs d'activité. Cette problématique est importante pour les investisseurs sur les marchés de capitaux internationaux qui prêtent aux entreprises, notamment en devenant actionnaires. L'information sur les risques financiers des entreprises est généralement fournie par des agences de notation : S&P, Fitch et Moody's. Dans la base, nous retenons les notations attribuées par S&P aux entreprises.
Elles portent sur une évaluation du risque de défaut (le fait que l'entreprise ayant emprunté des fonds se retrouve un jour en incapacité de rembourser), et les notes vont de AAA à CCC-. La grille de notation est la suivante :
- •
AAA est la note la plus élevée et correspond à une sécurité maximale pour un investisseur qui détiendrait des parts dans l'entreprise concernée par la note. Le risque de défaut est quasiment nul ;
- •
AA+, AA et AA- correspondent à une sécurité haute ou bonne (le risque de défaut est faible) ;
- •
A+, A et A- correspondent à une qualité moyenne supérieure ;
- •
BBB+, BBB et BBB- à une qualité moyenne inférieure ;
- •
BB+, BB, ..., B- est un ensemble de notes classant les actifs des entreprises dans la catégorie spéculative, c'est-à-dire suffisamment risquée de telle sorte que le détenteur des parts de l'entreprise peut s'attendre à un défaut avec une probabilité forte ;
- •
CCC+, CCC, CCC-, D est une dernière catégorie de notes qui correspond à des actifs pour lesquels le risque de défaut est très élevé.
Pour nos entreprises, les notes figurent dans la colonne du tableau 1 intitulée SP
(dernière colonne).
La variable SP
est qualitative et polytomique (puisqu'elle peut prendre plus de deux modalités).
Pour la transformer en une variable quantitative dichotomique, nous allons supposer que les agences de notation veulent envoyer un signal clair aux investisseurs, en différenciant les entreprises qui sont en bonne santé des autres.
Pour ce faire, chaque fois que la note sera supérieure à BB+, nous attribuons la valeur 1 à l'observation (entreprises en bonne santé présentant un risque de défaut ou de défaillance faible).
Et pour toute note inférieure à BB+, nous attribuons la valeur 0 (entreprises en mauvaise santé présentant un risque de défaut élevé).
Nous appelons la nouvelle variable Risque. Notons que le critère utilisé ici est arbitraire et un autre découpage pourrait être retenu.
Voir les colonnes intitulées Risque
et Défaut
.
La colonne Défaut2
correspond à un autre classement des entreprises, en les hiérarchisant des plus performantes aux moins performantes:
- 1.-
pour les entreprises ayant une notation comprise entre AAA et A- (de première qualité à qualité moyenne supérieure) ;
- 2.-
pour les entreprises ayant une notation comprise entre BBB+ à BBB- (qualité moyenne inférieure) ;
- 3.-
pour les entreprises ayant une notation comprise inférieure à BBB- (un investisseur achetant des actifs de ces entreprises.
#' devrait les considérées comme spéculatifs ou incorporant un risque de défaut élevé).
Variables explicatives
Dans la base de données, nous avons retenu des variables qui sont habituellement liées aux performances des entreprises :
- •
Liquid
: un ratio de liquidité, mesuré par le rapport entre l'actif circulant et l'exigible à court terme. Cette variable capte le risque de liquidité, c'est-à-dire l'incapacité des entreprises à rembourser des dettes exigibles à court terme (moins d'un an).- •
ROE
: le ratio du résultat net sur les capitaux propres. C'est une mesure de la rentabilité des capitaux investis par les actionnaires de l'entreprise.- •
Marge
: la marge bénéficiaire nette en pourcentage, c'est-à-dire la part du chiffre d'affaires que l'entreprise conserve après paiement de ses frais d'exploitation, des remboursements d'intérêt et du paiement de ses impôts.- •
OPM
: la marge opérationnelle définie comme le ratio du résultat d'exploitation et du chiffre d'affaires.
Il s'agit de mesurer la performance économique de l'entreprise et donc sa viabilité à moyen/long terme. En plus de ces variables qui renseignent sur des indicateurs de fonctionnement de l'entreprise, il est important de s'intéresser à des éléments ayant un impact direct sur leurs dettes. Trois indicateurs sont retenus ici :
- •
Benef
: le bénéfice avant intérêt, impôts et amortissement. Cette variable est un indicateur du profit de l'entreprise.- •
Net
: le ratio des dettes financières surBenef
. Il s'agit de mesurer la capacité d'une entreprise à rembourser ses dettes en utilisant ses profits.- •
Roul
: le besoin en fonds de roulement. Il s'agit de la somme à mettre de côté pour pouvoir payer ses charges.
C'est un indicateur d'autonomie financière de l'entreprise.
Usage
bilan
Format
A data frame with 1060 observations on the following 14 variables.
- Entreprise
a character vector. Nom de l'entreprise.
- id
a numeric vector. Identifiant de l'entreprise.
- ROE
a numeric vector. Le ratio du résultat net sur les capitaux propres. C'est une mesure de la rentabilité des capitaux investis par les actionnaires de l'entreprise.
- OPM
a numeric vector. La marge opérationnelle définie comme le ratio du résultat d'exploitation et du chiffre d'affaires.
- Marge
a numeric vector. La marge bénéficiaire nette en pourcentage, c'est-à-dire la part du chiffre d'affaires que l'entreprise conserve après paiement de ses frais d'exploitation, des remboursements d'intérêt et du paiement de ses impôts.
- Net
a numeric vector. Le ratio des dettes financières sur Benef. Il s'agit de mesurer la capacité d'une entreprise à rembourser ses dettes en utilisant ses profits.
- Benef
a numeric vector. Le bénéfice avant intérêt, impôts et amortissement. Cette variable est un indicateur du profit de l'entreprise.
- Liquid
a numeric vector. Un ratio de liquidité, mesuré par le rapport entre l'actif circulant et l'exigible à court terme. Cette variable capte le risque de liquidité, c'est-à-dire l'incapacité des entreprises à rembourser des dettes exigibles à court terme (moins d'un an).
- Roul
a numeric vector. Le besoin en fonds de roulement. Il s'agit de la somme à mettre de côté pour pouvoir payer ses charges. C'est un indicateur d'autonomie financière de l'entreprise.
- SP...10
a character vector. Notation S&P.
- Risque
a numeric vector. Risque de défaut transformé en variable binaire.
- Défaut
a character vector. Risque de défaut.
- Défaut2
a character vector. Un autre classement des entreprises, en les hiérarchisant des plus performantes aux moins performantes.
- SP...14
a character vector. Notation S&P.
Source
Bloomberg.
Examples
data(bilan)
str(bilan)
plot(bilan)
Prix journalier du Bitcoin du 31/12/2014 au 15/05/2018
Description
Les données décrivent l'évolution du prix journalier du Bitcoin sur la période du 31/12/2014 au 15/05/2018. Les données sont publiques et disponibles sur le site de Yahoo finance (https://fr.finance.yahoo.com/quote/BTC-EUR/history?p=BTC-EUR).
Usage
bitcoin
Format
A data frame with 1233 observations on the following 2 variables.
- Date
a POSIXct
- Bitcoin
a numeric vector
Source
Yahoo finance (https://fr.finance.yahoo.com/quote/BTC-EUR/history?p=BTC-EUR)
Examples
data(bitcoin)
str(bitcoin)
plot(bitcoin)
Caractéristiques de champignons
Description
Caractéristiques de 1000 champignons.
Usage
champignons
Format
A data frame with 1000 observations on the following 8 variables.
- num_champ
a numeric vector. Numéro du champignon.
- classes
a factor with levels
comestible
veneneux
. Classes.- couleur_chapeau
a factor with levels
blanc
gris
jaune
marron
rouge
. Couleur du chapeau.- contusions
a factor with levels
abime
non
. Contusions.- odeur
a factor with levels
amande
anis
apre
inodore
. Odeur du champignon.- espacement_lamelle
a factor with levels
ferme
serre
. Espacement des lamelles.- couleur_tige_dessus
a factor with levels
blanc
gris
rose
. Couleur du dessus de la tige.- habitat
a factor with levels
foret
pelouse
prairies
sentier
urbain
. Habitat.
Examples
data(champignons)
str(champignons)
summary(champignons)
Consommation d'électricité
Description
Consommation d'électricité journalière en France de l'année 2003?
Usage
conso_temp
Format
A data frame with 365 observations on the following 8 variables.
- Date
a factor with levels
01/01/2003
01/02/2003
01/03/2003
01/04/2003
01/05/2003
01/06/2003
01/07/2003
01/08/2003
01/09/2003
01/10/2003
01/11/2003
01/12/2003
02/01/2003
02/02/2003
02/03/2003
02/04/2003
02/05/2003
02/06/2003
02/07/2003
02/08/2003
02/09/2003
02/10/2003
02/11/2003
02/12/2003
03/01/2003
03/02/2003
03/03/2003
03/04/2003
03/05/2003
03/06/2003
03/07/2003
03/08/2003
03/09/2003
03/10/2003
03/11/2003
03/12/2003
04/01/2003
04/02/2003
04/03/2003
04/04/2003
04/05/2003
04/06/2003
04/07/2003
04/08/2003
04/09/2003
04/10/2003
04/11/2003
04/12/2003
05/01/2003
05/02/2003
05/03/2003
05/04/2003
05/05/2003
05/06/2003
05/07/2003
05/08/2003
05/09/2003
05/10/2003
05/11/2003
05/12/2003
06/01/2003
06/02/2003
06/03/2003
06/04/2003
06/05/2003
06/06/2003
06/07/2003
06/08/2003
06/09/2003
06/10/2003
06/11/2003
06/12/2003
07/01/2003
07/02/2003
07/03/2003
07/04/2003
07/05/2003
07/06/2003
07/07/2003
07/08/2003
07/09/2003
07/10/2003
07/11/2003
07/12/2003
08/01/2003
08/02/2003
08/03/2003
08/04/2003
08/05/2003
08/06/2003
08/07/2003
08/08/2003
08/09/2003
08/10/2003
08/11/2003
08/12/2003
09/01/2003
09/02/2003
09/03/2003
09/04/2003
09/05/2003
09/06/2003
09/07/2003
09/08/2003
09/09/2003
09/10/2003
09/11/2003
09/12/2003
10/01/2003
10/02/2003
10/03/2003
10/04/2003
10/05/2003
10/06/2003
10/07/2003
10/08/2003
10/09/2003
10/10/2003
10/11/2003
10/12/2003
11/01/2003
11/02/2003
11/03/2003
11/04/2003
11/05/2003
11/06/2003
11/07/2003
11/08/2003
11/09/2003
11/10/2003
11/11/2003
11/12/2003
12/01/2003
12/02/2003
12/03/2003
12/04/2003
12/05/2003
12/06/2003
12/07/2003
12/08/2003
12/09/2003
12/10/2003
12/11/2003
12/12/2003
13/01/2003
13/02/2003
13/03/2003
13/04/2003
13/05/2003
13/06/2003
13/07/2003
13/08/2003
13/09/2003
13/10/2003
13/11/2003
13/12/2003
14/01/2003
14/02/2003
14/03/2003
14/04/2003
14/05/2003
14/06/2003
14/07/2003
14/08/2003
14/09/2003
14/10/2003
14/11/2003
14/12/2003
15/01/2003
15/02/2003
15/03/2003
15/04/2003
15/05/2003
15/06/2003
15/07/2003
15/08/2003
15/09/2003
15/10/2003
15/11/2003
15/12/2003
16/01/2003
16/02/2003
16/03/2003
16/04/2003
16/05/2003
16/06/2003
16/07/2003
16/08/2003
16/09/2003
16/10/2003
16/11/2003
16/12/2003
17/01/2003
17/02/2003
17/03/2003
17/04/2003
17/05/2003
17/06/2003
17/07/2003
17/08/2003
17/09/2003
17/10/2003
17/11/2003
17/12/2003
18/01/2003
18/02/2003
18/03/2003
18/04/2003
18/05/2003
18/06/2003
18/07/2003
18/08/2003
18/09/2003
18/10/2003
18/11/2003
18/12/2003
19/01/2003
19/02/2003
19/03/2003
19/04/2003
19/05/2003
19/06/2003
19/07/2003
19/08/2003
19/09/2003
19/10/2003
19/11/2003
19/12/2003
20/01/2003
20/02/2003
20/03/2003
20/04/2003
20/05/2003
20/06/2003
20/07/2003
20/08/2003
20/09/2003
20/10/2003
20/11/2003
20/12/2003
21/01/2003
21/02/2003
21/03/2003
21/04/2003
21/05/2003
21/06/2003
21/07/2003
21/08/2003
21/09/2003
21/10/2003
21/11/2003
21/12/2003
22/01/2003
22/02/2003
22/03/2003
22/04/2003
22/05/2003
22/06/2003
22/07/2003
22/08/2003
22/09/2003
22/10/2003
22/11/2003
22/12/2003
23/01/2003
23/02/2003
23/03/2003
23/04/2003
23/05/2003
23/06/2003
23/07/2003
23/08/2003
23/09/2003
23/10/2003
23/11/2003
23/12/2003
24/01/2003
24/02/2003
24/03/2003
24/04/2003
24/05/2003
24/06/2003
24/07/2003
24/08/2003
24/09/2003
24/10/2003
24/11/2003
24/12/2003
25/01/2003
25/02/2003
25/03/2003
25/04/2003
25/05/2003
25/06/2003
25/07/2003
25/08/2003
25/09/2003
25/10/2003
25/11/2003
25/12/2003
26/01/2003
26/02/2003
26/03/2003
26/04/2003
26/05/2003
26/06/2003
26/07/2003
26/08/2003
26/09/2003
26/10/2003
26/11/2003
26/12/2003
27/01/2003
27/02/2003
27/03/2003
27/04/2003
27/05/2003
27/06/2003
27/07/2003
27/08/2003
27/09/2003
27/10/2003
27/11/2003
27/12/2003
28/01/2003
28/02/2003
28/03/2003
28/04/2003
28/05/2003
28/06/2003
28/07/2003
28/08/2003
28/09/2003
28/10/2003
28/11/2003
28/12/2003
29/01/2003
29/03/2003
29/04/2003
29/05/2003
29/06/2003
29/07/2003
29/08/2003
29/09/2003
29/10/2003
29/11/2003
29/12/2003
30/01/2003
30/03/2003
30/04/2003
30/05/2003
30/06/2003
30/07/2003
30/08/2003
30/09/2003
30/10/2003
30/11/2003
30/12/2003
31/01/2003
31/03/2003
31/05/2003
31/07/2003
31/08/2003
31/10/2003
31/12/2003
. Date.- conso
a numeric vector. Consommation d'électricité en MWH.
- t
a numeric vector. Numéro du jour.
- nom_jour
a factor with levels
Dimanche
Jeudi
Lundi
Mardi
Mercredi
Samedi
Vendredi
. Nom du jour de la semaine.- mois
a factor with levels
Août
Avril
Décembre
Février
Janvier
Juillet
Juin
Mai
Mars
Novembre
Octobre
Septembre
. Nom du mois.- temp
a numeric vector. Température en degrés Celsius.
- ejp
a numeric vector. Statut du jour EDF (spécial = 1 ; non spécial = 0).
- ferie
a factor with levels
non
oui
. Statut du jour annuel (férié ou non).
Examples
data(conso_temp)
str(conso_temp)
plot(conso_temp$conso)
Dotchart de Cleveland améliorés (Enhanced Cleveland's dotchart)
Description
dotchart3 est une version améliorée des fonctions dotchart et dotchart2 qui permettent de construire des diagrammes à points de Cleveland.
Usage
dotchart3(
x,
labels = NULL,
groups = NULL,
gdata = NULL,
cex = par("cex"),
pch = 21,
gpch = 21,
bg = par("bg"),
color = par("fg"),
gcolor = par("fg"),
lcolor = "gray",
xlim = range(x[is.finite(x)]),
main = NULL,
xlab = NULL,
ylab = NULL,
cex.axis = cex,
...
)
Arguments
x |
soit un tableau ou une matrice de valeurs numériques (les |
labels |
un vecteur d'étiquettes pour chaque point. Pour les vecteurs, la valeur par défaut est d'utiliser |
groups |
un facteur optionnel indiquant comment les éléments de |
gdata |
les valeurs des données pour les groupes. Il s'agit généralement d'un résumé tel que la médiane ou la moyenne de chaque groupe. |
cex |
la taille des caractères à utiliser. Fixer |
pch |
le caractère ou le symbole de traçage à utiliser. |
gpch |
le caractère ou le symbole de tracé à utiliser pour les valeurs de groupe. |
bg |
la couleur de fond des caractères ou symboles à utiliser pour le tracé ; utilisez |
color |
la (les) couleur(s) à utiliser pour les points et les étiquettes. |
gcolor |
la couleur unique à utiliser pour les étiquettes et les valeurs de groupe. |
lcolor |
la (les) couleur(s) à utiliser pour les lignes horizontales. |
xlim |
largeur horizontale de la zone de tracé, voir |
main |
titre général du graphique, voir |
xlab |
les annotations de l'axe des abscisses définies comme dans |
ylab |
les annotations de l'axe des ordonnées définies comme dans |
cex.axis |
la taille des caractères à utiliser pour les annotations des axes. |
... |
les paramètres graphiques peuvent également être spécifiés comme arguments. |
Value
Un dotplot de la série statistique.
Author(s)
Frederic Bertrand, frederic.bertrand@utt.fr
References
F. Bertrand, Ch. Derquenne, G. Dufrénot, F. Jawadi and M. Maumy, C. Borsenberger editor, Statistiques pour l’économie et la gestion, De Boeck Supérieur, Louvain-la-Neuve, 2021.
See Also
Other plot functions:
plotcdf3()
Examples
data(Total_Secteur)
NameX <- Total_Secteur$NameX
Effectif <- Total_Secteur$Effectif
dotchart3(Effectif,labels=NameX,pch=19,col="#00FFFF",cex=1.6,cex.axis=1.2)
dotchart3(Effectif,labels=NameX,pch=19,col="#00FFFF")
Calcule les coordonnées des points d'un cercle (Generate circle coordinates)
Description
Generate coordinates to draw a circle.
Usage
funcCircleCoords(center = c(0, 0), r = 1, npoints = 100)
Arguments
center |
coordinate for centroid |
r |
radius |
npoints |
number of coordinates to generate |
Value
a dataframe
Source
Adapted from Joran's response to https://stackoverflow.com/questions/6862742/draw-a-circle-with-ggplot2.
Examples
funcCircleCoords(c(1,2),1)
plot(funcCircleCoords(c(1,2),1))
Diagrammes en radar avancés pour ggplot2 (Enhanced Radar Plots for ggplot2)
Description
Diagrammes en radar avancés pour ggplot2 (Enhanced Radar Plots for ggplot2)
Usage
ggradar(
plot.data,
base.size = 15,
font.radar = "sans",
values.radar = c("0%", "50%", "100%"),
axis.labels = colnames(plot.data)[-1],
grid.min = 0,
grid.mid = 0.5,
grid.max = 1,
centre.y = grid.min - ((1/9) * (grid.max - grid.min)),
plot.extent.x.sf = 1,
plot.extent.y.sf = 1.2,
x.centre.range = 0.02 * (grid.max - centre.y),
label.centre.y = FALSE,
grid.line.width = 0.5,
gridline.min.linetype = "longdash",
gridline.mid.linetype = "longdash",
gridline.max.linetype = "longdash",
gridline.min.colour = "grey",
gridline.mid.colour = "#007A87",
gridline.max.colour = "grey",
grid.label.size = 6,
gridline.label.offset = -0.1 * (grid.max - centre.y),
label.gridline.min = TRUE,
label.gridline.mid = TRUE,
label.gridline.max = TRUE,
axis.label.offset = 1.15,
axis.label.size = 5,
axis.line.colour = "grey",
group.line.width = 1.5,
group.point.size = 6,
group.colours = NULL,
background.circle.colour = "#D7D6D1",
background.circle.transparency = 0.2,
plot.legend = if (nrow(plot.data) > 1) TRUE else FALSE,
legend.title = "",
plot.title = "",
legend.text.size = 14,
legend.position = "left"
)
Arguments
plot.data |
dataframe comprising one row per group |
base.size |
text size |
font.radar |
text font family |
values.radar |
values to print at minimum, 'average', and maximum gridlines |
axis.labels |
names of axis labels if other than column names supplied via plot.data |
grid.min |
value at which mininum grid line is plotted |
grid.mid |
value at which 'average' grid line is plotted |
grid.max |
value at which maximum grid line is plotted |
centre.y |
value of y at centre of plot |
plot.extent.x.sf |
controls relative size of plot horizontally |
plot.extent.y.sf |
controls relative size of plot vertically |
x.centre.range |
controls axis label alignment |
label.centre.y |
whether value of y at centre of plot should be labelled |
grid.line.width |
width of gridline |
gridline.min.linetype |
line type of minimum gridline |
gridline.mid.linetype |
line type of 'average' gridline |
gridline.max.linetype |
line type of maximum gridline |
gridline.min.colour |
colour of minimum gridline |
gridline.mid.colour |
colour of 'average' gridline |
gridline.max.colour |
colour of maximum gridline |
grid.label.size |
text size of gridline label |
gridline.label.offset |
displacement to left/right of central vertical axis |
label.gridline.min |
whether or not to label the mininum gridline |
label.gridline.mid |
whether or not to label the 'mininum'average' gridline |
label.gridline.max |
whether or not to label the maximum gridline |
axis.label.offset |
vertical displacement of axis labels from maximum grid line, measured relative to circle diameter |
axis.label.size |
text size of axis label |
axis.line.colour |
colour of axis line |
group.line.width |
line width of group |
group.point.size |
point size of group |
group.colours |
colour of group |
background.circle.colour |
colour of background circle/radar |
background.circle.transparency |
transparency of background circle/radar |
plot.legend |
whether to include a plot legend |
legend.title |
title of legend |
plot.title |
title of radar plot |
legend.text.size |
text size in legend |
legend.position |
position of legend, valid values are "top", "right", "bottom", "left" |
Value
a ggplot object
Source
Most of the code is from https://rstudio-pubs-static.s3.amazonaws.com/5795_e6e6411731bb4f1b9cc7eb49499c2082.html.
Examples
library(dplyr)
library(scales)
library(tibble)
mtcars_radar <- mtcars %>%
as_tibble(rownames = "group") %>%
mutate_at(vars(-group), rescale) %>%
tail(4) %>%
select(1:10)
mtcars_radar
ggradar(mtcars_radar)
Moyenne, variance et variance corrigée (Sheppard)
Description
Pour une distribution groupée, cette fonction la moyenne, la variance et la variance corrigée à l'aide de la correction de Sheppard.
Usage
moments.grouped(gp.data, population = FALSE)
Arguments
gp.data |
Un objet de classe grouped.data créé avec le package |
population |
Un booléen qui indique si le calcul est réalisé à partir d'une population ( |
Value
Une liste comportant trois éléments :
La moyenne de la distribution groupée
mu
La variance de la distribution non corrigée avec la correction de Sheppard
sigma2
La variance de la distribution corrigée avec la correction de Sheppard
sigma2Adj
L'asymétrie de Fisher de la distribution
sigma2
L'asymétrie de Pearson de la distribution
sigma2
L'applatissement de Pearson de la distribution corrigée avec la correction de Sheppard
sigma2
L'applatissement de Fisher de la distribution corrigée avec la correction de Sheppard
sigma2
Examples
lims <- c(40, 45, 50, 55, 60, 65, 70, 75)
counts <- c(1,2,3,4,0,0,1)
grouped.example <- actuar::grouped.data(Group = lims, Frequency = counts)
moments.grouped(grouped.example)
Stéréogramme avec plotcdf3 (Stereogram with plotcdf3)
Description
Cette fonction construit un stéréogramme permettant de juger de l'association entre deux variables discrètes ou groupées en classes.
Usage
plotcdf3(
x,
y,
f,
xaxe,
yaxe,
col = NULL,
border = FALSE,
Nxy = 200,
theme = "0"
)
Arguments
x |
Valeurs observées ou modalités de la première variable discrète |
y |
Valeurs observées ou modalités de la seconde variable discrète |
f |
Si f=0 (donc length(f)=0), x et y sont deux séries statistiques. Si length(f)>1, f est un tableau de fréquences et x et y les noms des lignes et des colonnes de f. |
xaxe |
Nom de l'axe des abscisses |
yaxe |
Nom de l'axe des ordonnées |
col |
Couleur du stéréogramme |
border |
Le maillage du graphique doit-il être affiché ? |
Nxy |
Pas du maillage pour chaque axe |
theme |
Le thème détermine la palette de couleurs utilisées. Il y a quatre choix possibles en couleurs "0", "1", "2", "3" et un en nuances de gris "bw" |
Value
Un stéréogramme des deux séries statistiques groupées ou des deux séries statistiques discrètes étudiées.
Author(s)
Frederic Bertrand, frederic.bertrand@utt.fr
References
F. Bertrand, Ch. Derquenne, G. Dufrénot, F. Jawadi and M. Maumy, C. Borsenberger editor, Statistiques pour l’économie et la gestion, De Boeck Supérieur, Louvain-la-Neuve, 2021.
See Also
Other plot functions:
dotchart3()
Examples
ff=table(cut(Europe$Partiel_H,c(0,10,20,30)),
cut(Europe$Partiel_F,c(0,10,20,30,40,50,60,70,80)))/
sum(table(cut(Europe$Partiel_H,c(0,10,20,30)),
cut(Europe$Partiel_F,c(0,10,20,30,40,50,60,70,80))))
plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80),
f=ff,xaxe="Hommes",yaxe="Femmes",theme="0")
plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80),
f=ff,xaxe="Hommes",yaxe="Femmes",theme="1")
plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80),
f=ff,xaxe="Hommes",yaxe="Femmes",theme="2")
plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80),
f=ff,xaxe="Hommes",yaxe="Femmes",theme="cyan")
plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80),
f=ff,xaxe="Hommes",yaxe="Femmes",theme="cyan",border=TRUE)
plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80),
f=ff,xaxe="Hommes",yaxe="Femmes",theme="bw")
xx=seq(1.5,12.5)
yy=seq(0.5,6.5)
p=c(1/36,0,0,0,0,0,
2/36,0,0,0,0,0,
2/36,1/36,0,0,0,0,
2/36,2/36,0,0,0,0,
2/36,2/36,1/36,0,0,0,
2/36,2/36,2/36,0,0,0,
0,2/36,2/36,1/36,0,0,
0,0,2/36,2/36,0,0,
0,0,0,2/36,1/36,0,
0,0,0,0,2/36,0,
0,0,0,0,0,1/36)
p=matrix(p,byrow=TRUE,ncol=6)
plotcdf3(xx,yy,p,"somme des des","valeur du plus petit")
Résultats des élections présidentielles françaises de 2012
Description
Résultats par département au premier tour des élections présidentielles françaises de 2012.
Usage
presid_2012
Format
A data frame with 96 observations on the following 13 variables.
- departement
a factor with levels
Ain
Aisne
Allier
Alpes-de-Haute-Provence
Alpes-Maritimes
Ardèche
Ardennes
Ariège
Aube
Aude
Aveyron
Bas-Rhin
Bouches-du-Rhône
Calvados
Cantal
Charente
Charente-Maritime
Cher
Corrèze
Corse-du-Sud
Côte-d'Or} \code{Côtes-d'Armor
Creuse
Deux-Sèvres
Dordogne
Doubs
Drôme
Essonne
Eure
Eure-et-Loir
Finistère
Gard
Gers
Gironde
Haut-Rhin
Haute-Corse
Haute-Garonne
Haute-Loire
Haute-Marne
Haute-Saône
Haute-Savoie
Haute-Vienne
Hautes-Alpes
xxj1dklA5nLg7FZdXLYf58wWtjD8JgCw-44Hauts-de-Seine
Hérault
Ille-et-Vilaine
Indre
Indre-et-Loire
Isère
Jura
Landes
Loir-et-Cher
Loire
Loire-Atlantique
Loiret
Lot
Lot-et-Garonne
Lozère
Maine-et-Loire
Manche
Marne
Mayenne
Meurthe-et-Moselle
Meuse
Morbihan
Moselle
Nièvre
Nord
Oise
Orne
Paris
Pas-de-Calais
Puy-de-Dôme
xxj1dklA5nLg7FZdXLYf58wWtjD8JgCw-75xxj1dklA5nLg7FZdXLYf58wWtjD8JgCw-76Rhône
Saône-et-Loire
Sarthe
Savoie
Seine-et-Marne
Seine-Maritime
Seine-Saint-Denis
Somme
Tarn
Tarn-et-Garonne
Territoire_de_Belfort
Val-dOise
Val-de-Marne
Var
Vaucluse
Vendée
Vienne
Vosges
Yonne
Yvelines
. Nom du département (métropole) où les suffrages ont été dénombrés.- abstentions_1
a numeric vector. Abstentions du 1er tour.
- blancs_ou_nuls_1
a numeric vector. Bulletins blancs ou nuls au 1er tour.
- bayrou
a numeric vector. Candidat Bayrou.
- hollande_1
a numeric vector. Candidat Hollande au 1er tour.
- cheminade
a numeric vector. Candidat Cheminade.
- melenchon
a numeric vector. Candidat Mélenchon.
- dupont_aignan
a numeric vector. Candidat Dupont-Aignan.
- sarkozy_1
a numeric vector. Candidat Sarkozy au 1er tour.
- poutou
a numeric vector. Candidat Poutou.
- joly
a numeric vector. Candidate Joly.
- le_pen
a numeric vector. Candidate Le Pen.
- arthaud
a numeric vector. Candidate Arthaud.
Examples
data(presid_2012)
str(presid_2012)
plot(presid_2012)
library(vcd)
vcd::mosaic(t(as.table(as.matrix(presid_2012[1:5,-1]))),
rot_labels=c(0,90,0,0), just_labels = "right")
Correction de Sheppard et variance
Description
Calcul de la correction de Sheppard pour la variance.
Usage
sheppardCorrection(gp.data, order = 2, population = FALSE)
Arguments
gp.data |
Un objet de classe grouped.data créé avec le package |
order |
Choix de l'ordre pour la correction de Sheppard. Ne peut être égal qu'à 2 ou 4. |
population |
Un booléen qui indique si le calcul est réalisé à partir d'une population ( |
Value
Un vecteur contenant la valeur de la correction de Sheppard pour le calcul de la variance d'une distribution groupée.
Examples
lims <- c(40, 45, 50, 55, 60, 65, 70, 75)
counts <- c(1,2,3,4,0,0,1)
grouped.example <- actuar::grouped.data(Group = lims, Frequency = counts)
sheppardCorrection(grouped.example)
sheppardCorrection(grouped.example, order=4)