Help for package sageR

Type:

Package

Title:

Applied Statistics for Economics and Management with R

Version:

0.7.0

Date:

2025-09-21

Depends:

R (≥ 3.5.0)

Imports:

ggplot2

Suggests:

knitr, markdown, prettydoc, rmarkdown, testthat (≥ 3.0.0), covr, learnr, spelling, lattice, spatstat.data, Matrix, mgcv, PMCMRplus, devtools, DescTools, GGally, VGAM, car, dplyr, tibble, ggiraphExtra, scales, spatstat, vcd, FactoMineR, cluster, caret, corrplot, actuar

Author:

Frederic Bertrand

[cre, aut], Claire Borsenberger [ctb], Christian Derquenne [ctb], Gilles Dufrénot [ctb], Fredj Jawadi [ctb], Myriam Maumy-Bertrand

[aut]

Maintainer:

Frederic Bertrand <frederic.bertrand@lecnam.net>

Description:

Datasets and functions for the book "Statistiques pour l’économie et la gestion", "Théorie et applications en entreprise", F. Bertrand, Ch. Derquenne, G. Dufrénot, F. Jawadi and M. Maumy, C. Borsenberger editor, (2021, ISBN:9782807319448, De Boeck Supérieur, Louvain-la-Neuve). The first chapter of the book is dedicated to an introduction to statistics and their world. The second chapter deals with univariate exploratory statistics and graphics. The third chapter deals with bivariate and multivariate exploratory statistics and graphics. The fourth chapter is dedicated to data exploration with Principal Component Analysis. The fifth chapter is dedicated to data exploration with Correspondance Analysis. The sixth chapter is dedicated to data exploration with Multiple Correspondance Analysis. The seventh chapter is dedicated to data exploration with automatic clustering. The eighth chapter is dedicated to an introduction to probability theory and classical probability distributions. The ninth chapter is dedicated to an estimation theory, one-sample and two-sample tests. The tenth chapter is dedicated to an Gaussian linear model. The eleventh chapter is dedicated to an introduction to time series. The twelfth chapter is dedicated to an introduction to probit and logit models. Various example datasets are shipped with the package as well as some new functions.

License:

GPL-3

Encoding:

UTF-8

LazyData:

true

VignetteBuilder:

knitr, rmarkdown

Language:

fr-FR

RoxygenNote:

7.3.3

URL:

https://fbertran.github.io/homepage/, https://fbertran.github.io/sageR/, https://github.com/fbertran/sageR/

BugReports:

https://github.com/fbertran/sageR/issues/

Config/testthat/edition:

NeedsCompilation:

Packaged:

2025-09-23 23:53:03 UTC; bertran7

Repository:

CRAN

Date/Publication:

2025-09-24 07:20:02 UTC

sageR: Applied Statistics for Economics and Management with R

Description

Author(s)

Maintainer: Frederic Bertrand frederic.bertrand@lecnam.net (ORCID)

Authors:

Myriam Maumy-Bertrand myriam.maumy@ehesp.fr (ORCID)

Other contributors:

Claire Borsenberger claire.borsenberger@sfr.fr [contributor]
Christian Derquenne chris.emr@wanadoo.fr [contributor]
Gilles Dufrénot gilles.dufrenot@univ-amu.fr [contributor]
Fredj Jawadi fredj.jawadi@univ-lille.fr [contributor]

Population du Canada par classes d'âge et provinces et territoires en 2020

Description

Répartition en classes d'âge de la population des provinces et des territoires du Canada en 2020. Statistique Canada. Tableau 17-10-0005-01 Estimations de la population au 1er juillet, par âge et sexe.

Usage

AgevsProter_Canada_full

Format

Un jeu de données avec 21 observations de 13 variables.

Terre.Neuve.et.Labrador
Île.du.Prince.Édouard
Nouvelle.Écosse
Nouveau.Brunswick
Québec
Ontario
Manitoba
Saskatchewan
Alberta
Colombie.Britannique
Yukon
TerritoiresduNord.Ouest
Nunavut

References

doi:10.25318/1710000501-fra

Population du Canada par classes d'âge et sexe en 2020

Description

Répartition en classes d'âge et sexe de la population du Canada en 2020. Statistique Canada. Tableau 17-10-0005-01 Estimations de la population au 1er juillet, par âge et sexe.

Usage

AgevsSexe_Canada_full

Format

Un jeu de données avec 21 observations de 2 variables.

Hommes
Femmes

References

doi:10.25318/1710000501-fra

Calcule les trajectoires par axe pour un diagramme en radar (Calculate Axis Path)

Description

Calculates x-y coordinates for a set of radial axes (one per variable being plotted in radar plot)

Usage

CalculateAxisPath(var.names, min, max)

Arguments

var.names

list of variables to be plotted on radar plot

min

MININUM value required for the plotted axes (same value will be applied to all axes)

max

MAXIMUM value required for the plotted axes (same value will be applied to all axes)

Value

a dataframe of the calculated axis paths

Examples

library(dplyr)
library(scales)
library(tibble)

mtcars_radar <- mtcars %>%
  as_tibble(rownames = "group") %>%
  mutate_at(vars(-group), rescale) %>%
  tail(4) %>%
  select(1:10)
plot.data <- as.data.frame(mtcars_radar)
if(!is.factor(plot.data[, 1])) {
  plot.data[, 1] <- as.factor(as.character(plot.data[, 1]))
  }
names(plot.data)[1] <- "group"
var.names <- colnames(plot.data)[-1]
grid.min = 0
grid.max = 1
centre.y = grid.min - ((1 / 9) * (grid.max - grid.min))
CalculateAxisPath(var.names, grid.min + abs(centre.y), grid.max + abs(centre.y))

Calcule les trajectoires par groupe pour un diagramme en radar (Calculate Group Path)

Description

Converts variable values into a set of radial x-y coordinates

Usage

CalculateGroupPath(df)

Arguments

df

a dataframe with Col 1 is group ('unique' cluster / group ID of entity) and Col 2-n are v1.value to vn.value - values (e.g. group/cluser mean or median) of variables v1 to v.n

Value

a dataframe of the calculated axis paths

Source

Code adapted from a solution posted by Tony M to https://stackoverflow.com/questions/9614433/creating-radar-chart-a-k-a-star-plot-spider-plot-using-ggplot2-in-r.

Examples

library(dplyr)
library(scales)
library(tibble)

mtcars_radar <- mtcars %>%
  as_tibble(rownames = "group") %>%
  mutate_at(vars(-group), rescale) %>%
  tail(4) %>%
  select(1:10)
plot.data <- as.data.frame(mtcars_radar)
if(!is.factor(plot.data[, 1])) {
  plot.data[, 1] <- as.factor(as.character(plot.data[, 1]))
  }
names(plot.data)[1] <- "group"
CalculateGroupPath(plot.data)

Correction de copies

Description

Notes de deux correcteurs (A et B) pour les mêmes trente copies.

Usage

Copies

Format

Un jeu de données avec 30 observations de 2 variables.

Correcteur A
Correcteur B

Emploi par niveau d’études et taux d’emploi par groupe d’âge

Description

Les colonnes 2, 3 et 4 du tableau 2.8 contiennent les taux d’emploi, au troisième trimestre 2020, selon le niveau d’études : premier cycle du second degré (PCSD), deuxième cycle du second degré (DCSD), supérieur (SUP). Le taux d’emploi est le pourcentage d’actifs occupés dans la population en âge de travailler. Les actifs occupés sont les personnes qui travaillent au moins une heure par semaine en tant que salarié ou à titre lucratif, ou qui ont un emploi, mais sont temporairement absentes de leur travail pour maladie, congé ou conflit social. Cet indicateur donne le pourcentage des actifs occupés âgés de 25 à 64 ans dans la population des individus âgés de 25 à 64 ans. Les trois dernières colonnes du tableau 2.8 contiennent le taux d’emploi, au troisième trimestre 2020, d’une classe d’âge. Cet indicateur se mesure en fonction du nombre des actifs occupés d’un âge donné rapporté à l’effectif total de cette classe d’âge. Les actifs occupés sont les personnes de 15 ans et plus qui, durant la semaine de référence, déclarent avoir effectué un travail rémunéré pendant une heure au moins ou avoir occupé un emploi dont elles étaient absentes. Les taux d’emploi sont présentés pour trois classes d’âge : les personnes âgées de 15 à 24 ans sont celles qui font leur entrée sur le marché du travail à l’issue de leur scolarité, les personnes âgées de 25 à 54 ans sont celles qui sont au plus fort de leur activité professionnelle, et les personnes âgées de 55 à 64 ans sont celles qui ont dépassé le pic de leur carrière professionnelle et approchent de l’âge de la retraite. Cet indicateur est désaisonnalisé et est mesuré en pourcentage de l’effectif total de la classe d’âge.

Usage

Emploi_Etude_Age

Format

A data frame with 37 observations on the following 6 variables.

DCSD: a numeric vector
PCSD: a numeric vector
SUP: a numeric vector
15_24: a numeric vector
25_54: a numeric vector
55_64: a numeric vector

References

doi:10.1787/6e3d44f3-fr, doi:10.1787/b01db125-fr.

Examples


data(Emploi_Etude_Age)
str(Emploi_Etude_Age)
plot(Emploi_Etude_Age)

Prix de l'essence sans plomb 95

Description

Prix de l'essence sans plomb 95 en avril 2021 dans deux départements français, l'aube et la marne.

Usage

Essence

Format

Un jeu de données avec 60 observations de 2 variables.

Aube
Marne

Taux d'emploi en % de la classe d'age

Description

Le taux d'emploi d'une classe d'âge se mesure en fonction du nombre des actifs occupés d'un âge donné rapporté à l'effectif total de cette classe d'âge. Les actifs occupés sont les personnes de 15 ans et plus qui, durant la semaine de référence, déclarent avoir effectué un travail rémunéré pendant une heure au moins ou avoir occupé un emploi dont elles étaient absentes. Les taux d'emploi sont présentés pour quatre classes d'âge : les personnes âgées de 15 à 64 ans (personnes en âge de travailler); les personnes âgées de 15 à 24 ans sont celles qui font leur entrée sur le marché du travail à l'issue de leur scolarité, les personnes âgées de 25 à 54 ans sont celles qui sont au plus fort de leur activité professionnelle, et les personnes âgées de 55 à 64 ans sont celles qui ont dépassé le pic de leur carrière professionnelle et approchent de l'âge de la retraite. Cet indicateur est désaisonnalisé et est mesuré en pourcentage de l'effectif total de la classe d'âge. OCDE (2021), Taux d'emploi par groupe d'âge (indicateur).

Usage

Europe

Format

Un jeu de données avec 35 observations de 6 variables.

Etats.membres
Partiel_Ens
Partiel_H
Partiel_F
Salariés
NonSalariés

References

doi:10.1787/b01db125-fr

Flux bancaires

Description

Flux bancaires.

Usage

Flux

Format

Un vecteur avec 30 observations.

Personnes hospitalisées atteintes de la Covid 19 (21/02/2021)

Description

Répartition par région française du nombre de personnes hospitalisées et atteintes du Covid 19 le 21 février 2021.

Usage

HospitFull

Format

Un jeu de données avec 19 observations de 12 variables.

Région
Tous.âges
X0.9
X11.19
X20.29
X30.39
X40.49
X50.59
X60.69
X70.79
X80.89
X90.

Prix de vente en fonction de la marque, format long ou empilé

Description

Valeurs d'articles de qualité équivalente en fonction de leur marque.

Usage

Marque.Valeur

Format

Un jeu de données avec 90 observations de 2 variables.

Marque
Valeur

Prix de vente en fonction de la marque, format large ou dépilé

Description

Valeurs d'articles de qualité équivalente en fonction de leur marque.

Usage

Marque.Valeur.large

Format

Un jeu de données avec 30 observations de 3 variables.

Marque.1
Marque.2
Marque.3

Nombre de personnes dans un foyer

Description

Ménages par taille du ménage en 2017, source INSEE.

Usage

Personnes_Foyer

Format

Un jeu de données avec 6 observations de 2 variables xi et ni.

xi: Nombres de personnes dans un foyer
ni: Nombres de foyers

Précipitations aux USA en 1975

Description

Précipitations relevées dans soixante villes aux États-Unis d'Amérique en 1975.

Usage

Precipitations_USA

Format

Un jeu de données avec 60 observations de 4 variables.

Ville
Precipitation..inches.
Precipitation..cms.
Etat

Population du Canada par provinces et territoires en 2020

Description

Répartition de la population des provinces et des territoires du Canada en 2020. Statistique Canada. Tableau 17-10-0005-01 Estimations de la population au 1er juillet, par âge et sexe.

Usage

Proter_Canada

Format

A data frame with 13 observations on the following 2 variables.

ProTer: a character vector
Population: a numeric vector

References

doi:10.25318/1710000501-fra

Examples


data(Proter_Canada)
str(Proter_Canada)
barplot(Proter_Canada$Population, names.arg=Proter_Canada$ProTer, las=2)

Population du Canada par classes d'âge et provinces et territoires en 2020

Description

Répartition en provinces et territoires et sexe de la population du Canada en 2020. Statistique Canada. Tableau 17-10-0005-01 Estimations de la population au 1er juillet, par âge et sexe.

Usage

ProtervsSexe_Canada

Format

Un jeu de données avec 13 observations de 2 variables.

Hommes
Femmes

References

doi:10.25318/1710000501-fra

Personnes en réanimation atteintes de la Covid 19 (21/02/2021)

Description

Répartition par région française du nombre de personne en réanimation et atteintes de la Covid 19 le 21 février 2021.

Usage

ReaFull

Format

Un jeu de données avec 19 observations de 12 variables.

Région
Tous.âges
X0.9
X11.19
X20.29
X30.39
X40.49
X50.59
X60.69
X70.79
X80.89
X90.

Résistance à l'éclatement

Description

Résistance à l'éclatement.

Usage

Resistance

Format

Un vecteur avec 30 observations.

Part du revenu national total équivalent en Euro en 2019

Description

Répartitition du revenu par quantiles - enquêtes EU-SILC et PCM (ILC_DI01).

Usage

Richesse

Format

Un jeu de données avec 10 observations de 36 variables.

"Déciles"
"Belgique"
"Bulgarie"
"Tchéquie"
"Danemark"
"Allemagne..jusqu.en.1990..ancien.territoire.de.la.RFA."
"Estonie"
"Irlande"
"Grèce"
"Espagne"
"France"
"Croatie"
"Italie"
"Chypre"
"Lettonie"
"Lituanie"
"Luxembourg"
"Hongrie"
"Malte"
"Pays.Bas"
"Autriche"
"Pologne"
"Portugal"
"Roumanie"
"Slovénie"
"Slovaquie"
"Finlande"
"Suède"
"Islande"
"Norvège"
"Suisse"
"Royaume.Uni"
"Monténégro"
"Macédoine.du.Nord"
"Serbie"
"Turquie"

Emploi par secteur et par pays dans les pays de l'OCDE en 2020-Q3.

Description

Emploi par secteur d'activité et par pays (indicateur). OCDE (2021). doi:10.1787/6b2fff89-fr. (Consulté le 11 février 2021). ‘INDUSCONSTR désigne l’activité industrielle AVEC la construction.

Usage

Secteur

Format

Un jeu de données avec 34 observations de 6 variables .

PAYS: Nombres de personnes dans un foyer
AGR: Nombres de foyers
CONSTR: Nombres de foyers
INDUSCONSTR: Nombres de foyers
MFG: Nombres de foyers
SERV: Nombres de foyers

Nombre de sièges et de voix dans l'Union européenne

Description

Nombre de sièges et de voix dans l'Union européenne.

Usage

Sieges_Voix

Format

Un jeu de données avec 27 observations de 4 variables.

Etats.Membres
Date.entrée
Sièges.au.parlement
Voix.au.conseil

Emploi total par pays dans les pays de l'OCDE en 2020-Q3.

Description

Emploi total par pays (indicateur). OCDE (2021). doi:10.1787/6b2fff89-fr. (Consulté le 11 février 2021).

Usage

Total_Pays

Format

Un jeu de données avec 34 observations de 2 variables.

NameX: Acronyme du pays
Effectif: Nombres de personnes

Emploi total par secteur dans les pays de l'OCDE en 2020-Q3.

Description

Emploi total par secteur d'activité (indicateur). OCDE (2021). doi:10.1787/6b2fff89-fr. (Consulté le 11 février 2021). L'industrie (INDUSwithoutCONSTR) désigne l'activité industrielle SANS la construction.

Usage

Total_Secteur

Format

Un jeu de données avec 5 observations de 3 variables.

Secteur: Acronyme du secteur d'actvité
NameX: Nom du secteur d'actvité
Effectif: Nombres de personnes

Air pollution data

Description

Échantillon de 50 villes (individus) tirées aléatoirement sur la pollution de l'air aux États-Unis en 1960

Usage

air_pollution

Format

A data frame with 50 observations on the following 15 variables.

CITY: a factor with levels AUGUSTA AUSTIN BEAUMONT BOSTON BRIDGEPO CHARLEST CHARLOTT CHATTANO CHICAGO CLEVELAN COLUMBUS DALLAS DAYTON DENVER DES_MOIN DETROIT EL_PASO FALL_RIV FLINT FORT_WOR FRESNO GALVESTO HUNTINGT INDIANAP JACKSON JERSEY_C JOHNSTOW KNOXVILL MACON MEMPHIS MIAMI MILWAUKE MOBILE NASHVIL NORFOLK OMAHA PHOENIX PROVIDEN READING ROCKFORD SAVANNAH SEATTLE SIOUX_FA SOUTH_BE TOLEDO TOPEKA WINSTON YORK YOUNGSTO. Ville où les données ont été observées.
TMR: a numeric vector. Taux de mortalité exprimé en 1/10000.
SMIN: a numeric vector. Plus petite valeur des relevés réalisés deux fois par semaine de sulfate (micro-g/m3 multiplié par 10).
SMEAN: a numeric vector. Moyenne arithmétique des relevés réalisés deux fois par semaine de sulfate (micro-g/m3 multiplié par 10).
SMAX: a numeric vector. Plus grande valeur des relevés réalisés deux fois par semaine de sulfate (micro-g/m3 multiplié par 10).
PMIN: a numeric vector. Plus petite valeur des relevés réalisés deux fois par semaine de particules suspendues dans l'air (micro-g/m3 multiplié par 10).
PMEAN: a numeric vector. Moyenne arithmétique des relevés réalisés deux fois par semaine de particules suspendues dans l'air (micro-g/m3 multiplié par 10).
PMAX: a numeric vector. Logarithme de la plus grande valeur des relevés réalisés deux fois par semaine de particules suspendues dans l'air (micro-g/m3 multiplié par 10).
PM2: a numeric vector. Densité de la population par mile carré (multiplié par 0,1).
PERWH: a numeric vector. Pourcentage de population blanche.
NONPOOR: a numeric vector. Pourcentage de ménages avec un revenu au dessus du seuil de pauvreté.
GE65: a numeric vector. Pourcentage (multiplié par 10) de la population des 65 ans et plus.
LPOP: a numeric vector. Logarithme (en base 10 et multiplié par 10) de la population.
l_pm2: a numeric vector. Logarithme de la densité de la population par mile carré (multiplié par 0,1).
l_pmax: a numeric vector. Logarithme de la plus grande valeur des relevés réalisés deux fois par semaine de particules suspendues dans l'air (micro-g/m3 multiplié par 10).

Examples


data(air_pollution)
str(air_pollution)
library(ggplot2)
library(GGally)
GGally::ggpairs(air_pollution[,2:4],)

Indices d'attraction/répulsion

Description

Fonction de calcul et de représentation des indices d'attraction/répulsion

Usage

att_rep_ind(data)

Arguments

data

Jeux de données

Value

Liste à un élément qui content le tableau croisé des indices.

Examples


data(champignons)
champ_sel <- champignons[,c("couleur_chapeau","contusions","odeur",
"espacement_lamelle","habitat")]
sageR::att_rep_ind(champ_sel)

Évaluation du risque de défaut d'entreprises

Description

Les données de la base sont issues de Bloomberg. On s'intéresse au risque d'insolvabilité de 1060 entreprises cotées en bourse, durant l'année 2018, et appartenant à divers secteurs d'activité. Cette problématique est importante pour les investisseurs sur les marchés de capitaux internationaux qui prêtent aux entreprises, notamment en devenant actionnaires. L'information sur les risques financiers des entreprises est généralement fournie par des agences de notation : S&P, Fitch et Moody's. Dans la base, nous retenons les notations attribuées par S&P aux entreprises.

Elles portent sur une évaluation du risque de défaut (le fait que l'entreprise ayant emprunté des fonds se retrouve un jour en incapacité de rembourser), et les notes vont de AAA à CCC-. La grille de notation est la suivante :

•: AAA est la note la plus élevée et correspond à une sécurité maximale pour un investisseur qui détiendrait des parts dans l'entreprise concernée par la note. Le risque de défaut est quasiment nul ;
•: AA+, AA et AA- correspondent à une sécurité haute ou bonne (le risque de défaut est faible) ;
•: A+, A et A- correspondent à une qualité moyenne supérieure ;
•: BBB+, BBB et BBB- à une qualité moyenne inférieure ;
•: BB+, BB, ..., B- est un ensemble de notes classant les actifs des entreprises dans la catégorie spéculative, c'est-à-dire suffisamment risquée de telle sorte que le détenteur des parts de l'entreprise peut s'attendre à un défaut avec une probabilité forte ;
•: CCC+, CCC, CCC-, D est une dernière catégorie de notes qui correspond à des actifs pour lesquels le risque de défaut est très élevé.

Pour nos entreprises, les notes figurent dans la colonne du tableau 1 intitulée SP (dernière colonne).

La variable SP est qualitative et polytomique (puisqu'elle peut prendre plus de deux modalités). Pour la transformer en une variable quantitative dichotomique, nous allons supposer que les agences de notation veulent envoyer un signal clair aux investisseurs, en différenciant les entreprises qui sont en bonne santé des autres. Pour ce faire, chaque fois que la note sera supérieure à BB+, nous attribuons la valeur 1 à l'observation (entreprises en bonne santé présentant un risque de défaut ou de défaillance faible). Et pour toute note inférieure à BB+, nous attribuons la valeur 0 (entreprises en mauvaise santé présentant un risque de défaut élevé). Nous appelons la nouvelle variable Risque. Notons que le critère utilisé ici est arbitraire et un autre découpage pourrait être retenu. Voir les colonnes intitulées Risque et Défaut.

La colonne Défaut2 correspond à un autre classement des entreprises, en les hiérarchisant des plus performantes aux moins performantes:

1.-: pour les entreprises ayant une notation comprise entre AAA et A- (de première qualité à qualité moyenne supérieure) ;
2.-: pour les entreprises ayant une notation comprise entre BBB+ à BBB- (qualité moyenne inférieure) ;
3.-: pour les entreprises ayant une notation comprise inférieure à BBB- (un investisseur achetant des actifs de ces entreprises.

#' devrait les considérées comme spéculatifs ou incorporant un risque de défaut élevé).

Variables explicatives

Dans la base de données, nous avons retenu des variables qui sont habituellement liées aux performances des entreprises :

•: Liquid : un ratio de liquidité, mesuré par le rapport entre l'actif circulant et l'exigible à court terme. Cette variable capte le risque de liquidité, c'est-à-dire l'incapacité des entreprises à rembourser des dettes exigibles à court terme (moins d'un an).
•: ROE : le ratio du résultat net sur les capitaux propres. C'est une mesure de la rentabilité des capitaux investis par les actionnaires de l'entreprise.
•: Marge : la marge bénéficiaire nette en pourcentage, c'est-à-dire la part du chiffre d'affaires que l'entreprise conserve après paiement de ses frais d'exploitation, des remboursements d'intérêt et du paiement de ses impôts.
•: OPM : la marge opérationnelle définie comme le ratio du résultat d'exploitation et du chiffre d'affaires.

Il s'agit de mesurer la performance économique de l'entreprise et donc sa viabilité à moyen/long terme. En plus de ces variables qui renseignent sur des indicateurs de fonctionnement de l'entreprise, il est important de s'intéresser à des éléments ayant un impact direct sur leurs dettes. Trois indicateurs sont retenus ici :

•: Benef : le bénéfice avant intérêt, impôts et amortissement. Cette variable est un indicateur du profit de l'entreprise.
•: Net : le ratio des dettes financières sur Benef. Il s'agit de mesurer la capacité d'une entreprise à rembourser ses dettes en utilisant ses profits.
•: Roul : le besoin en fonds de roulement. Il s'agit de la somme à mettre de côté pour pouvoir payer ses charges.

C'est un indicateur d'autonomie financière de l'entreprise.

Usage

bilan

Format

A data frame with 1060 observations on the following 14 variables.

Entreprise: a character vector. Nom de l'entreprise.
id: a numeric vector. Identifiant de l'entreprise.
ROE: a numeric vector. Le ratio du résultat net sur les capitaux propres. C'est une mesure de la rentabilité des capitaux investis par les actionnaires de l'entreprise.
OPM: a numeric vector. La marge opérationnelle définie comme le ratio du résultat d'exploitation et du chiffre d'affaires.
Marge: a numeric vector. La marge bénéficiaire nette en pourcentage, c'est-à-dire la part du chiffre d'affaires que l'entreprise conserve après paiement de ses frais d'exploitation, des remboursements d'intérêt et du paiement de ses impôts.
Net: a numeric vector. Le ratio des dettes financières sur Benef. Il s'agit de mesurer la capacité d'une entreprise à rembourser ses dettes en utilisant ses profits.
Benef: a numeric vector. Le bénéfice avant intérêt, impôts et amortissement. Cette variable est un indicateur du profit de l'entreprise.
Liquid: a numeric vector. Un ratio de liquidité, mesuré par le rapport entre l'actif circulant et l'exigible à court terme. Cette variable capte le risque de liquidité, c'est-à-dire l'incapacité des entreprises à rembourser des dettes exigibles à court terme (moins d'un an).
Roul: a numeric vector. Le besoin en fonds de roulement. Il s'agit de la somme à mettre de côté pour pouvoir payer ses charges. C'est un indicateur d'autonomie financière de l'entreprise.
SP...10: a character vector. Notation S&P.
Risque: a numeric vector. Risque de défaut transformé en variable binaire.
Défaut: a character vector. Risque de défaut.
Défaut2: a character vector. Un autre classement des entreprises, en les hiérarchisant des plus performantes aux moins performantes.
SP...14: a character vector. Notation S&P.

Source

Bloomberg.

Examples


data(bilan)
str(bilan)
plot(bilan)

Prix journalier du Bitcoin du 31/12/2014 au 15/05/2018

Description

Les données décrivent l'évolution du prix journalier du Bitcoin sur la période du 31/12/2014 au 15/05/2018. Les données sont publiques et disponibles sur le site de Yahoo finance (https://fr.finance.yahoo.com/quote/BTC-EUR/history?p=BTC-EUR).

Usage

bitcoin

Format

A data frame with 1233 observations on the following 2 variables.

Date: a POSIXct
Bitcoin: a numeric vector

Source

Yahoo finance (https://fr.finance.yahoo.com/quote/BTC-EUR/history?p=BTC-EUR)

Examples


data(bitcoin)
str(bitcoin)
plot(bitcoin)

Caractéristiques de champignons

Description

Caractéristiques de 1000 champignons.

Usage

champignons

Format

A data frame with 1000 observations on the following 8 variables.

num_champ: a numeric vector. Numéro du champignon.
classes: a factor with levels comestible veneneux. Classes.
couleur_chapeau: a factor with levels blanc gris jaune marron rouge. Couleur du chapeau.
contusions: a factor with levels abime non. Contusions.
odeur: a factor with levels amande anis apre inodore. Odeur du champignon.
espacement_lamelle: a factor with levels ferme serre. Espacement des lamelles.
couleur_tige_dessus: a factor with levels blanc gris rose. Couleur du dessus de la tige.
habitat: a factor with levels foret pelouse prairies sentier urbain. Habitat.

Examples


data(champignons)
str(champignons)
summary(champignons)

Consommation d'électricité

Description

Consommation d'électricité journalière en France de l'année 2003?

Usage

conso_temp

Format

A data frame with 365 observations on the following 8 variables.

Date: a factor with levels 01/01/2003 01/02/2003 01/03/2003 01/04/2003 01/05/2003 01/06/2003 01/07/2003 01/08/2003 01/09/2003 01/10/2003 01/11/2003 01/12/2003 02/01/2003 02/02/2003 02/03/2003 02/04/2003 02/05/2003 02/06/2003 02/07/2003 02/08/2003 02/09/2003 02/10/2003 02/11/2003 02/12/2003 03/01/2003 03/02/2003 03/03/2003 03/04/2003 03/05/2003 03/06/2003 03/07/2003 03/08/2003 03/09/2003 03/10/2003 03/11/2003 03/12/2003 04/01/2003 04/02/2003 04/03/2003 04/04/2003 04/05/2003 04/06/2003 04/07/2003 04/08/2003 04/09/2003 04/10/2003 04/11/2003 04/12/2003 05/01/2003 05/02/2003 05/03/2003 05/04/2003 05/05/2003 05/06/2003 05/07/2003 05/08/2003 05/09/2003 05/10/2003 05/11/2003 05/12/2003 06/01/2003 06/02/2003 06/03/2003 06/04/2003 06/05/2003 06/06/2003 06/07/2003 06/08/2003 06/09/2003 06/10/2003 06/11/2003 06/12/2003 07/01/2003 07/02/2003 07/03/2003 07/04/2003 07/05/2003 07/06/2003 07/07/2003 07/08/2003 07/09/2003 07/10/2003 07/11/2003 07/12/2003 08/01/2003 08/02/2003 08/03/2003 08/04/2003 08/05/2003 08/06/2003 08/07/2003 08/08/2003 08/09/2003 08/10/2003 08/11/2003 08/12/2003 09/01/2003 09/02/2003 09/03/2003 09/04/2003 09/05/2003 09/06/2003 09/07/2003 09/08/2003 09/09/2003 09/10/2003 09/11/2003 09/12/2003 10/01/2003 10/02/2003 10/03/2003 10/04/2003 10/05/2003 10/06/2003 10/07/2003 10/08/2003 10/09/2003 10/10/2003 10/11/2003 10/12/2003 11/01/2003 11/02/2003 11/03/2003 11/04/2003 11/05/2003 11/06/2003 11/07/2003 11/08/2003 11/09/2003 11/10/2003 11/11/2003 11/12/2003 12/01/2003 12/02/2003 12/03/2003 12/04/2003 12/05/2003 12/06/2003 12/07/2003 12/08/2003 12/09/2003 12/10/2003 12/11/2003 12/12/2003 13/01/2003 13/02/2003 13/03/2003 13/04/2003 13/05/2003 13/06/2003 13/07/2003 13/08/2003 13/09/2003 13/10/2003 13/11/2003 13/12/2003 14/01/2003 14/02/2003 14/03/2003 14/04/2003 14/05/2003 14/06/2003 14/07/2003 14/08/2003 14/09/2003 14/10/2003 14/11/2003 14/12/2003 15/01/2003 15/02/2003 15/03/2003 15/04/2003 15/05/2003 15/06/2003 15/07/2003 15/08/2003 15/09/2003 15/10/2003 15/11/2003 15/12/2003 16/01/2003 16/02/2003 16/03/2003 16/04/2003 16/05/2003 16/06/2003 16/07/2003 16/08/2003 16/09/2003 16/10/2003 16/11/2003 16/12/2003 17/01/2003 17/02/2003 17/03/2003 17/04/2003 17/05/2003 17/06/2003 17/07/2003 17/08/2003 17/09/2003 17/10/2003 17/11/2003 17/12/2003 18/01/2003 18/02/2003 18/03/2003 18/04/2003 18/05/2003 18/06/2003 18/07/2003 18/08/2003 18/09/2003 18/10/2003 18/11/2003 18/12/2003 19/01/2003 19/02/2003 19/03/2003 19/04/2003 19/05/2003 19/06/2003 19/07/2003 19/08/2003 19/09/2003 19/10/2003 19/11/2003 19/12/2003 20/01/2003 20/02/2003 20/03/2003 20/04/2003 20/05/2003 20/06/2003 20/07/2003 20/08/2003 20/09/2003 20/10/2003 20/11/2003 20/12/2003 21/01/2003 21/02/2003 21/03/2003 21/04/2003 21/05/2003 21/06/2003 21/07/2003 21/08/2003 21/09/2003 21/10/2003 21/11/2003 21/12/2003 22/01/2003 22/02/2003 22/03/2003 22/04/2003 22/05/2003 22/06/2003 22/07/2003 22/08/2003 22/09/2003 22/10/2003 22/11/2003 22/12/2003 23/01/2003 23/02/2003 23/03/2003 23/04/2003 23/05/2003 23/06/2003 23/07/2003 23/08/2003 23/09/2003 23/10/2003 23/11/2003 23/12/2003 24/01/2003 24/02/2003 24/03/2003 24/04/2003 24/05/2003 24/06/2003 24/07/2003 24/08/2003 24/09/2003 24/10/2003 24/11/2003 24/12/2003 25/01/2003 25/02/2003 25/03/2003 25/04/2003 25/05/2003 25/06/2003 25/07/2003 25/08/2003 25/09/2003 25/10/2003 25/11/2003 25/12/2003 26/01/2003 26/02/2003 26/03/2003 26/04/2003 26/05/2003 26/06/2003 26/07/2003 26/08/2003 26/09/2003 26/10/2003 26/11/2003 26/12/2003 27/01/2003 27/02/2003 27/03/2003 27/04/2003 27/05/2003 27/06/2003 27/07/2003 27/08/2003 27/09/2003 27/10/2003 27/11/2003 27/12/2003 28/01/2003 28/02/2003 28/03/2003 28/04/2003 28/05/2003 28/06/2003 28/07/2003 28/08/2003 28/09/2003 28/10/2003 28/11/2003 28/12/2003 29/01/2003 29/03/2003 29/04/2003 29/05/2003 29/06/2003 29/07/2003 29/08/2003 29/09/2003 29/10/2003 29/11/2003 29/12/2003 30/01/2003 30/03/2003 30/04/2003 30/05/2003 30/06/2003 30/07/2003 30/08/2003 30/09/2003 30/10/2003 30/11/2003 30/12/2003 31/01/2003 31/03/2003 31/05/2003 31/07/2003 31/08/2003 31/10/2003 31/12/2003. Date.
conso: a numeric vector. Consommation d'électricité en MWH.
t: a numeric vector. Numéro du jour.
nom_jour: a factor with levels Dimanche Jeudi Lundi Mardi Mercredi Samedi Vendredi. Nom du jour de la semaine.
mois: a factor with levels Août Avril Décembre Février Janvier Juillet Juin Mai Mars Novembre Octobre Septembre. Nom du mois.
temp: a numeric vector. Température en degrés Celsius.
ejp: a numeric vector. Statut du jour EDF (spécial = 1 ; non spécial = 0).
ferie: a factor with levels non oui. Statut du jour annuel (férié ou non).

Examples


data(conso_temp)
str(conso_temp)
plot(conso_temp$conso)

Dotchart de Cleveland améliorés (Enhanced Cleveland's dotchart)

Description

dotchart3 est une version améliorée des fonctions dotchart et dotchart2 qui permettent de construire des diagrammes à points de Cleveland.

Usage

dotchart3(
  x,
  labels = NULL,
  groups = NULL,
  gdata = NULL,
  cex = par("cex"),
  pch = 21,
  gpch = 21,
  bg = par("bg"),
  color = par("fg"),
  gcolor = par("fg"),
  lcolor = "gray",
  xlim = range(x[is.finite(x)]),
  main = NULL,
  xlab = NULL,
  ylab = NULL,
  cex.axis = cex,
  ...
)

Arguments

x

soit un tableau ou une matrice de valeurs numériques (les NA sont autorisées). Si x est une matrice, le tracé global est constitué de points juxtaposés pour chaque ligne. Les entrées qui satisfont is.numeric(x) mais pas is.vector(x) || is.matrix(x) sont converties par as.numeric, avec un avertissement.

labels

un vecteur d'étiquettes pour chaque point. Pour les vecteurs, la valeur par défaut est d'utiliser names(x) et pour les matrices, les étiquettes de ligne dimnames(x)[[1]].

groups

un facteur optionnel indiquant comment les éléments de x sont regroupés. Si x est une matrice, les groupes seront formés par défaut par les colonnes de x.

gdata

les valeurs des données pour les groupes. Il s'agit généralement d'un résumé tel que la médiane ou la moyenne de chaque groupe.

cex

la taille des caractères à utiliser. Fixer cex à une valeur inférieure à un peut être un moyen utile d'éviter le chevauchement des étiquettes. Contrairement à de nombreuses autres fonctions graphiques, cette fonction définit la taille réelle, et non un multiple de par("cex").

pch

le caractère ou le symbole de traçage à utiliser.

gpch

le caractère ou le symbole de tracé à utiliser pour les valeurs de groupe.

bg

la couleur de fond des caractères ou symboles à utiliser pour le tracé ; utilisez ⁠par(bg= *)⁠ pour définir la couleur de fond de l'ensemble du tracé.

color

la (les) couleur(s) à utiliser pour les points et les étiquettes.

gcolor

la couleur unique à utiliser pour les étiquettes et les valeurs de groupe.

lcolor

la (les) couleur(s) à utiliser pour les lignes horizontales.

xlim

largeur horizontale de la zone de tracé, voir plot.window, par exemple.

main

titre général du graphique, voir title.

xlab

les annotations de l'axe des abscisses définies comme dans title.

ylab

les annotations de l'axe des ordonnées définies comme dans title.

cex.axis

la taille des caractères à utiliser pour les annotations des axes.

...

les paramètres graphiques peuvent également être spécifiés comme arguments.

Value

Un dotplot de la série statistique.

Author(s)

Frederic Bertrand, frederic.bertrand@lecnam.net

References

F. Bertrand, Ch. Derquenne, G. Dufrénot, F. Jawadi and M. Maumy, C. Borsenberger editor, Statistiques pour l’économie et la gestion, De Boeck Supérieur, Louvain-la-Neuve, 2021.

Examples

data(Total_Secteur)
NameX <- Total_Secteur$NameX
Effectif <- Total_Secteur$Effectif
dotchart3(Effectif,labels=NameX,pch=19,col="#00FFFF",cex=1.6,cex.axis=1.2)
dotchart3(Effectif,labels=NameX,pch=19,col="#00FFFF")

Calcule les coordonnées des points d'un cercle (Generate circle coordinates)

Description

Generate coordinates to draw a circle.

Usage

funcCircleCoords(center = c(0, 0), r = 1, npoints = 100)

Arguments

center

coordinate for centroid

r

radius

npoints

number of coordinates to generate

Value

a dataframe

Source

Adapted from Joran's response to https://stackoverflow.com/questions/6862742/draw-a-circle-with-ggplot2.

Examples

funcCircleCoords(c(1,2),1)
plot(funcCircleCoords(c(1,2),1))

Diagrammes en radar avancés pour ggplot2 (Enhanced Radar Plots for ggplot2)

Description

Diagrammes en radar avancés pour ggplot2 (Enhanced Radar Plots for ggplot2)

Usage

ggradar(
  plot.data,
  base.size = 15,
  font.radar = "sans",
  values.radar = c("0%", "50%", "100%"),
  axis.labels = colnames(plot.data)[-1],
  grid.min = 0,
  grid.mid = 0.5,
  grid.max = 1,
  centre.y = grid.min - ((1/9) * (grid.max - grid.min)),
  plot.extent.x.sf = 1,
  plot.extent.y.sf = 1.2,
  x.centre.range = 0.02 * (grid.max - centre.y),
  label.centre.y = FALSE,
  grid.line.width = 0.5,
  gridline.min.linetype = "longdash",
  gridline.mid.linetype = "longdash",
  gridline.max.linetype = "longdash",
  gridline.min.colour = "grey",
  gridline.mid.colour = "#007A87",
  gridline.max.colour = "grey",
  grid.label.size = 6,
  gridline.label.offset = -0.1 * (grid.max - centre.y),
  label.gridline.min = TRUE,
  label.gridline.mid = TRUE,
  label.gridline.max = TRUE,
  axis.label.offset = 1.15,
  axis.label.size = 5,
  axis.line.colour = "grey",
  group.line.width = 1.5,
  group.point.size = 6,
  group.colours = NULL,
  background.circle.colour = "#D7D6D1",
  background.circle.transparency = 0.2,
  plot.legend = if (nrow(plot.data) > 1) TRUE else FALSE,
  legend.title = "",
  plot.title = "",
  legend.text.size = 14,
  legend.position = "left"
)

Arguments

plot.data

dataframe comprising one row per group

base.size

text size

font.radar

text font family

values.radar

values to print at minimum, 'average', and maximum gridlines

axis.labels

names of axis labels if other than column names supplied via plot.data

grid.min

value at which mininum grid line is plotted

grid.mid

value at which 'average' grid line is plotted

grid.max

value at which maximum grid line is plotted

centre.y

value of y at centre of plot

plot.extent.x.sf

controls relative size of plot horizontally

plot.extent.y.sf

controls relative size of plot vertically

x.centre.range

controls axis label alignment

label.centre.y

whether value of y at centre of plot should be labelled

grid.line.width

width of gridline

gridline.min.linetype

line type of minimum gridline

gridline.mid.linetype

line type of 'average' gridline

gridline.max.linetype

line type of maximum gridline

gridline.min.colour

colour of minimum gridline

gridline.mid.colour

colour of 'average' gridline

gridline.max.colour

colour of maximum gridline

grid.label.size

text size of gridline label

gridline.label.offset

displacement to left/right of central vertical axis

label.gridline.min

whether or not to label the mininum gridline

label.gridline.mid

whether or not to label the 'mininum'average' gridline

label.gridline.max

whether or not to label the maximum gridline

axis.label.offset

vertical displacement of axis labels from maximum grid line, measured relative to circle diameter

axis.label.size

text size of axis label

axis.line.colour

colour of axis line

group.line.width

line width of group

group.point.size

point size of group

group.colours

colour of group

background.circle.colour

colour of background circle/radar

background.circle.transparency

transparency of background circle/radar

plot.legend

whether to include a plot legend

legend.title

title of legend

plot.title

title of radar plot

legend.text.size

text size in legend

legend.position

position of legend, valid values are "top", "right", "bottom", "left"

Value

a ggplot object

Source

Most of the code is from https://rstudio-pubs-static.s3.amazonaws.com/5795_e6e6411731bb4f1b9cc7eb49499c2082.html.

Examples

library(dplyr)
library(scales)
library(tibble)

mtcars_radar <- mtcars %>%
  as_tibble(rownames = "group") %>%
  mutate_at(vars(-group), rescale) %>%
  tail(4) %>%
  select(1:10)
mtcars_radar
ggradar(mtcars_radar)

Moyenne, variance et variance corrigée (Sheppard)

Description

Pour une distribution groupée, cette fonction la moyenne, la variance et la variance corrigée à l'aide de la correction de Sheppard.

Usage

moments.grouped(gp.data, population = FALSE)

Arguments

gp.data

Un objet de classe grouped.data créé avec le package actuar.

population

Un booléen qui indique si le calcul est réalisé à partir d'une population (population=TRUE) ou à partir d'un échantillon pour estimer un paramètre d'une population (population=FALSE).

Value

Une liste comportant trois éléments :

La moyenne de la distribution groupée mu
La variance de la distribution non corrigée avec la correction de Sheppard sigma2
La variance de la distribution corrigée avec la correction de Sheppard sigma2Adj
L'asymétrie de Fisher de la distribution sigma2
L'asymétrie de Pearson de la distribution sigma2
L'applatissement de Pearson de la distribution corrigée avec la correction de Sheppard sigma2
L'applatissement de Fisher de la distribution corrigée avec la correction de Sheppard sigma2

Examples

lims <- c(40, 45, 50, 55, 60, 65, 70, 75)
counts <- c(1,2,3,4,0,0,1)
grouped.example <- actuar::grouped.data(Group = lims, Frequency = counts)
moments.grouped(grouped.example)

Stéréogramme avec plotcdf3 (Stereogram with plotcdf3)

Description

Cette fonction construit un stéréogramme permettant de juger de l'association entre deux variables discrètes ou groupées en classes.

Usage

plotcdf3(
  x,
  y,
  f,
  xaxe,
  yaxe,
  col = NULL,
  border = FALSE,
  Nxy = 200,
  theme = "0"
)

Arguments

x

Valeurs observées ou modalités de la première variable discrète

y

Valeurs observées ou modalités de la seconde variable discrète

f

Si f=0 (donc length(f)=0), x et y sont deux séries statistiques. Si length(f)>1, f est un tableau de fréquences et x et y les noms des lignes et des colonnes de f.

xaxe

Nom de l'axe des abscisses

yaxe

Nom de l'axe des ordonnées

col

Couleur du stéréogramme

border

Le maillage du graphique doit-il être affiché ?

Nxy

Pas du maillage pour chaque axe

theme

Le thème détermine la palette de couleurs utilisées. Il y a quatre choix possibles en couleurs "0", "1", "2", "3" et un en nuances de gris "bw"

Value

Un stéréogramme des deux séries statistiques groupées ou des deux séries statistiques discrètes étudiées.

Author(s)

Frederic Bertrand, frederic.bertrand@lecnam.net

References

F. Bertrand, Ch. Derquenne, G. Dufrénot, F. Jawadi and M. Maumy, C. Borsenberger editor, Statistiques pour l’économie et la gestion, De Boeck Supérieur, Louvain-la-Neuve, 2021.

Examples

ff=table(cut(Europe$Partiel_H,c(0,10,20,30)),
         cut(Europe$Partiel_F,c(0,10,20,30,40,50,60,70,80)))/
         sum(table(cut(Europe$Partiel_H,c(0,10,20,30)),
                   cut(Europe$Partiel_F,c(0,10,20,30,40,50,60,70,80))))
plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80),
         f=ff,xaxe="Hommes",yaxe="Femmes",theme="0")


plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80),
         f=ff,xaxe="Hommes",yaxe="Femmes",theme="1")
plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80),
         f=ff,xaxe="Hommes",yaxe="Femmes",theme="2")
plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80),
         f=ff,xaxe="Hommes",yaxe="Femmes",theme="cyan")
plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80),
         f=ff,xaxe="Hommes",yaxe="Femmes",theme="cyan",border=TRUE)
plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80),
         f=ff,xaxe="Hommes",yaxe="Femmes",theme="bw")


xx=seq(1.5,12.5)
yy=seq(0.5,6.5)
p=c(1/36,0,0,0,0,0,
    2/36,0,0,0,0,0,
    2/36,1/36,0,0,0,0,
    2/36,2/36,0,0,0,0,
    2/36,2/36,1/36,0,0,0,
    2/36,2/36,2/36,0,0,0,
    0,2/36,2/36,1/36,0,0,
    0,0,2/36,2/36,0,0,
    0,0,0,2/36,1/36,0,
    0,0,0,0,2/36,0,
    0,0,0,0,0,1/36)
p=matrix(p,byrow=TRUE,ncol=6)
plotcdf3(xx,yy,p,"somme des des","valeur du plus petit")

Résultats des élections présidentielles françaises de 2012

Description

Résultats par département au premier tour des élections présidentielles françaises de 2012.

Usage

presid_2012

Format

A data frame with 96 observations on the following 13 variables.

departement: a factor with levels Ain Aisne Allier Alpes-de-Haute-Provence Alpes-Maritimes Ardèche Ardennes Ariège Aube Aude Aveyron Bas-Rhin Bouches-du-Rhône Calvados Cantal Charente Charente-Maritime Cher Corrèze Corse-du-Sud Côte-d'Or} \code{Côtes-d'Armor Creuse Deux-Sèvres Dordogne Doubs Drôme Essonne Eure Eure-et-Loir Finistère Gard Gers Gironde Haut-Rhin Haute-Corse Haute-Garonne Haute-Loire Haute-Marne Haute-Saône Haute-Savoie Haute-Vienne Hautes-Alpes 63EmpGPcTWCqJJ9Co5Nckt8kjbdX2a3j-44Hauts-de-Seine Hérault Ille-et-Vilaine Indre Indre-et-Loire Isère Jura Landes Loir-et-Cher Loire Loire-Atlantique Loiret Lot Lot-et-Garonne Lozère Maine-et-Loire Manche Marne Mayenne Meurthe-et-Moselle Meuse Morbihan Moselle Nièvre Nord Oise Orne Paris Pas-de-Calais Puy-de-Dôme 63EmpGPcTWCqJJ9Co5Nckt8kjbdX2a3j-7563EmpGPcTWCqJJ9Co5Nckt8kjbdX2a3j-76Rhône Saône-et-Loire Sarthe Savoie Seine-et-Marne Seine-Maritime Seine-Saint-Denis Somme Tarn Tarn-et-Garonne Territoire_de_Belfort Val-dOise Val-de-Marne Var Vaucluse Vendée Vienne Vosges Yonne Yvelines. Nom du département (métropole) où les suffrages ont été dénombrés.
abstentions_1: a numeric vector. Abstentions du 1er tour.
blancs_ou_nuls_1: a numeric vector. Bulletins blancs ou nuls au 1er tour.
bayrou: a numeric vector. Candidat Bayrou.
hollande_1: a numeric vector. Candidat Hollande au 1er tour.
cheminade: a numeric vector. Candidat Cheminade.
melenchon: a numeric vector. Candidat Mélenchon.
dupont_aignan: a numeric vector. Candidat Dupont-Aignan.
sarkozy_1: a numeric vector. Candidat Sarkozy au 1er tour.
poutou: a numeric vector. Candidat Poutou.
joly: a numeric vector. Candidate Joly.
le_pen: a numeric vector. Candidate Le Pen.
arthaud: a numeric vector. Candidate Arthaud.

Examples


data(presid_2012)
str(presid_2012)
plot(presid_2012)
library(vcd)
vcd::mosaic(t(as.table(as.matrix(presid_2012[1:5,-1]))),
rot_labels=c(0,90,0,0), just_labels  = "right")

Correction de Sheppard et variance

Description

Calcul de la correction de Sheppard pour la variance.

Usage

sheppardCorrection(gp.data, order = 2, population = FALSE)

Arguments

gp.data

Un objet de classe grouped.data créé avec le package actuar.

order

Choix de l'ordre pour la correction de Sheppard. Ne peut être égal qu'à 2 ou 4.

population

Un booléen qui indique si le calcul est réalisé à partir d'une population (population=TRUE) ou à partir d'un échantillon pour estimer un paramètre d'une population (population=FALSE).

Value

Un vecteur contenant la valeur de la correction de Sheppard pour le calcul de la variance d'une distribution groupée.

Examples

lims <- c(40, 45, 50, 55, 60, 65, 70, 75)
counts <- c(1,2,3,4,0,0,1)
grouped.example <- actuar::grouped.data(Group = lims, Frequency = counts)
sheppardCorrection(grouped.example)
sheppardCorrection(grouped.example, order=4)

sageR: Applied Statistics for Economics and Management with R

Description

Author(s)

See Also

Population du Canada par classes d'âge et provinces et territoires en 2020

Description

Usage

Format

References

Population du Canada par classes d'âge et sexe en 2020

Description

Usage

Format

References

Calcule les trajectoires par axe pour un diagramme en radar (Calculate Axis Path)

Description

Usage

Arguments

Value

Examples

Calcule les trajectoires par groupe pour un diagramme en radar (Calculate Group Path)

Description

Usage

Arguments

Value

Source

Examples

Correction de copies

Description

Usage

Format

Emploi par niveau d’études et taux d’emploi par groupe d’âge

Description

Usage

Format

References

Examples

Prix de l'essence sans plomb 95

Description

Usage

Format

Taux d'emploi en % de la classe d'age

Description

Usage

Format

References

Flux bancaires

Description

Usage

Format

Personnes hospitalisées atteintes de la Covid 19 (21/02/2021)

Description

Usage

Format

Prix de vente en fonction de la marque, format long ou empilé

Description

Usage

Format

Prix de vente en fonction de la marque, format large ou dépilé

Description

Usage

Format

Nombre de personnes dans un foyer

Description

Usage

Format

Précipitations aux USA en 1975

Description

Usage

Format

Population du Canada par provinces et territoires en 2020

Description

Usage

Format

References

Examples

Population du Canada par classes d'âge et provinces et territoires en 2020

Description

Usage

Format