Passer au contenu principal
FUN CAMPUS
  • Mon compte
  • Nous contacter
  • Actualités
  • Cours
  • Organisations
  • Vous êtes ici:
  • FUN Campus - Des formations pour enrichir les cursus
  • Cours
  • Introduction à la statistique avec R

Introduction à la statistique avec R

Mathématiques et informatique appliquées aux sciences humaines et socialesCatégorieLicenceCatégorieMathématiquesCatégorieÉconomie
  • Durée : 5 semaines
  • Effort : 20 heures
  • Rythme: ~4 heures/semaine

Vous êtes enseignant et souhaitez utiliser ce cours avec vos étudiants ?

Nous contacter

Description

Ce cours permet d’apprendre la statistique à l’aide du logiciel libre R.

Le recours aux mathématiques est minimal. L’objectif est de savoir analyser des données, de comprendre ce que l’on fait, et de pouvoir communiquer ses résultats.

Ce cours s’adresse aux étudiants et praticiens de toutes disciplines qui recherchent une formation pratique. Il sera utile à toute personne ayant le besoin d’analyser un jeu de données réel dans le cadre d’un enseignement, de son activité professionnelle ou de recherche, ou par simple curiosité d’analyser un jeu de données par soi-même (données du web, données publiques…).

Le cours s’appuie sur le logiciel libre R qui est un des logiciels de statistique les plus puissants disponibles actuellement.

Les méthodes abordées sont : les techniques descriptives, les tests, l’analyse de variance, les modèles de régression linéaire et logistique, les données censurées (de survie).

Format

Le cours comprend deux volets :

- des chapitres de cours abordant des notions de statistiques et des connaissances essentielles sur le logiciel R

- des "labs": vidéos de pratique du logiciel R sous l’interface RStudio.

Chaque semaine, 4 à 6 vidéos de cours d’une dizaine de minutes et un “lab” seront mis en ligne.

L’évaluation comporte trois niveaux :

des quiz “mémoire” (5 à 10 questions à la fin de chaque vidéo),

des quiz “exercice” (le plus souvent des calculs simples à réaliser avec R),

un devoir à rendre sous forme de script R.

Prérequis

Il n’y a pas de pré-requis pour suivre ce cours. Des connaissances de base en algèbre ou en programmation sont utiles mais ne sont pas nécessaires. En revanche, la volonté d’apprendre à analyser un jeu de données par soi-même est essentielle.

Ce cours s'adresse à un public francophone cherchant à se former aux bases de la statistique avec un logiciel libre (disponible gratuitement). Il vise aussi bien un public en formation initiale qu'un public en formation continue. Compte tenu des nombreux domaines d'application des statistiques et de la taille importante de la communauté R, ce cours concerne une large audience. Sciences fondamentales comme appliquées, sciences humaines, gestion de projet, les statistiques concernent potentiellement l'ensemble des professions.

Evaluation et Certification

L’évaluation comporte trois niveaux :

- des quiz “mémoire” (5 à 10 questions à la fin de chaque vidéo),

- des quiz “exercice” (le plus souvent des calculs simples à réaliser avec R),

- un devoir à rendre sous forme de script R.

Plan de cours

    • - Introduction
      - Chapitre 1 : Définitions
      - Chapitre 2 : Représentations graphiques
      - Chapitre 3 : Mesures de position et de dispersion : les principes
      - Chapitre 4 : Mesures de position et de dispersion : la pratique
      - Lab 1 : Introduction à R studio, manipulation des fichiers et des variables
    • - Chapitre 5 : Intervalles de confiance
      - Chapitre 6 : Coefficient de corrélation
      - Chapitre 7 : Risque relatif et odds-ratio
      - Lab 2 : Manipulation de données, résumés numériques et graphiques
      - Lab 3 : RMarkdown et rapport automatisé
    • - Chapitre 8 : Tests statistiques : le “p”
      - Chapitre 9 : Tests statistiques : l’approche de Neyman et Pearson
      - Chapitre 10 : Comparaison de deux pourcentages
      - Chapitre 11 : Comparaison de deux moyennes
      - Chapitre 12 : Test de nullité d’une corrélation, divers
      - Lab 4 : Mesures d'association, tests statistiques, update sur RMarkdown
    • - Chapitre 13 : Régression linéaire simple
      - Chapitre 14 : Régression linéaire, corrélation et test t
      - Chapitre 15 : Régression linéaire multiple, analyse de variance
      - Chapitre 16 : Introduction à la régression logistique
      - Chapitre 17 : Régression logistique multiple
      - Lab 5 : Régression linéaire et logistique
    • - Chapitre 18 : Données de survie ou censurées
      - Chapitre 19 : Tests et modèles pour données censurées
      - Chapitre 20 : Introduction aux méthodes exploratoires multidimensionnelles
      - Chapitre 21 : Analyse en composantes principales
      - Chapitre 22 : Classification hiérarchique

Équipe pédagogique

BRUNO FALISSARD

Catégories

Professeur de biostatistique à l'Université Paris-Saclay

CHRISTOPHE LALANNE

Catégories

Ingénieur de recherche (Université Paris-Diderot, AP-HP)

Établissements

Université Paris-Saclay

Équipe pédagogique

ANTOINE KOSSI ABALO

Doctorant en épidémiologie, Université Paris-Saclay

TAKIY BERRANDOU

Doctorant en épidémiologie, Université Paris-Saclay

MARIE-GABRIELLE DONDON

Ingénieur, Inserm

MÉLINA GALLOPIN

Maître de conférence, Université Paris-Saclay

YAHYA MAHAMAT

Doctorant en épidémiologie, Université Paris-Saclay

MOHAMMED SEDKI

Maître de conférence, Université Paris-Saclay

EMMANUEL WIERNIK

Doctorant en Epidémiologie, Université Paris-Saclay

Ils ont participé à la mise en place de ce cours

MATTHIEU CISEL

FABIENNE EL-KHOURY

LUC RONDELEUX

PAULINE SCHERDEL

Lectures recommandées

Falissard (Bruno), Comprendre et utiliser les statistiques dans les sciences de la vie, 3e édition. Masson (372 pages).

Falissard (Bruno), The analysis of questionnaire data with R, Chapman et Hall, CRC Press (280 pages)..

Des formations pour enrichir les cursus

FacebookTwitterLinkedin

En savoir plus

  • Qui sommes-nous ?
  • A propos de Fun Campus
  • Mentions légales
  • Charte utilisateur
  • Politique de confidentialité
  • Conditions d'utilisation
  • Aide et contact
Propulsé par Richie