Processus d’une recherche en Marketing
1. Définition du problème et définition des objectifs de recherche
Définition du problème
Définition des objectifs de recherche
Détermination des besoins en information
Établissement des hypothèses de recherche
2. Cadre de la recherche
Choix de la méthode de recherche
Choix de la méthode de collecte des données
Choix des instruments de mesure
Définition du plan d’échantillonage
3. Processus de collecte, codification et saisie des données
Plan de codification
Codification des questions ouvertes
Méthodes de saisie
4. Analyse des données
5. Rédaction et présentation du rapport
Conception générale
Plan de sondage Questionnaire
Terrain
Dépouillement,
analyse
Généralités
ECHANTILLON
è POPULATION DE BASE
è TYPES D’ECHANTILLON
è TAILLE DES ECHANTILLONS
Généralités
Recensement / Echantillonnage
Recensement : Tous les individus de la population sont «examinés»
Echantillonnage : Une partie de la
population est « examinée »
ÞPlusieurs échantillons peuvent être
constitués
Population
ÞL’échantillon en lui-même n’est pas
intéressant, ce sont les conclusions sur
la population que l’on peut tirer de son
observation qui en font l’intérêt :
Inférence statistique.
Axes
1 Le processus d’échantillonnage
2 Les méthodes d’échantillonnage
» Méthodes Probabilistes
» Méthodes Non Probabilistes
3 L’estimation d’une taille d’échantillon
Le processus général de
L’ECHANTILLONNAGE
1. Définition de la population
2. Cadre de l’échantillonnage
3. Unité de l’échantillonnage
4. Méthode d’échantillonnage
5. Taille de l’échantillon
6. Sélection de l’échantillon
La taille de l’échantillon
§ La précision a tendance à augmenter avec la taille de
l’échantillon
§ Dans l’échantillonnage probabiliste, la précision est
reliée au carré de la taille de l’échantillon
§ Pour un niveau de précision souhaitée, il est possible
de déterminer la taille minimum de l’échantillon
§ Un échantillon de taille 100 est considéré comme un
strict minimum.
§ Une taille de 1000 individus est recommandée et elle
est considérée comme crédible pour les enquêtes
grand public (produits de large consommation ).
La taille de l’échantillon Règle a
i Les contraintes financières influencent bien
souvent la taille de l’échantillon
B – CF
n=
CQ
B = budget de l’étude
CF = coûts fixes de l’étude
CQ = coût d’un questionnaire
La taille de
L’ECHANTILLON
1. Estimation des fréquences
2. Estimation des moyennes
La taille de
L’ECHANTILLON
Estimation des fréquences
§ La taille de l’échantillon nécessaire pour estimer une
fréquence. n = Taille de l’échantillon à interroger
t = C’est le paramètre de fiabilité fixé par le
chargé d’études. Peut être fixée à 99 %(t = 2,58),
t² × p ( 1 – p ) 95 %(t = 1,96) ou 90 % (t= 1,65).
n= e = C’est la tolérance, la marge d’erreur que
e2 l’on veut bien accepter à propos de ce que l’on
a à estimer. (souvent 5 %).
p = C’est l’estimation a priori et empirique de
l’ordre de grandeur de la proportion à étudier
dans la population. (50 %)
Estimation des fréquences Exemple ¤
§ Erreur = 5 % tα² × p(1–p)
§ Fiabilité = 95 % n=
§p = 50 % e2
On a donc n = 384,16 personnes.
On arrondit à l’entier supérieur : 385 personnes.
§ Pour mesurer la proportion d’individus voulue, il faut
interroger et traiter 385 enquêtés au seuil de confiance de
95 % avec une tolérance de 5 %, , sachant que la fiabilité
et la précision coûtent chères.
La taille de
L’ECHANTILLON
Estimation des moyennes
§ Pour estimer une moyenne, il faut utiliser des variables
quantitatives n = Taille de l’échantillon à interroger
t = C’est le paramètre de fiabilité fixé par le
chargé d’études. Peut être fixée à 99 %(t = 2,58),
tα² × sp² 95 %(t = 1,96) ou 90 % (t= 1,65).
n= e = C’est la tolérance, la marge d’erreur que
e2 l’on veut bien accepter à propos de ce que l’on
a à estimer. (souvent 5 %).
sp = C’est l’estimation a priori et empirique de
l’ordre de grandeur de l’écart type de la
population à étudier.
Estimation des Moyennes
Exemple d’une distribution statistique
- 3s - 2s -s x s 2s 3s
s = (Étendue / 6) = (x / 3)
Estimation des Moyennes Exemple ¤
On veut estimer le montant moyen des dépenses annuelles
en accessoires de fantaisie des femmes de 18 à 25 ans.
t² × sp²
§ Tolérance = 50 MAD n=
§ Fiabilité = 99 % e2
§ Dépense varie entre = 600 MAD et 3000 MAD
On a donc n = 426 personnes
§ Pour estimer le montant moyen des dépenses annuelles en
accessoires de fantaisie des femmes de 18 à 25 ans, il faut
interroger et traiter 426 personnes au seuil de confiance de
99 % avec une erreur acceptée de 50 MAD.
La méthode d’échantillonnage
1 La façon de sélectionner les unités
d’échantillonnage.
Deux méthodes d’échantillonnage:
§ Méthodes probabilistes
2
§ Méthodes non probabilistes
Les différentes méthodes
L’ECHANTILLONNAGE
Aléatoire Simple
Systématique
Échantillon
Stratifié
probabiliste
Par grappes
Par étapes: à plusieurs degrés
Par itinéraires
Échantillon De convenance
non probabiliste
Par quotas
« Boule de neige »
Les méthodes d’échantillonnage
PROBABILISTES
1. Echantillonnage aléatoire simple
2. Echantillonnage systématique
3. Echantillonnage stratifié
4. Echantillonnage par grappes
5. Echantillonnage par étapes
Les méthodes d’échantillonnage
PROBABILISTES:
Aléatoire simple
Chaque unité de la population ait la même probabilité
d’être sélectionné dans l’échantillon et de chaque
échantillon de même taille tiré de la population
Avantages Inconvénients
L’échantillon peut être
représentatif puisque chaque La nécessité d’une liste
individu a la même probabilité exhaustive de la population.
de faire partie de l’échantillon.
Aléatoire Simple Exemple ¤
Sélectionner un échantillon aléatoire simple de 10 boutiques
de vêtements sur un total de 80 dont on possède la liste
69 47 26 60 28 33 65 51 63 91 41 07 85 54 48 47 89 89
Étape 1: On numérote tous les individus de la liste de 01 à 80
Étape 2: On choisit par hasard un nombre supposons que c’est
le n°26, Après on sélectionne les nombres qui
coïncident avec la liste
694726,60,28,33,65,51,639141,07,85,5448478989
Les méthodes d’échantillonnage
PROBABILISTES:
Systématique
Répartir systématiquement le choix des unités à
échantillonner dans la population.
Avantages Inconvénients
Les données peuvent être
Réside dans la facilité de
biaisées à cause de la
sélection puisqu’un seul individu
périodicité (ex : une ampoule
est choisit au hasard
défectueuse après 4 bonnes)
Systématique A retenir N
Étape 1: On numérote tous les individus de 1 à N
Étape 2: Si l’échantillon est de taille n, on calcule la raison
du sondage (r) = N/n et puis on choisit par hasard un
nombre entier naturel (d) entre 1 et (r)
Étape 3: L’individu dont le numéro correspond à (d) est le
premier sélectionné.
Pour les autres, il suffit d’ajouter la raison du
sondage: d, d+r, d+2r,…n
Systématique Exemple ¤
Étape 1: 1 2 3 4 5 6………………………………N
Étape 2: (r) = 80/10 = 8
Étape 3: 1<(d = 6)<8 est le premier sélectionné.
Pour les autres, il suffit d’ajouter la raison du
sondage: d, d+r, d+2r,…n
Donc l’échantillon systématique sera numéroté
comme suit :
6, 14 (6+8), 22 (6+16), 30 (6+24), 38, 46, 54, 62, 70, 78
Les méthodes d’échantillonnage
PROBABILISTES:
Stratifié
§ Subdiviser la population en sous-groupes relativement
homogènes et mutuellement exclusifs appelés « strates ».
§ On tire dans chaque strate un échantillon aléatoire simple
§ Le regroupement de tous ces échantillons partiels
constitue l’échantillon de taille n
Avantages Inconvénients
La représentativité de En plus de la nécessité d’une
l’échantillon est intéressante et liste exhaustive, il faut une
l’erreur de l’échantillonnage est répartition de la population
faible. (critères d’homogénéisation)
Stratifié Exemple ¤
Numéro de Taille de la Valeurs des Moyenne des
strate strate observations observations
s ns (x) (xs)
1 2 1,2 1,5
2 4 3,6,2,8 4,75
3 6 10 , 8 , 11 , 15 , 9,83
6,9
Si les échantillons ns dans chaque strate comportent un
nombre d’observations proportionnel à la taille de la strate
dans la population, l’estimation de la moyenne de la
population est donnée par la moyenne de chaque strate
pondérée par son poids relatif:
ns
x = Ss x xS
n = la taille totale de l’échantillon n
Stratifié Exemple ¤
Numéro de Taille de la Valeurs des Moyenne des
strate strate observations observations
s ns (x) (xs)
1 2 1,2 1,5
2 4 3,6,2,8 4,75
3 6 10 , 8 , 11 , 15 , 9,83
6,9
2 4 6
x= x 1,5 + x 4,75 + x 9,83
12 12 12
x = 6,75
ns
x = Ss x xS
n
Les méthodes d’échantillonnage
PROBABILISTES:
Par grappes
§ Subdiviser la population en sous-groupes appelés « grappes ».
§ On tire ensuite un échantillon de grappes dans l’ensemble de
ces grappes (l’unité échantillonnale devenant alors la grappe).
Avantages Inconvénients
Le choix de l’échantillon est La corrélation entre les
facile et moins coûteux, étant membres, l’environnement
donné que la sélection se fait socio-économique n’est pas
de manière collective et non toujours la même / méthode
individuelle. moins précise
Par grappe Exemple ¤
Obtenir un échantillon aléatoire de famille dans une région
Étape 1: On commence par diviser la ville en quartiers.
Étape 2: On choisit un échantillon aléatoire de quartiers selon
l’échantillonnage aléatoire simple.
Étape 3: dans les quartiers ainsi choisis, on observe chacune
des familles qui y résident
Les méthodes d’échantillonnage
PROBABILISTES:
Par étapes: à plusieurs niveaux
§ Effectuer un choix aléatoire à chaque étape
§ On peut procéder en plusieurs étapes et tirer à nouveau
aléatoirement un sous-échantillon à l’intérieur de chacun des
groupes formés initialement.
Avantages Inconvénients
Coût de plus en plus important
Une meilleure combinaison coût et méthode de plus en plus
précision complexe lorsqu’il s’agit de plus
de deux étapes
Les méthodes d’échantillonnage
NON PROBABILISTES
1. Echantillonnage par itinéraire
2. Echantillonnage de convenance
3. Echantillonnage par quotas
4. Echantillonnage « Boule de neige »
Les méthodes d’échantillonnage
NON PROBABILISTES:
Par itinéraires
§ Dans ce cas on simule un chemin pour identifier un
échantillon représentatif.
§ Les enquêteurs doivent suivre obligatoirement cet
itinéraire et contacter les unités du sondage prévues à
l’avance.
Les méthodes d’échantillonnage
NON PROBABILISTES:
De convenance
§ Une information rapide et bon marché
§ Par exemple, une information obtenue auprès d’une classe
d’étudiants ou bien des entrevues effectuées dans la rue
auprès des dix premières personnes qui acceptent de
répondre.
Les méthodes d’échantillonnage
NON PROBABILISTES:
Par quotas
§ Inclure dans l’échantillon une proportion imposée de
certains sous-groupes de la population
§ La détermination des variables de contrôles et la
connaissance à priori de la taille de l’échantillon et de la
répartition de la population selon les variables de
contrôle.
§ La sélection des individus se fait en multipliant le taux de
sondage (t) par l’effectif de chaque modalité des variables
de contrôle : (t) = n/N
Par quotas Exemple ¤
Déterminer la répartition de l’échantillon selon les variables de
contrôle suivantes : sexe, âge de taille n=1000, population N=5000
dont 60% sont des hommes, 20% de la population est âgé de –20 ans,
40% entre 20 et 40 ans.
Modalité Effectif Age Répartition/Age
0-20 1000
Femmes 2000
20-40 2000
Hommes 3000
>40 2000
Total 5000 5000
(t) = 1000/5000 = 0.2
Modalité Effectif Age Répartition/Age
0-20 200
Femmes 400
20-40 400
Hommes 600
>40 400
Total 1000 1000
Les méthodes d’échantillonnage
NON PROBABILISTES:
Boule de neige
§ Obtenir de l’information auprès d’un groupe d’experts
dans un domaine très spécialisé
§ Identifier les membres du groupe en demandant aux
premiers rencontrés d’en identifier d’autres qu’ils
connaissent
§ Exemple, Plusieurs individus interviennent dans les
décisions d’achat et l’identification des membres du « groupe
d’achat » chez les clients à partir d’un premier répondant qui
identifie des participants à la décision d’achat.
Synthèse générale
§ Le principe de l’analyse coût/valeur
§ La nature de l’information requise (moyennes, proportions,
projections à toute la population),
§ La précision voulue dans les estimations
§ L’importance relative de l’erreur d’échantillonnage
§ L’homogénéité de la population et le coût des erreurs dans
l’information obtenue.
Synthèse générale
On optera pour un échantillonnage probabiliste
lorsque : les résultats doivent être projetés à toute la
population, l’erreur tolérable est faible, le coût de l’erreur
est élevé et la population est hétérogène.
Existence d’une liste des individus de la
population de base ?
Oui
Non
Sondage aléatoire possible
Sondages par quotas Coûts du sondage élevé
Oui
Non
Population très hétérogène ?
Oui
Sondage quasi aléatoire
Non
Sondage aléatoire