On entend souvent (et on lit souvent) cet aphorisme aussi définitif que débile : "On peut faire dire absolument tout aux statistiques !". Et bien non, désolé de contedire tous ces esprits forts : seuls les ignorants font dire à ces données chiffrées n'importe quoi ! Je veux aujourd'hui apporter un éclairage sur ce sujet, et pas seulement parce que je l'ai promis à Sékateur !
Les données obtenues par diverses méthodes (dont la meilleure n'est certainement pas la technique des sondages d'opinion) sont ce qu'on appelle des données brutes; on pourrait les publier telles quelles, et certains parfois le font (EXEMPLE : le salaire moyen des fonctionnaires est supérieur au salaire moyen des salariés du secteur privé) : c'est la meilleure façon de proférer des çonneries !!!! D'ailleurs, l'exemple qui précède en est une parfaite illustration.
C'est que, sauf à disposer des renseignements concernant toute une population, ce qui est ABSOLUMENT IMPOSSIBLE, on travaille toujours sur des échantillons. Et un échantillon doit être représentatif de la population à laquelle on souhaite appliquer les conclusions tirées de l'étude. Je pourrais vous faire 20 pages sur ce sujet-ci; mais ce n'est pas mon propos. Je me contenterai de ces quelques notions :
* Pour qu'un échantillon soit représentatif d'une population, il faut IMPERATIVEMENT que tous les sujets de la population aient eu la même probabilité de se retrouver dans l'échantillon. EXEMPLE ? Dans une enquête par téléphone, compte tenu du fait que tout le monde n'a pas le téléphone, ou que certains sont sur des listes spéciales, pensez-vous que l'échantillon sera représentatif ? Et si le fait d'avoir le téléphone et d'être dans l'annuaire a un rapport même lointain avec le sujet de l'étude, l'étude vous paraît-elle valide ?
* Tous les sondages sont biaisés, et pas seulement les enquêtes d'opinion.
* Un Biais est une erreur systématique qui affecte le résultat d'une enquête dans un sens à priori impossible à connaître; il faut donc s'efforcer de contrôler les biais !
* Ce contrôle des biais repose sur des techniques plus ou moins sophistiquées qui peuvent être appliquées, selon la technique, AVANT ou APRES l'enquête.
* Par opposition aux données brutes on obtient des données standardisées, stratifiées, pondérées, corrigées des variations saisonnières, .... BREF des données redressées. Et ces données redressées, tenez-vous bien Mesdames et Messieurs, sont toujours plus proches de la vérité que les données brutes !!!!
Pour en revenir à l'exemple du salaire moyen en France, la moyenne présentée en France (peut-être pour monter les salariés du privé contre les fonctionnaires ?) est en fait biaisée par la différence de structure de l'emploi entre le public et le privé : les Catégories A - B - C des salariés n'ont pas la même importance numérique dans les 2 systèmes; le privé a beaucoup plus de catégories C (les plus mal payées) que le public (dans lequel cette catégorie est un peu moins mal payée), et la Catégorie B est très largement représentée dans le public (et beaucoup moins bien payée que dans le privé) [tandis que la A connaît une importance égale dans les 2 systèmes pour la proportion, avec des salaires plus bas dans le public]. Si on veut parler du salaire moyen global il faut tenir compte de cette différence de répartition et calculer une moyenne pondérée, un peu comme on calcule au Lycée une moyenne des notes obtenues en tenant compte des coefficient affectés aux différentes matières scolaires .... Et dans ce cas, il apparaît que le salaire moyen du fonctionnaire est inférieur au salaire moyen du privé !!!
Ce long préambule me permet d'asseoir ma démonstration :
Les sondages d'opinion qui "donnent" Marine Le Pen à 25% d'intentions de vote (1 votant sur 4 !) sont probablement biaisés .... Revenons 10 ans en arrière :
- Jean-Marie Le Pen, en 2001, soit 1 an avant la présidentielle, était "donné" à 9%; au cours de la campagne il est une peu monté, à 10 ou 11%;
- Au premier tour il obtient 17% et se qualifie pour le 2nd tour : stupeur dans le Peuple de France qui tombe à bras raccourcis sur les instituts de sondage qui n'avaient pas "VU" le phénomène arriver;
- Les sondeurs, gens très sérieux et compétents, réfléchissent et trouvent vite la raison de cette surprise : les "sondés" n'osent pas avouer qu'ils ont l'intention de voter pour le F.N. ! Les experts inventent donc (de leur propre aveu par moi entendu), pour les élections suivantes, une technique de redressement des données brutes qui tient compte de ce fait ! Et en effet, "ça marche"; pour les élections suivantes, et surtout les Présidentielles de 2007, le résultat est conforme aux sondages antérieurs.
Je ne sais pas si les instituts de sondage appliquent toujours cette technique de redressement (j'ai écouté et lu en vain); SI C'EST LE CAS, les intentions de vote en faveur de Marine Le Pen sont probablement sur-estimées pour la raison inverse qui faisait que les intentions en faveur de son père étaient SOUS-ESTIMEES : en effet, il semble bien que les électeurs Français aient moins honte de dire qu'ils vont voter pour elle qu'ils n'en avaient pour le père !
Certes, il faut tenir compte de l'incurie du pouvoir en place, de l'immobilisme du P.S. et de son silence sur l'immigration et la sécurité, ET AUSSI de l'équation personnelle de notre Marine Nationale : personnellement, si je voulais me mouiller, (ce qui n'est pas forcément le cas, sauf à donner mon sentiment personnel qui n'engage que moi), je dirais que je pense que, là où son père était à 9%, la fille se situe probablement entre 15 et 18%, ce qui est déjà beaucoup trop pour un Républicain !
C.Q.F.D.
"Insondable, Non ?"