Quand McKinsey et l’OCDE oublient les données brutes et extrapolent sur la base d’un modèle peu convaincant

Dans son rapport sur l’évolution du métier d’enseignant, le cabinet McKinsey propose l’idée de rémunérer les enseignants au mérite, et utilise, en guise d’argument, une affirmation de l’OCDE selon laquelle la rémunération au mérite permet d’améliorer les résultats des élèves lorsque les professeurs sont mal payés (comme en France) tandis que cela aurait l’effet inverse lorsque les professeurs sont bien payés.

Cette affirmation se base sur le graphique suivant, issu d’un document de l’OCDE intitulé Does performance-based pay improve teaching ? dans lequel on trouve le graphique suivant :

Ce graphique a été repris, moyennant quelques variations visuelles, dans la page 38 du document Approfondissement Valorisation du Mérite_vf de McKinsey, que vous trouverez en fin d’article :

Ce modèle suggère également que les résultats des élèves sont positivement corrélés à la rémunération de base des enseignants. Il est étonnant que cette proposition ne soit pas évoquée.

Nous pouvons afficher les nuages de points issus des données brutes fournies avec l’étude ainsi que leurs droites de régression linéaire respectives. Je vous laisse juge de la pertinence de résumer ces données par une simple droite :

Les points pouvant s’éloigner très fortement des droites qui sont censées les modéliser, il est complètement vain d’utiliser celles-ci avec une visée prédictive.

Pour juger de la pertinence de ce modèle, il est également intéressant de jeter un œil à deux grandeurs annexes :

  • L’intervalle de confiance, qui permet de visualiser l’incertitude sur l’emplacement de la droite, est une zone dans laquelle la droite a, compte-tenu de la variabilité des données, 95% de chances de se trouver.
  • L’intervalle de fluctuation, qui permet de visualiser l’incertitude sur l’emplacement des données, est une zone dans laquelle celles-ci ont 95% de chances de se trouver.

On obtient alors le graphique suivant :

On peut constater sur celui-ci qu’il y a une forte incertitude sur le modèle, l’intervalle de confiance de chacune des droites nous indiquant qu’il y a une probabilité non négligeable pour que la droite bleue des pays qui pratiquent la prime au mérite soit en réalité en-dessous de la droite orange des pays qui ne la pratiquent pas.

De plus, les intervalles de fluctuation se recouvrent de manière tellement large qu’il est impossible d’affirmer qu’un pays qui mettrait en place une prime au mérite (ou l’abandonnerait) puisse constater un effet sur les performances des élèves.

On notera également qu’aucune donnée des pays pratiquant la prime au mérite ne se trouve dans la partie droite du graphique, ce qui n’a pas empêché l’OCDE de prolonger la droite correspondante afin d’en conclure quelque chose pour les pays dans lesquels les professeurs sont bien payés. On remarquera cependant que les pays dans lesquels les professeurs sont bien rémunérés ne pratiquent pas la prime au mérite.

Le document technique fourni par l’OCDE nous indique que leur analyse est en réalité plus complexe qu’une simple régression linéaire et inclut des données qui ne sont pas présentes dans le fichier xls fourni avec l’étude, ainsi que des variables qui sont passées sous silence dans le document principal.
Si d’autres variables permettent d’expliquer les fortes variations observées lorsqu’on compare la performance des élèves en lecture et le salaire des enseignants ramené au PIB par habitant, ces variables devraient être mentionnées dans le document principal. Cela signifie qu’il existe d’autres leviers dont il serait intéressant de quantifier les effets.
Par ailleurs, si la corrélation est significative, cela implique que les données se trouvent proches d’un hyperplan qui ne saurait être résumé par une unique droite :
– d’une part, rien ne nous garantit que les deux droites soient dans la même position l’une par rapport à l’autre si on observe une autre intersection des hyperplans correspondants ;
– d’autre part, l’incertitude due à la variabilité des données devrait être quantifiée en faisant apparaître les intervalles de confiance et de fluctuation des hyperplans : plus cette dispersion est importante, plus la valeur prédictive du modèle est faible.

On peut également lire dans ce document technique que le Canada, le Chili, la France, le Mexique, la Nouvelle-Zélande, la Slovaquie et la Turquie ont été exclues de l’étude en raison de données manquantes. On constate cependant que pour 4 de ces pays, la pratique de la prime au mérite est connue, et que chacun de ces pays a un score de lecture inférieur à la moyenne des pays retenus pour l’étude (qui est de 497). Ce score de lecture est même inférieur pour 3 d’entre eux à celui de l’Autriche (qui est de 470, score le plus faible de toute l’étude).

PaysPerformance moyenne en lecturePrime au mériteSalaire des enseignants en % du PIB/hab.
Canada524n.c.n.c.
Chili449ouin.c
France496n.c.105
Mexique425ouin.c
Nouvelle-Zélande521n.c.142
Slovaquie477ouin.c.
Turquie464ouin.c.

Ajouter ces 4 pays ayant de faibles performances en lecture aux 12 points de données existants est susceptible de déplacer la droite bleue (plus exactement l’hyperplan sous-jacent) vers le bas du graphique, et possiblement modifier sa pente, ce qui peut radicalement changer les conclusions de l’étude.

Un grand merci à @JulienGossa et @_MickaelM_ pour avoir initié la réflexion.

Code Python utilisé pour générer les graphiques :

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import statsmodels.formula.api as smf

df = pd.read_csv('perf_remu_OCDE.csv')
moyenne = df['Mean_perf'].mean();
df['Mean_perf']-=moyenne
df['YSALARY']*=100
df.sort_values(by=['YSALARY'], inplace=True)
df_oui = df.loc[df['TPP']=='oui']
df_non = df.loc[df['TPP']=='non']

name_x = 'salaire enseignant en % du PIB par habitant'
name_y = 'score lecture PISA - score moyen'
name_hue = 'prime au mérite'

alpha = .05
results1 = smf.ols('Mean_perf ~ YSALARY', df_oui).fit()
predictions1 = results1.get_prediction(df_oui).summary_frame(alpha)
results2 = smf.ols('Mean_perf ~ YSALARY', df_non).fit()
predictions2 = results2.get_prediction(df_non).summary_frame(alpha)


x1 = df_oui['YSALARY']
y1 = df_oui['Mean_perf']
x2 = df_non['YSALARY']
y2 = df_non['Mean_perf']

fig, ax = plt.subplots(figsize=(12, 6.75), dpi=80)

ax.fill_between(x1, predictions1['obs_ci_lower'], predictions1['obs_ci_upper'], alpha=.1, color='royalblue', label='Intervalle de fluctuation avec prime au mérite')
ax.fill_between(x2, predictions2['obs_ci_lower'], predictions2['obs_ci_upper'], alpha=.1, color='darkorange', label='Intervalle de fluctuation sans prime au mérite')

ax.fill_between(x1, predictions1['mean_ci_lower'], predictions1['mean_ci_upper'], alpha=.5, color='royalblue', label='Intervalle de confiance avec prime au mérite')
ax.fill_between(x2, predictions2['mean_ci_lower'], predictions2['mean_ci_upper'], alpha=.5, color='darkorange', label='Intervalle de confiance sans prime au mérite')

ax.plot(x1, predictions1['mean'], color='royalblue', label='Modèle linéaire avec prime au mérite')
ax.plot(x2, predictions2['mean'], color='darkorange', label='Modèle linéaire sans prime au mérite')

ax.scatter(x1, y1, label='Avec prime au mérite', marker='o', color='royalblue')
ax.scatter(x2, y2, label='Sans prime au mérite', marker='o', color='darkorange')


plt.xlabel(name_x)
plt.ylabel(name_y)
plt.legend(loc ="lower right")

fig.savefig('data.png')

Fichier csv contenant les données utilisées par le programme :

Annexes d’approfondissement du rapport McKinsey :

Interpoler une fonction de répartition des salaires à partir de quantiles connus

Introduction

Cet article est assez technique et est destiné à documenter le calcul de la position d’un salaire dans la distribution des salaires du secteur privé dans notre Observatoire des salaires des enseignants.
Si vous êtes intéressé par les animations de convergence et la précision obtenue, rendez-vous directement dans la dernière partie de l’article, mais si vous avez quelques bases en analyse numérique et êtes intéressé par le type d’interpolation utilisé, vous pourrez trouver dans ce qui suit quelques indications sur la méthode que nous avons utilisée.

Afin d’estimer la distribution des salaires, l’INSEE fournit un certain nombre de quantiles, qui sont en général les premier et dernier déciles, les quartiles, la médiane, ainsi que les 95ème et 99ème centiles.
L’objectif est ici de déterminer une approximation de la fonction de répartition des salaires basée sur les quantiles fournis.

Cette approximation sera réalisée en utilisant :

  • des arcs de fonctions cubiques pour la partie centrale située entre les quantiles fournis ;
  • un arc d’exponentielle de fonction quadratique pour les valeurs inférieures au plus petit quantile connu (ceci permet une croissance plus forte qu’une simple exponentielle) ;
  • un arc d’exponentielle de fonction affine pour les valeurs supérieures au plus grand quantile connu.

    La forte croissance de la fonction de répartition des salaires pour les petits quantiles est probablement due à l’existence d’un salaire minimum empêchant aux salaires d’avoir une valeur arbitrairement petite. Étant donné qu’il s’agit d’un trait spécifique au cas étudié ici, les fonctions à utiliser dans d’autres cas de figure dépendront donc des caractéristiques de la fonction de répartition à approximer.

Fonction utilisée pour approximer la fonction de répartition

Supposons connus n quantiles d’un échantillon statistique.
Notons (x_0; y_0), (x_1; y_1), \dots (x_{n-1}; y_{n-1}) les n points correspondants par lesquels doit passer la fonction de répartition (les ordonnées sont comprises entre 0 et 1 et les abscisses, tout comme les ordonnées, sont classées par ordre croissant).

On cherche une fonction f de classe \mathcal{C}^2(\mathbb{R}) passant par ces points, et paramétrée par le vecteur a = (a_0 \dots a_{4n})^\top contenant 4n+1 coefficients, de la forme :

    \[f(x;a)=\left\{\begin{array}{ll}\exp(a_0x^2+a_1x+a_2) & \text{si } x \leq x_0 \\a_3x^3+a_4x^2+a_5x+a_6 & \text{si } x_0 < x \leq x_1 \\a_7x^3+a_8x^2+a_9x+a_{10}& \text{si } x_1 < x \leq x_2 \\\vdots & \vdots \\a_{4k-1}x^3+a_{4k}x^2+a_{4k+1}x+a_{4k+2} & \text{si } x_{k-1} < x \leq x_k \\\vdots & \vdots \\a_{4n-5}x^3+a_{4n-4}x^2+a_{4n-3}x+a_{4n-2} & \text{si } x_{n-2} < x \leq x_{n-1} \\1-\exp(a_{4n-1}x+a_{4n}) & \text{si } x_{n-1} < x \\\end{array}\right. .\]

La fonction f étant de classe \mathcal{C}^2(\mathbb{R}), sa fonction de densité f' est de classe \mathcal{C}^1(\mathbb{R}).

Un raccordement \mathcal{C}^2 en chacun des n points permet d’obtenir 4n équations (2n pour les raccordements \mathcal{C}^0 à droite et à gauche de chaque point, n pour le raccordement \mathcal{C}^1, et n pour le raccordement \mathcal{C}^2).
Afin d’obtenir un système carré, on ajoute une équation de raccordement \mathcal{C}^3 sur le point (x_0, y_0) ce qui nous donne un total de 4n+1 équations, égal au nombre de paramètres à déterminer.

Système d’équations à résoudre

Le système à résoudre est alors le suivant :

    \[\left\{\begin{array}{l}\begin{array}{lclcl}\text{raccordements } \mathcal{C}^0 \text{ : } & & \\\exp(a_0x_0^2+a_1x_0+a_2) & - & y_0 & = & 0 \\a_3x_0^3+a_4x_0^2+a_5x_0+a_6 & - & y_0 & = & 0 \\a_3x_1^3+a_4x_1^2+a_5x_1+a_6 & - & y_1 & = & 0 \\a_7x_1^3+a_8x_1^2+a_9x_1+a_{10} & - & y_1 & = & 0 \\& \vdots & & \vdots & \\a_{4k-5}x_{k-1}^3+a_{4k-4}x_{k-1}^2+a_{4k-3}x_{k-1}+a_{4k-2} & - & y_{k-1} & = & 0 \\a_{4k-1}x_{k-1}^3+a_{4k}x_{k-1}^2+a_{4k+1}x_{k-1}+a_{4k+2} & - & y_{k-1} & = & 0 \\a_{4k-1}x_{k}^3+a_{4k}x_{k}^2+a_{4k+1}x_{k}+a_{4k+2} & - & y_{k} & = & 0 \\a_{4k+3}x_{k}^3+a_{4k+4}x_{k}^2+a_{4k+5}x_{k}+a_{4k+6} & - & y_{k} & = & 0 \\& \vdots & & \vdots & \\a_{4n-5}x_{n-1}^3+a_{4n-4}x_{n-1}^2+a_{4n-3}x_{n-1}+a_{4n-2} & - & y_{n-1} & = & 0 \\1-\exp(a_{4n-1}x_{n-1}+a_{4n}) & - & y_{n-1} & = & 0 \\\end{array}\\\\\begin{array}{lclcl}\text{raccordements } \mathcal{C}^1 \text{ : } & & \\(2a_0x_0+a_1)\exp(a_0x_0^2+a_1x_0+a_2) & - & (3a_3x_0^2+2a_4x_0+a_5) & = & 0 \\3a_3x_1^2+2a_4x_1+a_5 & - & (3a_7x_1^2+2a_8x_1+a_9) & = & 0 \\& \vdots & & \vdots & \\3a_{4k-5}x_{k-1}^2+2a_{4k-4}x_{k-1}+a_{4k-3} & - & (3a_{4k-1}x_{k-1}^2+2a_{4k}x_{k-1}+a_{4k+1}) & = & 0 \\3a_{4k-1}x_{k}^2+2a_{4k}x_{k}+a_{4k+1} & - & (3a_{4k+3}x_{k}^2+2a_{4k+4}x_{k}+a_{4k+5}) & = & 0 \\& \vdots & & \vdots & \\3a_{4n-5}x_{n-1}^2+2a_{4n-4}x_{n-1}+a_{4n-3} & + & a_{4n-1}\exp(a_{4n-1}x_{n-1}+a_{4n}) & = & 0 \\\end{array}\\\\\begin{array}{lclcl}\text{raccordements } \mathcal{C}^2 \text{ : } & & \\((2a_0x_0+a_1)^2+2a_0)\exp(a_0x_0^2+a_1x_0+a_2) & - & (6a_3x_0+2a_4) & = & 0 \\6a_3x_1+2a_4 & - & (6a_7x_1+2a_8) & = & 0 \\& \vdots & & \vdots & \\6a_{4k-5}x_{k-1}+2a_{4k-4} & - & (6a_{4k-1}x_{k-1}+2a_{4k}) & = & 0 \\6a_{4k-1}x_{k}+2a_{4k} & - & (6a_{4k+3}x_{k}+2a_{4k+4}) & = & 0 \\& \vdots & & \vdots & \\6a_{4n-5}x_{n-1}+2a_{4n-4} & + & a_{4n-1}^2\exp(a_{4n-1}x_{n-1}+a_{4n}) & = & 0 \\\end{array}\\\\\begin{array}{lcl}\text{raccordement } \mathcal{C}^3 \text{ : } & & \\(8a_0^3x_0^3+6a_0(2a_0x_0+a_1)(a_1x_0+1)+a_1^3)\exp(a_0x_0^2+a_1x_0+a_2) - 6a_3 & = & 0 \\\end{array}\end{array}\right. .\]

Ce système étant non linéaire, nous procéderons à sa résolution approchée à l’aide de la méthode de Newton. Pour cela, la matrice jacobienne correspondante sera nécessaire.

Matrice jacobienne

Dans ce qui suit, on note : P_0(x) = a_0x^2+a_1x+a_2.

Voici les 7 premières colonnes de la matrice jacobienne, elles contiennent les dérivées partielles selon les paramètres a_0 à a_6 :

    \[\left(\begin{array}{*3{>{\displaystyle}c}|*4{>{\displaystyle}c}|*1{>{\displaystyle}c}}E_1 & E_2 & E_3 & 0 & 0 & 0 & 0 & \multirow{4}{*}{\text{$(\ast)$}} \\\multicolumn{3}{c|}{\multirow{3}{*}{\text{$(0)$}}} & x_0^3 & x_0^2 & x_0 & 1 \\\multicolumn{3}{c|}{} & x_1^3 & x_1^2 & x_1 & 1 \\\multicolumn{3}{c|}{} & \multicolumn{4}{c|}{\text{$(0)$}} \\\hline & & & & & & & \\E_4 & E_5 & E_6 & -3x_0^2 & -2x_0 & -1 & 0 & \multirow{3}{*}{\text{$(\ast)$}} \\\multicolumn{3}{c|}{\multirow{2}{*}{\text{$(0)$}}} & 3x_1^2 & 2x_1 & 1 & 0 \\\multicolumn{3}{c|}{} & \multicolumn{4}{c|}{\text{$(0)$}} \\\hline & & & & & & & \\E_7 & E_8 & E_9 & -6x_0 & -2 & 0 & 0 & \multirow{3}{*}{\text{$(\ast)$}} \\\multicolumn{3}{c|}{\multirow{2}{*}{\text{$(0)$}}} & 6x_1 & 2 & 0 & 0 \\\multicolumn{3}{c|}{} & \multicolumn{4}{c|}{\text{$(0)$}} \\\hline & & & & & & & \\E_{10} & E_{11} & E_{12} & -6 & 0 & 0 & 0 & \text{$(\ast)$} \\\end{array}\right).\]

Avec :

    \[E_1 = x_0^2 \exp(P_0(x_0)) ,\]

    \[E_2 = x_0 \exp(P_0(x_0)) ,\]

    \[E_3 = \exp(P_0(x_0)) ,\]

    \[E_4 = x_0 (2 a_0 x_0^2 + a_1 x_0 + 2) \exp(P_0(x_0)) ,\]

    \[E_5 = (2 a_0 x_0^2 + a_1 x_0 + 1) \exp(P_0(x_0)) ,\]

    \[E_6 = (2 a_0 x_0 + a_1 ) \exp(P_0(x_0)) ,\]

    \[E_7 = (4 a_0^2 x_0^4 + 2 a_0 x_0^2 (2 a_1 x_0 + 5) + a_1^2 x_0^2 + 4 a_1 x_0 + 2) \exp(P_0(x_0)) ,\]

    \[E_8 = (4 a_0^2 x_0^3 + 2 a_0 x_0 (2 a_1 x_0 + 3) + a_1 (a_1 x_0 + 2)) \exp(P_0(x_0)) ,\]

    \[E_9 = (4 a_0 x_0 (a_0 x_0 + a_1) + 2 a_0 + a_1^2) \exp(P_0(x_0)) ,\]

    \[E_{10} = (8 a_0^3 x_0^5 + 12 a_0^2 x_0^3 (a_1 x_0 + 3) + 6 a_0 x_0 (a_1^2 x_0^2 + 5 a_1 x_0 + 4) + a_1 (a_1^2 x_0^2 + 6 a_1 x_0 + 6)) \exp(P_0(x_0)) ,\]

    \[E_{11} = (8 a_0^3 x_0^4 + 12 a_0^2 a_1 x_0^3 + 24 a_0^2 x_0^2 + 6 a_0 a_1^2 x_0^2 + 18 a_0 a_1 x_0 + 6 a_0 + a_1^3 x_0 + 3 a_1^2) \exp(P_0(x_0)) ,\]

    \[E_{12} = (2 a_0 x_0 + a_1) (4 a_0^2 x_0^2 + 4 a_0 a_1 x_0 + 6 a_0 + a_1^2) \exp(P_0(x_0)).\]

Pour tout k\in\llbracket 2 ; n-2 \rrbracket, voici les colonnes {4k-5} à {4k+6} de la matrice jacobienne, elles contiennent les dérivées partielles selon les paramètres a_{4k-5} à a_{4k+6} :

    \[\left(\begin{array}{*1{>{\displaystyle}c}|*4{>{\displaystyle}c}|*4{>{\displaystyle}c}|*4{>{\displaystyle}c}|*1{>{\displaystyle}c}}\multirow{9}{*}{\text{$(\ast)$}} & \multicolumn{4}{c|}{\text{$(0)$}} & \multicolumn{4}{c|}{\multirow{3}{*}{\text{$(0)$}}} & \multicolumn{4}{c|}{\multirow{5}{*}{\text{$(0)$}}} & \multirow{9}{*}{\text{$(\ast)$}} \\& x_{k-2}^3 & x_{k-2}^2 & x_{k-2} & 1 & \multicolumn{4}{c|}{} & \multicolumn{4}{c|}{} & \\& x_{k-1}^3 & x_{k-1}^2 & x_{k-1} & 1 & \multicolumn{4}{c|}{} & \multicolumn{4}{c|}{} & \\& \multicolumn{4}{c|}{\multirow{5}{*}{\text{$(0)$}}} & x_{k-1}^3 & x_{k-1}^2 & x_{k-1} & 1 & \multicolumn{4}{c|}{} & \\& \multicolumn{4}{c|}{} & x_{k}^3 & x_{k}^2 & x_{k} & 1 & \multicolumn{4}{c|}{} & \\& \multicolumn{4}{c|}{} & \multicolumn{4}{c|}{\multirow{2}{*}{\text{$(0)$}}} & x_{k}^3 & x_{k}^2 & x_{k} & 1 & \\& \multicolumn{4}{c|}{} & \multicolumn{4}{c|}{} & x_{k+1}^3 & x_{k+1}^2 & x_{k+1} & 1 & \\& \multicolumn{4}{c|}{} & \multicolumn{4}{c|}{} & \multicolumn{4}{c|}{\text{$(0)$}} & \\\hline & & & & & & & & & & & & & \\\multirow{6}{*}{\text{$(\ast)$}} & \multicolumn{4}{c|}{\text{$(0)$}} & \multicolumn{4}{c|}{\multirow{2}{*}{\text{$(0)$}}} & \multicolumn{4}{c|}{\multirow{3}{*}{\text{$(0)$}}} & \multirow{6}{*}{\text{$(\ast)$}} \\& -3x_{k-2}^2 & -2x_{k-2} & -1 & 0 & \multicolumn{4}{c|}{} & \multicolumn{4}{c|}{} & \\& 3x_{k-1}^2 & 2x_{k-1} & 1 & 0 & -3x_{k-1}^2 & -2x_{k-1} & -1 & 0 & \multicolumn{4}{c|}{} & \\& \multicolumn{4}{c|}{\multirow{3}{*}{\text{$(0)$}}} & 3x_{k}^2 & 2x_{k} & 1 & 0 & -3x_{k}^2 & -2x_{k} & -1 & 0 & \\& \multicolumn{4}{c|}{} & \multicolumn{4}{c|}{\multirow{2}{*}{\text{$(0)$}}} & 3x_{k+1}^2 & 2x_{k+1} & 1 & 0 & \\& \multicolumn{4}{c|}{} & \multicolumn{4}{c|}{} & \multicolumn{4}{c|}{\text{$(0)$}} & \\\hline\multirow{6}{*}{\text{$(\ast)$}} & \multicolumn{4}{c|}{\text{$(0)$}} & \multicolumn{4}{c|}{\multirow{2}{*}{\text{$(0)$}}} & \multicolumn{4}{c|}{\multirow{3}{*}{\text{$(0)$}}} & \multirow{6}{*}{\text{$(\ast)$}} \\& -6x_{k-2} & -2 & 0 & 0 & \multicolumn{4}{c|}{} & \multicolumn{4}{c|}{} & \\& 6x_{k-1} & 2 & 0 & 0 & -6x_{k-1} & -2 & 0 & 0 & \multicolumn{4}{c|}{} & \\& \multicolumn{4}{c|}{\multirow{3}{*}{\text{$(0)$}}} & 6x_{k} & 2 & 0 & 0 & -6x_{k} & -2 & 0 & 0 & \\& \multicolumn{4}{c|}{} & \multicolumn{4}{c|}{\multirow{2}{*}{\text{$(0)$}}} & 6x_{k+1} & 2 & 0 & 0 & \\& \multicolumn{4}{c|}{} & \multicolumn{4}{c|}{} & \multicolumn{4}{c|}{\text{$(0)$}} & \\\hline & & & & & & & & & & & & & \\{\text{$(\ast)$} & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & \text{$(\ast)$} \\\end{array}\right).\]

Dans ce qui suit, on note P_{4n-1}(x) = a_{4n-1}x+a_{4n}.

Voici les 6 dernières colonnes de la matrice jacobienne, elles contiennent les dérivées partielles selon les paramètres a_{4n-5} à a_{4n} :

    \[\left(\begin{array}{*1{>{\displaystyle}c}|*4{>{\displaystyle}c}|*2{>{\displaystyle}c}}\multirow{4}{*}{\text{$(\ast)$}} & \multicolumn{4}{c|}{\text{$(0)$}} & \multicolumn{2}{c}{\multirow{3}{*}{\text{$(0)$}}} \\& x_{n-2}^3 & x_{n-2}^2 & x_{n-2} & 1 & \multicolumn{2}{c}{} \\& x_{n-1}^3 & x_{n-1}^2 & x_{n-1} & 1 & \multicolumn{2}{c}{} \\& 0 & 0 & 0 & 0 & E'_{1} & E'_{2} \\\hline & & & & & & \\\multirow{3}{*}{\text{$(\ast)$}} & \multicolumn{4}{c|}{\text{$(0)$}} & \multicolumn{2}{c}{\multirow{2}{*}{\text{$(0)$}}} \\& -3x_{n-2}^2 & -2x_{n-2} & -1 & 0 & \multicolumn{2}{c}{} \\& 3x_{n-1}^2 & 2x_{n-1} & 1 & 0 & E'_{3} & E'_{4} \\\hline & & & & & & \\\multirow{3}{*}{\text{$(\ast)$}} & \multicolumn{4}{c|}{\text{$(0)$}} & \multicolumn{2}{c}{\multirow{2}{*}{\text{$(0)$}}} \\& -6x_{n-2} & -2 & 0 & 0 & \multicolumn{2}{c}{} \\& 6x_{n-1} & 2 & 0 & 0 & E'_{5} & E'_{6} \\\hline & & & & & & \\\text{$(\ast)$} & 0 & 0 & 0 & 0 & 0 & 0 \\\end{array}\right).\]

Avec :

    \[E'_1 = -x_{n-1} \exp(P_{4n-1}(x_{n-1})) ,\]

    \[E'_2 = -\exp(P_{4n-1}(x_{n-1})) ,\]

    \[E'_3 = (a_{4n-1} + 1)\exp(P_{4n-1}(x_{n-1})) ,\]

    \[E'_4 = a_{4n-1} \exp(P_{4n-1}(x_{n-1})) ,\]

    \[E'_5 =(a_{4n-1}^2x_{n-1} + 2a_{4n-1}) \exp(P_{4n-1}(x_{n-1})) ,\]

    \[E'_6 = a_{4n-1}^2 \exp(P_{4n-1}(x_{n-1})).\]

Résultats

Nous avons testé cette méthode en utilisant les données des salaires nets équivalent temps plein de 2020 (figure complémentaire 4 du fichier xls fourni par l’INSEE sur cette page). Pour cela, nous avons utilisé les 10ème, 25ème, 50ème, 75ème, 90ème et 95ème centiles (qui sont disponibles pour la plupart des années) pour servir de base à l’optimisation, et les autres centiles disponibles (du 5ème au 99ème) pour tester la justesse de notre fonction d’estimation.
La valeur initiale du vecteur de paramètres est déterminée de telle façon que les points servant de base à l’interpolation soient reliés par des segments de droite, et que les exponentielles des intervalles extrêmes soient raccordées de manière \mathcal{C}^1 au segment le plus proche.

On peut tout d’abord constater une convergence assez rapide. Seules 6 itérations de la méthode de Newton sont nécessaires pour que la norme de la différence entre deux valeurs successives du vecteur de paramètres a devienne inférieure à 10^{-15}. Le processus de convergence est illustré par les figures 1 et 2.

Fig 1. Convergence de l’approximation de la fonction de répartition
Fig 2. Convergence de la fonction de densité correspondante (dérivée de la fonction de répartition)

On peut maintenant comparer l’image de l’ensemble des centiles disponibles dans le tableau de l’INSEE aux valeurs calculées à l’aide de la fonction de répartition obtenue avec notre méthode (Fig 3.). On constate que l’erreur n’excède pas 0,2% jusqu’au 96ème centile inclus, et reste inférieure à 0,5% pour les centiles restants (Fig 4).

Fig 3. Quantiles fournis par l’INSEE et estimation obtenue
Fig 4. Différence entre l’estimation et la valeur fournie par l’INSEE

Salaires des professeurs de l’Éducation nationale : annonces grandiloquentes et déclassement au long cours

Depuis quelques années, les rares augmentations du salaire des enseignants font l’objet d’une communication qui n’est malheureusement pas en adéquation avec la réalité :

  • En 2016, vousnousils, magazine en ligne traitant d’éducation, relaie l’annonce d’une « forte revalorisation des carrières dans le cadre du PPCR [NDLR : Parcours professionnels, carrière et rémunération] », qui entrera en vigueur en 2017.
    Or, dans une note d’information de septembre 2020, la DEPP [NDLR : Direction de l’évaluation, de la prospective et de la performance] constate « Si, en 2017, l’entrée en vigueur du protocole Parcours professionnels, carrière et rémunération avait fortement dynamisé les salaires des enseignants déjà rémunérés par le ministère de l’Éducation nationale l’année précédente, en 2018, sous l’effet d’une inflation plus forte, ils ont en moyenne vu leur salaire net stagner en euros constants ».
  • Le 20 décembre 2019, Jean-Michel Blanquer, alors ministre de l’Éducation nationale, annonce que l’on est « à la veille d’une revalorisation historique des professeurs en France ».
    Le 18 novembre 2020, vousnousils dresse le bilan : « À partir de mai 2021, les enseignants débutants toucheront donc une prime de 100 euros nets par mois, et cette dernière sera dégressive sur les 15 premières années de carrière. De ce fait, les deux tiers des professeurs seront écartés de cette mesure, et ceux ayant entre 11 et 15 ans d’ancienneté ne toucheront que 36 euros nets de plus par mois ».
  • En juin 2022, Stanislas Guérini, ministre de la Transformation et de la Fonction publiques, annonce « La plus forte augmentation [NDLR : du point d’indice] depuis 1985, soit 37 ans ».
    Il omet bien entendu de mentionner que cette augmentation de 3,5% a été précédée d’une stagnation non moins historique : 5 ans et 5 mois sans augmentation pendant lesquels l’indice des prix à la consommation a augmenté, lui, de 11,9%.
  • En septembre 2022, Pap Ndiaye, le ministre de l’Éducation nationale promet une « revalorisation historique » et annonce une hausse de la rémunération de « 10% en moyenne » en 2023 dans un contexte où l’inflation dépasse 6% par an.
    Il annonce également que les professeurs qui accepteront des tâches supplémentaires pourront voir leur rémunération augmenter « jusqu’à 25% » dans certains cas particuliers. Si le ministère du travail s’empare de cette idée, nul doute qu’un retour aux 39 heures sera proposé aux salariés afin de maintenir leur pouvoir d’achat.

Le schéma semble désormais bien établi : des années de discussions et d’annonces grandiloquentes pour, au final, accoucher de mesurettes qui échouent ne serait-ce qu’à compenser l’augmentation du coût de la vie.
On peut constater dans le tableau suivant que la valeur du point d’indice a suivi d’assez près l’inflation (indice des prix à la consommation) jusque dans les années 1990, ce qui n’est plus le cas depuis.

DécennieNombre de revalorisations du point d’indicePourcentage de revalorisation du point d’indicePourcentage d’augmentation de l’indice des prix à la consommation
1970-197954171%140,6%
1980-19893284,6%95%
1990-19991918,8%19,2%
2000-2009158,5%18,5%
2010-201931,7%12%
2020-2022 (incomplète)13,4%8,7%
Évolutions comparées du point d’indice et de l’indice des prix à la consommation

Il est important de noter que ce décrochage n’est pas un phénomène général.
Entre 1990 et 2022, le SMIC mensuel brut a augmenté de 118%, et le salaire médian net du secteur privé a augmenté de 133% entre 1990 et 2020, ce qui compense plus que largement l’inflation – l’indice des prix à la consommation ayant augmenté respectivement de 71% et de 58% sur chacun de ces deux intervalles de temps.
Nous évoquions déjà ce phénomène l’an dernier.

Au sein de la fonction publique, certains corps ont vu le blocage du point d’indice compensé en partie par une revalorisation des grilles ou des primes, ce qui n’a été le cas qu’à la marge pour les enseignants.
Cette revalorisation au cas par cas entraîne une perte de lisibilité globale des salaires de la fonction publique : à une augmentation régulière du point d’indice – permettant à tous les salaires de la fonction publique de suivre l’augmentation du coût de la vie – a succédé une série d’augmentations fragmentaires, aboutissant à une décorrélation des salaires des différents corps de la fonction publique ; certains décrochant plus violemment que d’autres.

En utilisant le générateur de graphiques de notre Observatoire des salaires des enseignants de l’Éducation nationale, nous pouvons constater qu’entre 1990 et 2022 le pouvoir d’achat :
– a baissé de 8% pour les certifiés débutants,
– a baissé de 12 à 23% pour les certifiés ayant 12 ans d’ancienneté,
– a baissé de 17% pour les certifiés ayant 32 ans de carrière (et potentiellement de seulement 2% pour les rares élus à la nouvelle classe exceptionnelle).

Évolution du pouvoir d’achat des professeurs certifiés depuis 1990

Comme nous l’avons mentionné plus haut, le pouvoir d’achat des salariés du privé a, dans l’ensemble, augmenté. Il est donc intéressant de voir où se situe le salaire des enseignants par rapport à la distribution des salaires du privé.
On constate alors qu’un certifié ayant 32 ans de carrière en 2020 se trouve à la même place qu’un certifié ayant 12 ans de carrière en 1990 ; et qu’un certifié ayant 12 ans de carrière en 2020 se trouve à la même place qu’un enseignant débutant en 1990.
Si cette tendance venait à perdurer encore 30 ans, un enseignant en fin de carrière dans les années 2050 se trouverait à la même place dans l’échelle salariale qu’un enseignant débutant en 1990.

Évolution de la place dans l’échelle salariale des professeurs certifiés depuis 1990

Cette tendance de long terme conduit parfois à des situations individuelles ubuesques : un certifié, qui débutait en 2013 au-dessus du salaire médian (50% sur l’axe des ordonnées du graphique suivant), a pu voir son salaire passer en-dessous du salaire médian après 7 ou 8 ans d’ancienneté.

Évolution d’un certifié ayant débuté en 2013 par rapport à la distribution des salaires du secteur privé

Force est de constater que la réalité des chiffres ne s’accorde malheureusement pas aux superlatifs des discours. Nos décisionnaires utilisent la même rhétorique que les climato-sceptiques : présenter avec insistance les quelques moments où la météo est clémente pour mieux occulter le fait que l’évolution du climat est néfaste et que rien de conséquent et véritablement efficace n’est fait pour infléchir la tendance.
Ce déclassement salarial des enseignants est probablement une des causes majeures de la pénurie de candidats. Faire perdurer une telle situation ne peut qu’aboutir à des conséquences délétères de long terme : manque d’enseignants dans les classes, recrutement de personnes ayant un niveau de plus en plus faible, augmentation du turnover et perte d’enseignants expérimentés.
Ce sont les élèves qui, in fine, vont payer – et payent déjà – le prix fort de ces politiques.

Évolutions comparées des salaires des enseignants français et de l’OCDE

Afin d’approfondir la comparaison entres les salaires des enseignants de France et du reste de l’OCDE esquissée dans cet article, voici quatre graphiques concernant respectivement les enseignants :
– du deuxième cycle du secondaire ;
– du premier cycle du secondaire ;
– du primaire ;
– de l’éducation de la petite enfance.

Sont représentés sur chacun d’entre eux le salaire brut des enseignants français (ligne rouge) ainsi que les salaires bruts médian (ligne bleue) et moyen (pointillés bleus) de la sélection de pays de l’OCDE pour lesquels les données sont disponibles sur l’intégralité de l’historique depuis l’an 2000 [1].
Sont indiqués en bleu clair, à titre indicatif, les salaires bruts de l’ensemble des pays de l’OCDE (cela inclut des pays pour lesquels les données de certaines années sont manquantes, ce qui rend les comparaisons au fil du temps moins pertinentes).
Dans ce qui suit, les termes médiane et moyenne de l’OCDE correspondront aux courbes bleues foncées (calculées uniquement avec les pays ayant des données pour chaque année).

On peut constater qu’à l’inverse des médiane et moyenne de l’OCDE, le salaire des enseignants français a globalement diminué depuis l’an 2000.
Excepté pour les enseignants de la petite enfance, le salaire des enseignants français, qui était au-dessus de la médiane et de la moyenne de l’OCDE en 2000, est passé avant 2005 en-dessous de ces valeurs, dénotant un déclassement par rapport aux autres pays.

Si les salaires des enseignants du deuxième cycle de secondaire avaient évolué de la même manière que la médiane de l’OCDE, ceux-ci seraient supérieurs de 14,2% à leur valeur actuelle ; et de 17,6% s’ils avaient évolués comme la moyenne de l’OCDE.

Si les salaires des enseignants du premier cycle de secondaire avaient évolué de la même manière que la médiane de l’OCDE, ceux-ci seraient supérieurs de 14,4% à leur valeur actuelle ; et de 21,4% s’ils avaient évolués comme la moyenne de l’OCDE.

Si les salaires des enseignants du primaire avaient évolué de la même manière que la médiane de l’OCDE, ceux-ci seraient supérieurs de 17,4% à leur valeur actuelle ; et de 21,7% s’ils avaient évolués comme la moyenne de l’OCDE.

Si les salaires des enseignants de la petite enfance avaient évolué de la même manière que la médiane de l’OCDE, ceux-ci seraient supérieurs de 30,9% à leur valeur actuelle ; et de 24,7% s’ils avaient évolués comme la moyenne de l’OCDE.
Il semblerait que l’on observe ici une combinaison du déclassement des enseignants français couplé à une forte revalorisation dans le reste de l’OCDE.

Sources :
Données brutes OCDE
Données reformatées issues de ces données brutes

[1] Pays dont les données sont disponibles sur tout l’intervalle de temps, et formant la sélection retenue dans les graphiques correspondants :

  • 2ème cycle du secondaire : Autriche, Danemark, Finlande, France, Grèce, Hongrie, Irlande, Israël, Italie, Japon, Slovénie, Turquie, USA
  • 1er cycle du secondaire : Autriche, Danemark, Finlande, France, Grèce, Hongrie, Irlande, Israël, Italie, Japon, Mexique, Slovénie, Turquie, USA
  • primaire : Autriche, Danemark, Finlande, France, Grèce, Hongrie, Irlande, Israël, Italie, Japon, Mexique, Slovénie, Turquie, USA
  • petite enfance : Danemark, Finlande, France, Grèce, Hongrie, Israël, Mexique, Turquie

Graphiques interactifs : évolution des salaires dans l’Éducation nationale

La page suivante vous propose quatre outils interactifs permettant de suivre le pouvoir d’achat des enseignants ainsi que leur place par rapport à la distribution des salaires dans le secteur privé.

Déclassement des salaires : pourquoi il serait raisonnable d’augmenter les enseignants d’au moins 20% sans contrepartie

[MAJ du 16/12/2021]

La pétition dont il est question à la fin de cet article a été classée de manière prématurée hier par le président de la commission éducation de l’Assemblée Nationale : https://twitter.com/stylos_les/status/1471363208678154245
Il n’est donc plus possible de la signer, alors que son expiration devait initialement intervenir en juin 2022.

[Fin de la MAJ]

Ces derniers temps, certains articles de presse parlent de la revalorisation des retraites complémentaires Agirc-Arrco, qui est inférieure à l’inflation depuis quelques années. Ceci entraîne donc une perte de pouvoir d’achat pour les retraités.
Or, cela fait au moins 20 ans que les enseignants français se trouvent dans cette situation : 20 ans de salaires qui augmentent moins vite que l’inflation, 20 ans de perte de pouvoir d’achat.
On observe un véritable décrochage des traitements de la fonction publique par rapport au coût de la vie. Et ce décrochage est encore pire si on le compare aux salaires du secteur privé.
Cet article se focalise sur le traitement des fonctionnaires de catégorie A, dont font partie les enseignants, mais un constat similaire peut être fait en ce qui concerne les fonctionnaires des autres catégories.

Depuis début 2001, le SMIC horaire brut a augmenté de 63% et le salaire net médian équivalent temps plein du secteur privé de 46,5% (donnée de 2019, les données plus récentes n’étant pas encore disponibles).
Pendant ce temps, l’indice des prix à la consommation a progressé de 37,9%. Les salaires ayant augmenté plus rapidement que les prix, le pouvoir d’achat des employés du secteur privé a augmenté dans le temps.
Pendant la même période, les traitements de la fonction publique ont progressé moins rapidement que les prix, entraînant une perte de pouvoir d’achat. L’indice de traitement net de la catégorie A n’a augmenté en effet que de 10,3%.

L’indice de traitement net pour la catégorie A de la fonction publique est un indice calculé par l’INSEE dont l’évolution est similaire au traitement net de l’ensemble des fonctionnaires de cette catégorie. Cet indicateur ne prend pas en compte les primes, dont le montant est de toute manière assez faible dans l’Éducation Nationale, et dont les revalorisations, à l’instar de celles de l’ISOE, se font très rares et peu généreuses, mais il tient compte à la fois des revalorisations du point d’indice et des changements dans le nombre de points d’indice majoré (qu’il s’agisse des changements individuels dus à l’avancement de carrière ou bien des changements collectifs dus à des réformes). L’INSEE fournit une fiche méthodologique expliquant le mode de calcul de cet indice de traitement net.

Il faudrait que le traitement net des enseignants augmente de 25 % pour compenser le retard accumulé en terme de pouvoir d’achat (de manière à rattraper l’indice des prix à la consommation).
D’après un rapport déposé récemment au Sénat par Gérard Longuet, les enseignants ont perdu entre 15 et 25% de pouvoir d’achat en 20 ans. Pour compenser cette diminution, une hausse de 17,5 à 33% serait nécessaire. Le chiffre de 25% ci-dessus se trouve ainsi dans cette fourchette, ce qui semble cohérent.

Afin de garantir la même progression du pouvoir d’achat que pour le salaire net médian des salariés du secteur privé, cette augmentation devrait même être de 33 %.



On remarque cette tendance également dans les données de l’OCDE, les salaires des enseignants ayant baissé en France alors qu’ils ont en moyenne augmenté dans les autres pays. L’augmentation que l’on note en 2020 sur le graphique ci-dessous semble coïncider avec l’introduction de nouvelles heures supplémentaires que les enseignants ne peuvent refuser, et ne traduit donc pas une augmentation à quantité de travail constante.
Le café pédagogique note, en se basant également sur les données de l’OCDE, que les enseignants français effectuent en moyenne plus d’heures de cours tout en étant moins bien rémunérés que la moyenne des autres pays : « Sur 33 systèmes éducatifs étudiés par l’OCDE, la France est au 22ème rang pour le coût salarial de ses enseignants. Aucun grand pays développé ne dépense aussi peu pour ses enseignants. »

Jean-Michel Blanquer a récemment augmenté le salaire des jeunes enseignants en introduisant une nouvelle prime. Cela représente une augmentation d’environ 6% pour les professeurs certifiés en tout début de carrière, mais ce pourcentage diminue très rapidement dès les première années d’ancienneté. C’est un premier geste, cependant il ne concerne qu’une minorité d’enseignants, la plupart d’entre eux ne bénéficiant que d’une prime d’équipement informatique de 150€ par an.
Jusqu’à présent on est donc loin de rattraper le retard accumulé en 20 ans.

Ce déclassement salarial des enseignants français n’est pas compatible avec l’importance du service public d’éducation, et ce sont, in fine, les élèves eux-mêmes qui pâtissent de cette politique de sape.
Rémunérer les enseignants à leur juste valeur permettra de rendre le métier de nouveau attractif et de mettre fin à la crise des vocations qui fait que depuis de nombreuses années les concours ne font plus le plein, laissant toujours plus de postes non pourvus.
De la qualité de la rémunération découlera la qualité du recrutement, dont découlera à son tour la qualité de l’enseignement.

La pétition suivante demande à l’Assemblée Nationale l’examen d’une augmentation de 20% du salaire des enseignants :
https://petitions.assemblee-nationale.fr/initiatives/i-282 .
Au vu des données de ces vingt dernières années, cette demande est on ne peut plus raisonnable.
Un débat en séance publique aura lieu sur cette pétition si un minimum de 500 000 signatures est atteint. La France comptant environ 870 000 enseignants, cet objectif est donc parfaitement atteignable si l’on parvient à faire connaître cette pétition, ainsi que son bien fondé, au plus grand nombre.

QR code vers la pétition

Données brutes :
SMIC horaire
Salaires du secteur privé jusqu’à 2018 et en 2019
Indice des prix à la consommation
Indice de traitement net de la catégorie A de la fonction publique
Salaires des enseignants de l’OCDE

Comment créer une intégrale nulle à partir de n’importe quelle fonction

Pour tout k\in\mathbb{R}^*_+ et toute fonction f continue sur R_+^*, on a :

(1)   \begin{equation*}\int_{\frac{1}{k}}^{k} f\left(x+\frac{1}{x}\right)\frac{\ln(x)}{x}\,dx = 0}\end{equation*}

Idée de preuve : distinguer l’intégrale de 1 à k et l’intégrale de 1/k à 1. On peut alors montrer que cette dernière est l’opposé de la première via le changement de variable y = 1/x (ou bien on peut montrer que cette intégrale est son propre opposé via le même changement de variable).

Courbes du coronavirus : MAJ avec les données du 25/04/2021

Au niveau national les nombres de cas et de nouvelles hospitalisations sont en baisse (à un rythme plus lent que lors du précédent confinement, ce qui pourrait s’expliquer par le fait que le variant B.1.1.7, dit « anglais », soit prédominant). Les nouvelles réanimations sont stables et les nouveaux décès en hausse par rapport à la semaine dernière.

Quand à la situation dans le Puy-de-Dôme, elle semble stable, avec toutefois un niveau de nouvelles réanimations se trouvant dans la fourchette haute de ces derniers mois.

Courbes journalières pour la France :

Courbes hebdomadaires pour la France :

Courbes hebdomadaires pour le Puy-de-Dôme :

Courbes du coronavirus : MAJ avec les données du 11/04/2021

Les effets du confinement des premiers départements semblent se manifester. Au niveau national, tous les indicateurs s’orientent à la baisse. Au niveau du Puy-de-Dôme, seuls les décès continuent à la hausse.

Courbes journalières pour la France :

Courbes hebdomadaires pour la France :

Courbes hebdomadaires pour le Puy-de-Dôme :