Suite du billet précédent sur les mesure d'efforts au Datafficheur avec une charrue mono-soc et une charrue bi-soc...

Je vous avais parlé du développement d'un programme en python (DataGraph Hippotese) qui permet de traiter les données brutes issues du Datafficheur, pour créer un fichier CSV utilisable dans un tableur mais aussi pour tracer automatiquement la courbe d'efforts et maintenant la courbe de fréquence d'apparition d'une valeur d'effort.

Je vous montre les 2 types de graphique que réalise le programme DataGraph-V1-Hippotese pour les 2 charrues vues au précédent billet.

Charrue monosoc :


(Courbe des valeurs des mesures d'efforts au Datafficheur avec la charrue mono-soc White-Horse 715, à partir du programme "DataGraph-V1-Hippotese" en Python)


(Courbe de fréquence d'apparition d'une valeur d'efforts au Datafficheur avec la charrue mono-soc White-Horse 715, à partir du programme "DataGraph-V1-Hippotese" en Python)

On voit bien sur cette seconde courbe que l'on a supprimé les valeurs d'efforts inférieures à 100 kgf (en considérant que dans ces cas, la charrue ne travaille pas).

Il nous reste donc les valeurs supérieures à 100 kgf, on dessine la courbe de fréquence d'apparition de ces valeurs qui a la forme d'une courbe normale (qui est une courbe de gauss particulière).

L'intérêt de cette représentation est que l'on peut calculer facilement la moyenne des efforts (quand la charrue travaille) ici : 739 kgf

On peut aussi calculer l'écart-type (mesure de la dispersion des valeurs d'un échantillon statistique). On sait que les valeurs comprises entre - l'écart-type et + l'écart-type représentent près de 70 % des valeurs de la courbe, ici de 565 à 913 kgf


(Représentation graphique de la fonction de densité d'une loi normale. Chaque bande colorée a la largeur d'un écart-type. Image Wikipédia)

On peut noter que les valeurs comprise entre - 2 x l'écart-type et + 2 x l'écart type englobent 95 % des valeurs... Non représenté sur nos courbes, peut-être à ajouter...

Charrue bi-soc :


(Courbe des valeurs des mesures d'efforts au Datafficheur avec la charrue bi-soc, à partir du programme "DataGraph-V1-Hippotese" en Python)


(Courbe de fréquence d'apparition d'une valeur d'efforts au Datafficheur avec la charrue bi-soc, à partir du programme "DataGraph-V1-Hippotese" en Python)

On voit bien sur cette seconde courbe que l'on a aussi supprimé les valeurs d'efforts inférieures à 100 kgf (en considérant que dans ces cas, la charrue ne travaille pas).

Il nous reste donc les valeurs supérieures à 100 kgf, on dessine la courbe de fréquence d'apparition de ces valeurs qui a la forme d'une courbe normale (qui est une courbe de gauss particulière).

On peut calculer facilement la moyenne des efforts (quand la charrue travaille) ici : 543 kgf (près de 200 kgf de moins que la précédente)

On peut aussi calculer l'écart-type (mesure de la dispersion des valeurs d'un échantillon statistique). On sait que les valeurs comprises entre - l'écart-type et + l'écart-type représentent près de 70 % des valeurs de la courbe, ici de 440 à 647 kgf.

Conclusion :

En conclusion, ces courbes de fréquence d'apparition des valeurs d'efforts et les infos associées nous permettent de caractériser un outil et un terrain dans lequel il est employé.
Elles n'ont cependant de valeur que quand le travail est régulier (en labour, en maraîchage mais sans doute pas en débardage).

A condition que le résultat du travail effectué soit de qualité équivalente, dans un terrain régulier et des conditions climato-pédologiques stables, on peut utiliser ces courbes pour comparer 2 outils.
Nota : Ici le terrain est identique ainsi que les conditions mais pas forcément le résultat du travail (on a pas vérifié la qualité du labour, ni sa largeur, ni sa profondeur) mais cela donne quand même des indications précieuses qui ne sont pas forcément très lisibles sur les courbes d'efforts simples.

Je vous met en téléchargement les 2 courbes de fréquence d'apparition d'une valeur d'efforts (en pdf). Courbe 1 et courbe 2.


Notes pour les spécialistes (de la part des programmeurs qui travaillent sur le programme "DataGraph-V1-Hippotese" en Python) :

Note density :
L'option density dans la fonction hist de matplotlib change l'axe des y de l'histogramme pour afficher une estimation de la densité de probabilité au lieu du nombre de données dans chaque bin.

Lorsque density=True, les valeurs de l'histogramme sont normalisées de telle manière que l'aire sous l'histogramme (c'est-à-dire l'intégrale de la densité de probabilité sur toute la plage de données) est égale à 1.

Cela signifie que chaque barre de l'histogramme n'affiche plus le nombre d'observations dans chaque bin, mais plutôt l'estimation de la densité de probabilité que la valeur aléatoire tombe dans ce bin.

Cela permet de comparer des histogrammes de différents ensembles de données qui peuvent avoir des nombres d'échantillons différents. Il est également utile pour comparer avec une distribution de probabilité théorique ou pour ajuster une courbe à l'histogramme.

Note KDE :
KDE signifie Kernel Density Estimation (Estimation de la densité par noyaux). C'est une technique qui permet d'estimer la fonction de densité de probabilité (PDF) d'une variable aléatoire.
En termes simples, elle permet de lisser un histogramme.

Lorsque vous créez un histogramme pour représenter la distribution de vos données, le nombre de "bins" (c'est-à-dire les barres de l'histogramme) et leur largeur peuvent avoir un impact important sur l'apparence de l'histogramme. Deux personnes peuvent interpréter différemment les données en fonction de la façon dont elles choisissent de "biner" ces données.
C'est un des problèmes majeurs des histogrammes.

L'estimation de densité par noyaux est une technique qui permet de "lisser" un histogramme.
Au lieu de "biner" les données, elle utilise une "fonction de noyau" (d'où le nom "Kernel Density Estimation") pour créer une courbe lisse qui s'adapte aux données.
Cette courbe peut alors être utilisée pour estimer la densité de probabilité à n'importe quel point.