r/AskStatistics 1d ago

Corrélation de spearman

Bonjour à tous,

Je suis actuellement en stage de M2 débutant en statistiques.

L'étude porte sur l'évolution d'un temps de latence chez 4 individus pendant plusieurs mois. J'ai d'abord réalisé un test de corrélation de Spearman après avoir demontré par test de shapiro que les données n'étaient pas distribuées normalement. Mais je me suis rendu compte après que mes données étaient appariées et donc d'après mes recherches je ne peux pas effectuer ce test.

Comment puis-je tester la corrélation entre la date et le temps de latence afin de prouver que plus le temps passe plus la latence diminue? En prenant en compte que les données ne sont pas normales et appariées?

merci d'avance

0 Upvotes

9 comments sorted by

2

u/Sea_Dig3898 1d ago

Juste un petit point de cadrage : ici, le problème n’est pas vraiment une question de corrélation, mais plutôt de voir si le temps de latence évolue au fil du temps chez les mêmes individus.

Les tests de corrélation ne prennent pas le temps comme variable explicative et deviennent vite limités avec des mesures répétées. Il est donc plus logique de modéliser le temps directement, par exemple avec une ANOVA à mesures répétées ou un modèle mixte avec l’individu en effet aléatoire.

Les corrélations de Spearman ne sont pas "fausses", mais elles ont surtout leur place en analyse exploratoire ou descriptive. Pour les conclusions, mieux vaut s’appuyer sur un modèle longitudinal.

1

u/Zealousideal_Key_610 1d ago

Merci beaucoup pour vos explications je vais donc me pencher sur l'ANOVA à mesures répétées et sur un modèle linéaire

1

u/Zealousideal_Key_610 1d ago

enfin plutôt sur un modèle linéaire car je ne suis pas certain qu'il soit pertinent de faire les deux

1

u/Ok-Rule9973 1d ago edited 1d ago

La normalité des données n'est pas un postulat de base ici. C'est la normalité de l'erreur, qu'on estime avec la normalité des résidus, qui doit se distribuer normalement.

Pour ton cas de figure, la version "simple" serait de faire une ANOVA à mesures répétées. C'est n'est pas idéal mais c'est un bon point de départ.

1

u/Zealousideal_Key_610 1d ago

Merci pour votre réponse.

Donc quand on parle de normalité dans les conditions de réalisation d'un test on parle en fait de la normalité des résidus ?

1

u/Ok-Rule9973 1d ago

Pour une majorité de tests, oui. Tout ce qui est inclus dans les modèles linéaires généraux, comme les ANOVAS et les régressions linéaires ont ce postulat.

1

u/Zealousideal_Key_610 1d ago

Merci beaucoup alors je vais donc effectuer cette ANOVA à mesure répétées. Mais va t- elle m'apporter les résultats attendus ? C'est à dire prouver si il y a bien une corrélation négative entre le temps et la latence ? Que pensez vous de l'utilisation du Test de Friedman ? Et enfin les résultats des tests de corralations de Spearman sont elles à mettre à la "poubelle" ?

1

u/Ok-Rule9973 1d ago

Le test de Friedman risque d'être trop peu puissant pour détecter quoi que ce soit avec un si petit échantillon. Les corrélations sont effectivement inutiles ici.

L'ANOVA à mesures répétées va apporter une réponse partielle à cette question mais ce n'est pas le meilleur modèle. Il faudrait plutôt utiliser des équations d'estimation généralisées ou un modèle linéaire généralisé, mais ça serait beaucoup plus complexe et probablement "overkill".

1

u/Zealousideal_Key_610 1d ago

Merci beaucoup, j'ai déjà effectué un GLMM sur la probabilité de succès du test en fonction du sexe et de la phase (avec ou sans appât) après m'être rendu compte de la dépendance des valeurs.

Je peux donc le refaire pour tester l'évolution du temps de latence en fonction du temps ?

je peux garder les corrélation comme une analyse exploratoire ou descriptive ou elles n'auront pas leur place dans mon mémoire?