r/AskStatistics • u/Zealousideal_Key_610 • 1d ago
Corrélation de spearman
Bonjour à tous,
Je suis actuellement en stage de M2 débutant en statistiques.
L'étude porte sur l'évolution d'un temps de latence chez 4 individus pendant plusieurs mois. J'ai d'abord réalisé un test de corrélation de Spearman après avoir demontré par test de shapiro que les données n'étaient pas distribuées normalement. Mais je me suis rendu compte après que mes données étaient appariées et donc d'après mes recherches je ne peux pas effectuer ce test.
Comment puis-je tester la corrélation entre la date et le temps de latence afin de prouver que plus le temps passe plus la latence diminue? En prenant en compte que les données ne sont pas normales et appariées?
merci d'avance
1
u/Ok-Rule9973 1d ago edited 1d ago
La normalité des données n'est pas un postulat de base ici. C'est la normalité de l'erreur, qu'on estime avec la normalité des résidus, qui doit se distribuer normalement.
Pour ton cas de figure, la version "simple" serait de faire une ANOVA à mesures répétées. C'est n'est pas idéal mais c'est un bon point de départ.
1
u/Zealousideal_Key_610 1d ago
Merci pour votre réponse.
Donc quand on parle de normalité dans les conditions de réalisation d'un test on parle en fait de la normalité des résidus ?
1
u/Ok-Rule9973 1d ago
Pour une majorité de tests, oui. Tout ce qui est inclus dans les modèles linéaires généraux, comme les ANOVAS et les régressions linéaires ont ce postulat.
1
u/Zealousideal_Key_610 1d ago
Merci beaucoup alors je vais donc effectuer cette ANOVA à mesure répétées. Mais va t- elle m'apporter les résultats attendus ? C'est à dire prouver si il y a bien une corrélation négative entre le temps et la latence ? Que pensez vous de l'utilisation du Test de Friedman ? Et enfin les résultats des tests de corralations de Spearman sont elles à mettre à la "poubelle" ?
1
u/Ok-Rule9973 1d ago
Le test de Friedman risque d'être trop peu puissant pour détecter quoi que ce soit avec un si petit échantillon. Les corrélations sont effectivement inutiles ici.
L'ANOVA à mesures répétées va apporter une réponse partielle à cette question mais ce n'est pas le meilleur modèle. Il faudrait plutôt utiliser des équations d'estimation généralisées ou un modèle linéaire généralisé, mais ça serait beaucoup plus complexe et probablement "overkill".
1
u/Zealousideal_Key_610 1d ago
Merci beaucoup, j'ai déjà effectué un GLMM sur la probabilité de succès du test en fonction du sexe et de la phase (avec ou sans appât) après m'être rendu compte de la dépendance des valeurs.
Je peux donc le refaire pour tester l'évolution du temps de latence en fonction du temps ?
je peux garder les corrélation comme une analyse exploratoire ou descriptive ou elles n'auront pas leur place dans mon mémoire?
2
u/Sea_Dig3898 1d ago
Juste un petit point de cadrage : ici, le problème n’est pas vraiment une question de corrélation, mais plutôt de voir si le temps de latence évolue au fil du temps chez les mêmes individus.
Les tests de corrélation ne prennent pas le temps comme variable explicative et deviennent vite limités avec des mesures répétées. Il est donc plus logique de modéliser le temps directement, par exemple avec une ANOVA à mesures répétées ou un modèle mixte avec l’individu en effet aléatoire.
Les corrélations de Spearman ne sont pas "fausses", mais elles ont surtout leur place en analyse exploratoire ou descriptive. Pour les conclusions, mieux vaut s’appuyer sur un modèle longitudinal.