Nous sommes le Mer 23 Juil, 2025 07:41
Supprimer les cookies

aide par rapport à SAS et SPSS

Sur le logiciel libre en général ou un logiciel libre en particulier

Mer 22 Fév, 2006 17:17

Salut à tout le monde,
je suis nouveau sur ce forum et je tiens tout d'abord à féliciter ceux qui en sont à l'initiative

j'ai déjà une petite question: je travaille actuellement avec SPSS sur une base de données qui date de 10 ans et qui fut à l'époque traitée avec SAS.
Comme la base a été transférée sous SPSS par un assez long cheminement (base ancienne donc pas de transfert quasi automatique comme on peut le faire aujourd'hui), je vérifie la cohérence des données à l'aide de sorties réalisées à l'époque sous SAS.
Tout semble ok à quelques petits détails près (et j'en viens à ma question): pour certaines variables la moyenne est strictement la même mais l'écart type est différent! j'avoue que ça dépasse mes compétences

une autre chose curieuse: les sorties sous SAS ne sont pas cohérentes au niveau des effectifs, ceux-ci sont différents au sein d'une série d'exploitations qui devraient au contraire affichés le même N, et également différents de ceux affichés par SPSS. Ceci pourrait bien sûr expliquer les différences au niveau de l'écart type, mais dans ce cas comment expliquer que l'on trouve malgré tout, avec des effectifs différents, strictement les mêmes moyennes (à la quatrième décimale après la virgule près) ?

est ce que ça peut être dû à des différences dans l'algorithme des deux logiciels? est ce que quelqu'un a déjà rencontré des problèmes similaires?

Merci d'avance
philemon

Messages : 2

Mer 22 Fév, 2006 17:26

Pour plus d'aides sur SAS et SPSS, jette un oeil ici :wink:

Blague à part, je ne pense pas que tu sois sur le bon forum pour ce genre de questions ! Et les algorithmes de calcul de moyenne et de variance sous SAS et SPSS sont certainement les mêmes. Je n'ai en tout cas jamais eu de différences sur l'estimation de paramètres aussi basiques (mais mon expérience reste limitée). Ton problème peut effectivement provenir des effectifs.

Maps


EDIT : ok, Framasoft pour FRAnçais MAthématiques SOFTwares... Bon ça peut coller quand même... :)
Maps

Avatar de l’utilisateur
Messages : 1691
Géo : Québec

Mer 22 Fév, 2006 19:02

Tout d'abord bienvenue sur les forums de framasoft!

Comme Maps disait, tu n'as peut-être pas frappé à la bonne porte pour ton problème. Je ne sais pas d'où peut venir ton problème, mais voici quelques pistes:

* Il y a peut-être eu un petit accident lors de la conversion. Tu utilises une base de données ancienne et en plus tu dis que le cheminement était long ...

* Est-ce que les commandes que tu utilises aujourd'hui sous SPSS correspondent exactement à celles utilisées sous SAS à l'époque. Je pense par exemple à une petite clause "if" ou "where" qui a pu s'incruster d'un côté ou de l'autre.

* Est-ce que les formules pour le calcul des variances sont identiques. On peut retrouver deux formules différentes: celle qui a comme dénominateur N (nombre d'effectifs) et celle avec N-1.

* Quand tu dis que les écarts types sont différents, est-ce que cette différence est grande?

* Est-ce que tu es sûr de ne pas comparer des poires et des pommes: p.ex. l'écart de la série dans un cas et l'écart type de la moyenne dans l'autre cas?

Sinon en cas de doute, tu peux toujours faire appel au libre arbitre, et voir ce qu'il te dit. Et puis c'est vraiment une bonne occasion pour découvrir un superbe logiciel de stats ;-)
hjs

Messages : 532

Jeu 23 Fév, 2006 15:30

merci pour ces suggestions!

pour répondre à hjs, je ne suis pas sûr que le problème vienne de la conversion, pour prendre un exemple concret: j'ai une variable qui donne le nombre d'années passées à étudier l'anglais à l'école. avec un simple tri à plat, les effectifs pour chaque modalité (de 1 à 9 ans) sont strictement les mêmes; la durée moyenne d'étude est donc logiquement la même, seul l'écart-type diffère.

pour ce qui est de la piste des instructions sas et spss, j'ai la chance de disposer des prog sas de l'époque, et le problème ne vient pas de là (j'ai bien mis exactement les mêmes restrictions au niveau de la population). Enfin, la différence entre les deux écarts types me semble assez grande: pour la variable citée plus haut (qui a comme moyenne 4.55), spss me donne un écart type de 2.145 et sas de 2.695!

je pense qu'effectivement les formules doivent être différentes, c'est ce que m'a indiqué un chargé d'études stats à qui j'ai posé également la question, mais que ça puisse un tel écart me surprend un peu.

un autre petit exemple pour faire mieux comprendre peut être ma situation. j'ai le même problème avec des dummy variables (1 si une condition x est réunie, 0 sinon): même moyenne mais pas même écart type et les effectifs sont là aussi différents (avec pourtant les mêmes conditions de restriction de la population). Dans ce cas de figure, il me semble que quelques soient les effectifs, l'écart type, s'il était calculé de la même façon sur les deux logiciels, devrait être le même: si la moyenne est la même, cela veut dire, pour ce genre de variable, qu'on a la même proportion d'individus qui réunissent la condition et toujours la même pour ceux qui ne la réunissent pas. A partir de là, la moyenne des écarts au carré et sa racine devraient être les même, est ce que je me trompe?
philemon

Messages : 2

Jeu 23 Fév, 2006 16:00

Tu devrais essayer de calculer l'écart-type toi-même, étape par étape. Cela te permettra peut-être de mieux comprendre les différences.

Une autre piste à explorer c'est peut-être la façon dont les deux logiciels gèrent les valeurs manquantes ...

Et n'oublie pas de vérifier à l'aide d'un autre logiciel.
hjs

Messages : 532

Qui est en ligne ?

Utilisateur(s) parcourant actuellement ce forum : Aucun utilisateur inscrit