Les annales sont enfin arrivées
! Vous pouvez posez vos questions dans ce sujet et proposer vos erratas (après avoir vérifié qu'il ne se trouve pas dans la liste ci dessous !).
>
PSA 2006
Q.6.1: BE et non A (d'après la correction des annales du site de la fac :
http://www.chups.jussieu.fr/polys/biostats/exos/ )
nA = 6, nB=8
2,6 > 2,014 = M5% => rejet de H0
2,6 > 2,530 = M1% : p<0,01
Q.7.2 : BD et non BDE (d'après la correction des annales du site de la fac)
9,8>8,47>7,8 : K2%,2ddl < Q < K1%,2ddl : donc p<0,02
Q.9.2
calcul du coeff de corrélation :
\(X_0\) la concentration d'albumine avant traitement,
\(X_1\) après traitement et
\(D=X_0-X_1\) la variation avant-après.
\(Var(D)=Var(X_0)+Var(X_1)-2Cov(X_0,X_1)\)\(\Leftrightarrow Cov(X_0,X_1)=\frac {Var(X_0)+Var(X_1)-Var(D)}{2}\)
\(\rho (X_0,X_1)=\frac {Cov(X_0,X_1)}{\sigma _{0}\sigma _{1}}=\frac {\sigma _{0}^{2}+\sigma _{1}^{2}-\sigma _{D}^{2}}{2\sigma _{0}\sigma _{1}}\)
et si on reprend tout avec les valeurs observées :
\(r=\frac {s^{2}_{0}+s^{2}_{1}-s^{2}_{D}}{2s_{0}s_{1}}=\frac {4^2+3^2-3,2^2}{2\times 4\times 3}=0,615\) (réponse C)
>
PSA 2007
Q.8 Réponse E et non BCE
Q.14 Il doit manquer quelque chose dans l'énoncé du style :
p(0<S<200)=0,3
p(200<S<600)=0,5
p(600<S<1000)=0,2
>
Nouméa 2007
Q.5
Q5.9 la correction est archi fausse, attention !
Les données de l'énoncé sont :
\(p(M)=0,10; p(E1)=0,50;p(M/E1)=0,19;p(E2/M)=0,90;p(\overline {E2}/\overline {M})=0,80; p(E1\cap E2)=0,25\)\(;p(M\cap E1\cap E2)=0,085\)
et on a calculé que
\(p(E1/M)=0,95;p(\overline {E1}/\overline {M})=0,55\)
\(Se=p((E1\cap E2)/M)=\frac {p(E1\cap E2\cap M)}{p(M)}=\frac {0,085}{0,10}=0,85\)
Q5.9 et 5.10 ça n'a pas de sens d'écrire p(A/((B/C)) !
Q5.10 pour le
calcul de l'espérance du cout, il faut prendre en compte les probabilités (notées
\(p_1,p_2,...p_n\)) de chacune des issues possibles, et leurs couts respectifs (notés
\(x_1,x_2,...x_n\):
-le premier test est négatif (on ne traite pas) et la personne est malade :
\(p_1=p(M\cap \overline {E1})=p(\overline {E1}/M)p(M)=0,05\times 0,10=0,005\)
et
\(x_1=1+100=101\)
-le premier test est négatif (on ne traite pas) et la personne n'est pas malade :
\(p_2=p(\overline {M}\cap \overline {E1})=p(\overline {E1}/\overline {M})p(\overline {M})=0,55\times 0,90=0,495\)
et
\(x_2=1\)
-le premier test est positif puis le second est positif (on traite) et la personne est malade :
\(p_3=p(M\cap E1\cap E2)=0,085\)
et
\(x_3=1+2+5=8\)
-le premier test est positif puis le second est positif (on traite) et la personne n'est pas malade :
\(p_4=p(\overline {M}\cap E1\cap E2)=p(E1\cap E2)-p(M\cap E1\cap E2)=0,25-0,085=0,165\)
et
\(x_4=1+2+5+5=13\)
-le premier test est positif puis le second est négatif (on ne traite pas) et la personne est malade :
\(p_5=p(M\cap E1\cap \overline {E2})=p(M)-p(M\cap E1\cap E2)-p(M\cap \overline {E1})=0,10-0,085-0,005=0,01\)
et
\(x_5=1+2+100=103\)
-le premier test est positif puis le second est négatif (on ne traite pas) et la personne n'est pas malade :
\(p_6=p(\overline {M}\cap E1\cap \overline {E2})=0,24\)
et
\(x_6=1+2=3\)
L'espérance du cout est
\(E(X)=\sum _{i=1}^{6}p_ix_i\approx 5,6\)
>
PSA 2008
Q.7 calcul des moyenne et variance :
\(p(X=i)=p(X=i/A)p(A)+p(X=i/B)p(B)\)
\(p_i=0,4p_{Ai}+0,6p_{Bi}\)
>
\(E(X)=\mu =\sum {p_{i}x_{i}}=\sum {(0,4p_{Ai}+0,6p_{Bi})x_{i}}=0,4\sum {p_{Ai}x_{i}}+0,6\sum {p_{Bi}x_i}=0,4\mu _{A}+0,6\mu _{B}\)
>
\(Var(X)=\sigma ^{2}=\sum {p_{i}x_{i}^{2}}-\mu ^{2}=0,4\sum {p_{Ai}x_{i}^{2}}+0,6\sum {p_{Bi}x_{i}^{2}}-\mu ^{2}\)
or,
\(\sum {p_{Ai}x_{i}^{2}}=E(X_{A}^{2})=\sigma ^{2}_{A}+\mu _{A}^{2}=81+225=306\)
et
\(\sum {p_{Bi}x_{i}^{2}}=E(X_{B}^{2})=\sigma ^{2}_{B}+\mu _{B}^{2}=49+400=449\)
>
donc
\(Var(X)=0,4\times 306+0,6\times 449-18^{2}=67,8\) et
\(\sigma =\sqrt {67,8}\approx 8,2\)
>
Q.16 D et E fausse
\(\hat {\phi }=\frac {0,46+0,5}{2}\), donc
\(n=2446\) soit au total 4892 personnes.
>
Nouméa 2008
Q.11 Réponses ACE
>c'est un test de Mac Nemar, qui n'est pas au programme cette année apparemment, mais comme le principe de ce test est expliquer dans l'énoncé et que ce test n'est rien d'autre qu'un test de comparaison de proportion observée à valeur donné ou chi 2 camouflé, l'exercice n'est pas forcément hors programme. Le principe est le suivant : on le fait quand on a des paires, par exemple ici 2 séro diagnostics réalisés sur une personne, ou encore 2 traitement contre l'acné testé sur les 2 joues d'une personne. on fait un tableau de contingence avec test A + ou - et test B + ou -
macnemar.jpg
L'hypothèse nulle H0 est que le test A donne autant de résultats positifs et autant de résultats négatifs que le test B , ce qui se traduit par :
Sous H0 on s'attend à avoir autant de A+ que de B+ : a+c=a+b
et autant de A- que de B- : b+d=c+d
autrement dit c=b=(c+b)/2 [c et b correspondent aux paires discordantes; et on voit que les paires non discordantes a et d ne nous apportent pas d'informations]
Bref on s'attend à (c+b)/2 dans la case A+etB- et dans la case A-etB+.
On réalise un chi 2 à 1 ddl :
\(Q=\frac {(c-\frac {c+b}{2})^2}{\frac {c+b}{2}}+\frac {(b-\frac {c+b}{2})^2}{\frac {c+b}{2}}=...=\frac {(c-b)^2}{c+b}\)Application numérique : Q=3,33
Mais faire un chi 2 à 1 ddl ça revient à faire un test de comparaison. C'est une autre manière d'envisager le problème, apparemment différente mais en fait non : ce qui est dit de 5 lignes plus haut à ici, c'est que parmi les discordances on s'attend sous H0 à en avoir 1/2 de A+ et B- et 1/2 de A- et B+. On peut donc faire le test de comparaison de la proportion observée de A- et B+ (ou de A+ et B-) parmi les discordances à 1/2 :
\(Z=\frac {\frac {b}{b+c}-\frac {1}{2}}{\sqrt {\frac {(1/2) \times (1/2)}{b+c}}}=\frac {b-c}{\sqrt {b+c}}=\sqrt {Q}\)
c'est bien un test de comparaison d'une proportion observée à une valeur donnée, et pas un test de comparaison de 2 proportions observées comme indiqué dans la correction
!
Application numérique :
Z=1,85 < 1,96 donc
on ne met pas en évidence que l'un des deux test donne plus souvent des résultats positifs.
PSA 2009
Q.15 Le piège du test de comparaison avec des groupes de tailles différentes.
Pour caculer le nombre de sujets nécessaires, la correction utilise la formule suivante :
\(n=(u_{\alpha }+u_{2\beta })^{2}\times \frac {\sigma _{A}^{2}+\sigma _{B}^{2}}{\Delta ^{2}}\) qui a été construite de la manière suivante :
Soit
\(D=M_A-M_B\). Son espérance est
\(E(D)=\mu =\Delta\). Sa variance est
\(Var(D)=\sigma ^{2}=\frac {\sigma ^{2}_{A}}{n_A}+\frac {\sigma ^{2}_{B}}{n_B}\).
Dans le cas ou
\(n=n_A=n_B\), on a donc
\(Var(D)=\frac {\sigma ^{2}_{A}+\sigma _{B}^{2}}{n}\)
Sous H0,
\(E(D)=\mu _{0}=0\). Sous H1,
\(E(D)=\mu _{1}=\Delta \neq 0\).
Sous H0 et sous H1, on suppose qu'on garde la même variance
\(Var(D)=\sigma _{0}^2=\sigma _{1}^2\).
On remplace dans l'expression suivante :
\(|\mu _{0}-\mu _{1}|=u_{\alpha }\sigma _{0}+u_{2\beta }\sigma _{1}\) (*)
et on obtient :
\(|\Delta |=(u_{\alpha }+u_{2\beta })\sqrt {\frac {\sigma ^{2}_{A}+\sigma _{B}^{2}}{n}}\)
ce qui équivaut bien à :
\(n=(u_{\alpha }+u_{2\beta })^{2}\times \frac {\sigma _{A}^{2}+\sigma _{B}^{2}}{\Delta ^{2}}\)
MAIS nous ne sommes pas dans le cas ou \(n=n_A=n_B\), nous sommes dans le cas ou \(n=n_A\) et \(2n=n_B\) ce qui change les données du calcul : la variance de D sera :
\(Var(D)=\frac {\sigma ^{2}_{A}}{n}+\frac {\sigma _{B}^{2}}{2n}=\frac {2\sigma _{A}^{2}+\sigma _{B}^{2}}{2n}\)
On rectifie l'expression (*) :
\(|\Delta |=(u_{\alpha }+u_{2\beta })\sqrt {\frac {2\sigma _{A}^{2}+\sigma _{B}^{2}}{2n}}\)
qui équivaut à :
\(n=(u_{\alpha }+u_{2\beta })^{2}\times \frac {2\sigma _{A}^{2}+\sigma _{B}^{2}}{2\Delta ^{2}}\)
On fait l'approximation que les variances théorique de A et B peuvent être remplacées par leurs valeurs observées
\(s_{A}^{2}=s_{B}^{2}=600\). Et l'application numérique donne :
\(n=166\) (réponses BD)
>
PSA 2012
Q.5 : BE
Attention au piège de se dire
\(\pi _{max}=3/n\approx 0,15\) ! Cette formule est basée sur 2 hypothèses : 1°) On considère que si un évènement est observé, alors sa probabilité est supérieure à 5%:
\(P(X=0)>0,05\). 2°) De plus, X suit une loi de Poisson de paramètre
\(n\pi\) donc
\(P(X=0)=e^{-n\pi }\). Donc
\(e^{-n\pi }>0,05\Leftrightarrow \pi<\pi _{max}=3/n\).
Or, ici rien ne nous dit que X, le nombre de déprimé suive une loi de Poisson. On sait juste que X suit une loi binomiale de paramètre
\(n=20\) et
\(\pi =0,10\). Les conditions de validité de l'approximation de la loi binomiale par la loi de Poisson ne sont pas vérifiées. Par conséquent on ne peut pas appliquer exactement le raisonnement ci dessus. En revanche on peut se dire que 1°) On considère que si un évènement est observé, alors sa probabilité est supérieure à 5%:
\(P(X=0)>0,05\). 2°) De plus, X suit une loi binomiale de paramètre
\(n=20\) et
\(\pi =0,10\) :
\(P(X=0)=(1-\pi )^n\). Donc :
\((1-\pi )^n>0,05\Leftrightarrow \pi <\pi _{max}=1-0,05^{1/n}=1-0,05^{1/20}\approx 0,14\).
>
Concours 2013
Q. 14 et 15 : énoncé :
Question 14 - (utilise l'énoncé du QCM11)
La réduction (absolue) de risque de rechute avec le nouvel anticoagulant est 1,6% (= 10,7%-9,1%) dans cet essai. Les investigateurs veulent quantifier l'incertitude de cette estimation.
A- Pour cela, ils doivent calculer l'intervalle de pari à 95% de cette réduction de risque de rechute
B- Pour cela, ils doivent calculer l'intervalle de confiance à 95% de cette réduction du risque de rechute
C- La variance de la différence des pourcentages de rechute est approximativement
\(\frac{0,107*(1-0,107)}{5000}-\frac{0.091*(1-0,091)}{5000}\)
D- Il y a 95% des chances que la réduction du taux de rechute soit dans l'intervalle [0,4% ; 2,8%]
E- Il y a 95% des chances que la réduction du taux de rechute soit dans l'intervalle [1,59% ; 1,61%]
Question 15 - Le VEMS (Volume Expiratoire Maximum pendant la première Seconde), est une mesure de la fonction pulmonaire mesurée en l. Dans une population d'enfants atteints de mucoviscidose, le VEMS a les caractéristiques suivantes: moyenne 3,30 l, écart-type 1,20 l.
A- On peut affirmer, sans hypothèse supplémentaire, que 95% des enfants atteints de mucoviscidose ont un VEMS dans l'intervalle [0,9 ; 5,7] l
B- On peut affirmer, si le VEMS a une distribution normale, que 95% des enfants atteints de mucoviscidose ont un VEMS dans l'intervalle [0,9 ; 5,7] l
C- Si le VEMS a une distribution normale , la médiane du VEMS est 3,30 l
D- On peut affirmer, sans hypothèse supplémentaire, que la moyenne du VEMS de 100 enfants atteints de mucoviscidose a 95 chances sur 100 d'être dans l'intervalle [3,06 ; 3,54] l
E- On peut affirmer, si le VEMS a une distribution normale, que la moyenne du VEMS de 100 enfants atteints de mucoviscidose a 95 chances sur 100 d'ête dans l'intervalle [3,06 ; 3,54] l
Vous n’avez pas les permissions nécessaires pour voir les fichiers joints à ce message.