數據分析(標準差)

2015-01-20 9:11 pm
x的平均=60,y的平均=70,r=0.9(相關係數),σx=3,σy=1,則y的每一筆資料必大於等於60?

回答 (4)

2015-01-26 3:02 am
✔ 最佳答案
顯然是不成立的. 例如 X, Y 聯合服從雙變量常態分布, 則 Y 有可能是
任何實數值.

2015-01-23 13:55:08 補充:
"答案" 不是真理.

就所給條件, 不能保證 "y的每一筆資料必大於等於60".

2015-01-23 14:11:25 補充:
y的平均=70,σy=1,則y的每一筆資料必大於等於60?


既然只看 y 是否大於等於 60, 與 x 並不相干.

根據 Chebyshev's ineq.,
P[Y < 60] ≦ P[|Y-70| > 10] ≦ Var(Y)/10^2 = 1/100

若 Y~normal distri., 則
P[Y < 60] = P[Z < -10], 其中 Z~N(0,1).
這個機率非常非常接近 0, 但畢竟不是 0.

2015-01-23 14:16:07 補充:
當然, 如果有資料量總數, 例如 N = 100, 那麼, 根據 Chebyshev's ineq.,
可以保證 y 的每一筆資料必大於等於60. 但若 N > 100 則不能保證.


若 y 的次數分布很接近常態, 那麼, 基於 P[Z < -10] 非常接近 0,
即使 N = 100萬, 大概也能說 Y 沒有低於 60 的.


然而, 就原題而言, 並不能保證 y 的每一筆資料必大於等於60.

2015-01-25 19:02:13 補充:
據提問者在意見欄的說明, 此題答案是肯定的; 然而, 如就原題敘述,
卻不是肯定的. 例如 X, Y 聯合服從雙變量常態分布, 則 Y 可為任意
實數值.


既然只問 "y的每一筆資料必大於等於60", 事實上與 x 不相干, 只就
y 的邊際分布來看即可.


如果是有限項資料, 則依 Chebyshev's inequality,
P[Y ≧ 60] = 1 - P[Y < 60] ≧ 1 - P[ |Y-70| > 10 ] ≧ 1 - 1^2/10^2 = 0.99

採用單邊 Chebyshev's inequality,
P[Y < 60] = P[Y < μ(Y)-10σ(Y)] ≦ 1/(1+10^2) = 1/101

因此, 如果資料數 N 在 100 以下, 那麼, Y 的每一個資料肯定都在 60
以上。但若 N 超過 100, 根據原敘述並不能保證 Y 的每一個觀測值都
在 60 以上.


當然, 若對 Y 之分布加上一些條件, 在比較大的資料數, 仍然有可能
保證 Y 的每一個資料值都在 60 以上. 例如, 若 Y 的分布對稱(於其平
均數), 有一個比 Chebyshev's 不等式好一點的不等式, 因而對比 100
大一些的 N, 仍能保證 y 的每一筆資料在 60 以上. (不過, 其一是我不
記得這個不等式, 其二是據我的印象, 此不等式用於此處對很大的 N
仍然無用.)



如果有 "Y 的分布接近常態", 那麼, 多大的 N 仍能保證 y 的每一筆
資料都在 60 以上就難說了. 若 Y~N(70,1), 則
P[ Y < 60 ] = P[ Z < -10], 其中 Z 是標準常態變量. 結果其機率比
10^{-20} 還小. 依此來看, 似乎很大的 N 也能保證 y 的每一筆資料
都在 60 以上. 然而, "接近常態" 究竟比真正的常態分布差多了!
例如自由度30的 t 分布被認為 "幾乎等同於標準常態", 但
P[ T(30) < -10] ≒ 0.23×10^{-10}, 相比於 P[ Z < -10 } 那是天壤之
別. 而一般資料分析者所謂 "接近常態" 的資料分布, 那更是差得
無邊了. 不過, 或許此時即使 N = 1000 或甚至 10000, 也能保證
y 的每一筆資料都在 60 以上吧?


2015-02-10 2:55 am
他之前遇到的問題跟你一樣
http://ts777.cc
2015-01-25 8:18 am
老怪物 師父,請作答。。。
2015-01-22 3:59 am
老怪物師您好:
答案是:是
無詳解

2015-01-23 22:01:10 補充:
老怪物師:
我不知道要按哪裡,可以給您最佳解答
好像要在"回答'中,在"意見"中無法給按。


收錄日期: 2021-04-12 00:11:24
原文連結 [永久失效]:
https://hk.answers.yahoo.com/question/index?qid=20150120000010KK01371

檢視 Wayback Machine 備份