【統計】平均達收斂

2014-10-02 10:00 pm
概念上是每一次有新的數字加進就做一次平均
那如何知道這個數字再加入後,整個平均其實已經不會變動多少了

例子上:

兩筆資料
2 + 4 / 2 = 3
三筆資料
2 + 4 + 5 / 3 = 3.6667
四筆資料
2 + 4 + 5 + 10 / 4 = 5.25
五筆資料... 以此類推
( 加進來的資料基本上都不一定,但不會有非常誇張的差距 )

如何知道資料筆數已經大到
就算有一筆資料如果再加進來
對整個平均的變動影響不大

怎麼求那個資料筆數....

-------

如果給公式希望多加解釋囉 :D

回答 (3)

2014-10-05 5:37 am
✔ 最佳答案
新加入的資料"靠近平均數",才會收斂;
若是離平均數很遠,就不見得收斂.
例:
100筆, 平均5
若第101筆為9,新的平均還是很接近5;
但若第101筆為10000,則新的平均會變動很大.

特例:
若是你的每筆資料大小"限定在一個小範圍內",
資料筆數很大時,新加入者,對平均就影響不大,
所以還是要根據你"實際的資料特性",才能計算.

2014-10-04 21:37:56 補充:
我用Excel做一個資料模型,來模擬你的問題,
並列出步驟求出你想要的資料筆數:

1. 先確認是否有安裝"分析工具箱":
工具, 增益集, 看"分析工具箱"是否已勾選,
若已勾選,表示已安裝;
若沒勾選,表示沒有安裝,此時勾選之,再按確定.

2. 工具, 資料分析, 亂數產生器,
"亂數產生器"的頁面,設定如下:

圖片參考:https://s.yimg.com/rk/AC09299269/o/1174587525.png

按確定後, A1~A1000儲存格就會產生1000筆常態分佈的亂數了.

3. 為簡化計算,先將這些亂數取整數:
B1儲存格輸入 =INT(A1)
再下拉到B1000
則B1~B1000就有1000筆"接近"常態分佈的"整數"亂數.

4. 其次計算"前n筆"資料的平均(四捨五入到小數第二位):
C2儲存格輸入 =ROUND(AVERAGE($B$1:B2),2)
再下拉到C1000
則C2就是前2筆資料的平均,
C3就是前3筆資料的平均,.....,以此類推.

5. 用C2~C1000當作資料範圍,畫出折線分佈圖如下:

圖片參考:https://s.yimg.com/rk/AC09299269/o/1686526480.png

其中X軸表示第x筆資料,Y軸表示前x筆資料的平均.
由圖可看出:
大約第100筆,所求平均值已變動不大,
大約第400筆,所求平均值幾乎形成一條水平線了.
所以可以取資料筆數100;若要更嚴格,則取400.



2014-10-04 21:40:22 補充:
以上完成的檔案若需要,請自行下載:
http://www.FunP.Net/434204

2014-10-04 21:49:00 補充:
假設你的資料沒有超過1000筆,
可以直接套用以上的表格,步驟如下:
1. 將A,B欄刪除.
2. B欄建立你的資料:
B1,B2,B3,.........
3. 隨著B1,B2,B3,.........的資料逐步建立時,
可由折線圖看出前x筆資料的平均值變化.
4. 當折線圖達到你想要的穩定狀態,停止建立資料,
B欄的最後一筆即為"估計"平均值,
此估計平均值相當接近群體平均值.

2014-10-04 21:51:33 補充:
抱歉,倒數第二行打錯了:
B欄的最後一筆即為"估計"平均值
應該更正為:
C欄的最後一筆即為"估計"平均值
2014-10-20 10:09 pm
所以如果你想婚的念頭已經確定
就去找一家評價好一點的婚友社!
行動吧!
這是我之前參加的婚友社我覺得不錯

或搜尋 紅娘李姐
2014-10-02 11:28 pm
不甚明白問題.

設 Xbar(n) 表示資料 X(1),...,X(n) 之平均, 即
Xbar(n) = (X(1)+...+X(n))/n.
今若加入一新資料點 X(n+1) = X*, 則
Xbar(n+1) = (n.Xbar(n) + X*)/(n+1)
Xbar(n+1) - Xbar(n) = (X*-Xbar(n))/(n+1).

或: Xbar(n+1) - Xbar(n) = (X(n+1) - Xbar(n))/(n+1).
這是加進一筆新資料後對平均數的影響幅度.

2014-10-03 12:23:05 補充:
100筆, 平均5
若第101筆為9,新的平均還是很接近5;
但若第101筆為10000,則新的平均會變動很大.



那麼, 如果10000筆的平均是5, 第10001筆是10000呢,
新的平均數變動不就沒那麼大了嗎?


除非新增資料的變動是 "成長" 型的, 也就是說愈後面
離先前的平均數距離會愈大.


收錄日期: 2021-05-04 01:56:26
原文連結 [永久失效]:
https://hk.answers.yahoo.com/question/index?qid=20141002000016KK02855

檢視 Wayback Machine 備份