倍可親

回復: 0
列印 上一主題 下一主題

人類離預報地震還有多遠?

[複製鏈接]

1萬

主題

3萬

帖子

6萬

積分

貝殼光輝歲月

倍可親決策會員(19級)

Rank: 6Rank: 6

積分
60345
跳轉到指定樓層
樓主
新鮮人 發表於 2008-7-28 21:20 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
http://blog./?p=40442
Sunday, July 27th, 2008   9:09 pm

由於此文不想寫成口號式的,希望有一些講理的過程(限於高中大學水平),所以文章不可避免地長了。擬分三次發:

一,引言:
二,科學的建立,及地震預報;
1.科學的建立,及地震預報;
2.如何建立地震科學(預報地震)(之一)  

3.氣象科學的建立
4.人類離建立地震科學還有多遠?或說:人類離預報地震還有多遠?(之二)

三,統計在科學(地震預報)中的應用與地位。(本文)

*****************************************

三,統計在科學(地震預報)中的應用與地位。

1.引言:
(1)什麼是統計學;

在社會和自然界中,我們可以把事件發生的情況分為兩類:在一定條件下必然發生的事件,叫做必然事件;在一定條件下可能發生也可能不發生的事件,叫做隨機事件。

統計學是研究隨機變數的一門學科。所謂隨機變數,是說它的變化是無規律可循的。這又分為兩種情況:

被研究對象本身是隨機的。
被研究對象也許不是無規律的,但人們不知其規律,於是視其為隨機變數。
對於我們生活中,隨機變數隨處可見。比如:

上拋硬幣:無法知道或預報得到的是硬幣的正面或是反面;
賭博中擲骰子:無法知道或預報得到的是(1,2,3,4,5,6)中的哪一個數字。
空難事故:如果你買到明天的機票,不能確定明天是否有空難事故發生,儘管知道其可能性很小,但絕不是零。
對於第二種情況(被研究對象也許不是無規律的,但人們不知其規律),比如,我們知道現在人類已經能夠比較準確地預報第二天的天氣;但如果往前推300年,我們還不知道。或者說,當你看我這篇文字時,不看天氣預報(相當於,你沒有任何天氣預報的知識),預報一下明天是否下雨?此時,這個自然界中確定的量,對於你來說,就是隨機的。

當然,由於人類不知道地震的起因與規律,無論地震是否客觀上依賴於某些物理過程,地震對於整個人類,仍是一個隨機變數。

由於隨機變數的不確定性,我們不可能做出確定的預報,所以,從這裡我們就可以直接得到結論:地震不可預報。下面是進一步解釋。


(2)為什麼用統計學?
對於隨機變數,儘管我們不能準確地知道,什麼時間,什麼地點,什麼事件準確地發生,但是我們可以用統計方法知道其發生的分佈規律。比如說,

上拋硬幣:如果不停地拋下去,就會發現有接近50%左右的硬幣是正面(或反面);
賭博中擲骰子:如果不停地賭下去,就會發現得到任意一個數字(1,2,3,4,5,6)的可能性是1/6。
空難事故:如果對某型號機種做統計,如波音767,每百萬航班出現死亡事故0.46次。
知道這些隨機變數分佈,但不知道他們如何確切發生,有什麼用呢?有用!舉例如下:

賭博中擲骰子:設想開一個賭場,擲骰子賣票$1,贏了付五倍,即$5。如果遊人不斷,如有6000人玩(收入$6000),按幾率,有1000人會贏(付$5000),莊家就穩賺$1000。
空難事故:如果知道某個航空公司,其每百萬航班出現死亡事故4.6次,遠遠高於平均值(10倍),大概人們就不會願意買它的機票。
再舉地震,假如根據歷史統計,我們知道美國加州,日本和中國四川為地震高發區,害怕地震的人們,也許就不選擇這些區域為永久居住區了。而當地政府也應該會根據可能發生的地震等級與頻率,制定相關的建房標準。

這個過程,是個推論的過程。研究這個過程的統計學分支(也是統計學的主要分支)叫做:推論統計學。它是把已知的樣本資料的特徵,應用於新的樣本資料,以推論相關的統計特徵量。

為什麼叫推論,而不叫證明或導出呢?因為通常我們不知道所應用的新的樣本資料是否和已知的樣本資料具有相同的條件,只能假定他們具有相同條件,因而具有相同的統計分佈。而這種假定,有時是不成立的(我們將在下面2.(3).中舉例說明)。

於是,用統計學做推論,有兩個要點:

假定:被推論的新樣本與導結論的模樣本具有相同條件;
結論:於是,新樣本具有相同的統計分佈
2.證明推論統計方法不適用於事件的預報(如地震預報,氣象預報,醫學預報和社會預報等):

我們來看看如何應用統計學於地震或天氣預報。

作為地震或天氣預報,人們關心的不是它的分佈(當制定地震或天氣政策的時候,人們關心的是其分佈),而是每一個具體事件的發生。比如,美國地震科學家預測在未來30年內,舊金山灣區發生一次重大地震的概率為67%,而南加利福尼亞的概率是60%。作為地震預報,人們關心的是哪一年,哪一月,哪一周,最好哪一天,哪一確切的地方(當然越准越好),有多大的震級(我們知道,三級和八極地震對人類的影響絕然不同)。

在此,我們順便給出預測與預報的定義(通常意義):

預測:利用推論統計學,從已知的樣本空間的統計分佈,來推論新的樣本空間具有相同的統計分佈。預測==推論
預報:對於確定過程,利用物理方法(或曰因果法,科學法),因果地,邏輯地導出某一特定事件的發生;對於隨機過程,以推論統計學的預測為基礎,來推論某一事件的發生。
那麼,我們是否能夠有效地應用統計學上對樣本空間的預測於具體事件的預報呢?結論是:

通常來說是不可能的,
在特殊情況下是勉勉強強的,
而在勉勉強強的情況下通常又是不太準確的。
讓我們來證明這以上各點:

(1).利用大數定理證明:統計預測僅僅適用於預知集合的宏觀分佈性,而不適於個別事件:

由於此文希望面對每一位受過高中或大學教育的網友,因此這裡只是陳述概率論裡面的所謂「大數定理」。

大數定理的表述:

當我們做統計時,所取的樣本空間所含的樣本數越大,事件發生的頻率越趨向於其概率。

何謂概率?我們可以理解,它是事件發生頻率的理論值。而概率論,是一門描述統計學的理論基礎的數學分支。比如說,我們上面提到的「扔硬幣」,在概率論中叫做0,1分佈。其實我們不必去很多次地試驗,以至於把胳膊甩腫,去得到這50%左右的頻率。概率理論告訴我們,0,1分佈的概率是50%。同樣,「擲骰子」是均勻分佈,其概率為1/6。而概率論的基礎又是數學實變函數的一個分支,測度論。

好,回到我們的大數定理。以「扔硬幣」為例,如我們仍100次,1000次,10000次,或10次,乃至1次,什麼會發生呢?看下面的表格:


樣本事件
10000
1000
100
10
1

預報概率:50%
99.37%
97.58%
92.20%
72.00%
0.00%


其中預報概率為50%,使我們從0,1分不中得到的。表中的百分比為分佈預測準確率,我是這樣定義和計算的:如果新樣本觀測值與預測值相等(50%),則準確率為100%, 如觀測值與預測值之間距離最大(觀測值為0或100%時),則準確率為0(如那位有興趣,我們可以討論)。

當樣本空間取10000個事件時,其分佈預測準確率為99.37%;而後遞次下降。取10個事件時,其分佈預測準確率為72%。取1個事件時,其分佈預測準確率為0% for sure。

所以,當我們把適用於集合的宏觀分佈性的統計預測,用於個別事件時,是極不準確的。

(2).如果非要應用統計來預報個別事件,它只適用於「大概率」事件。

既然應用統計預測於個別事件時極不準確,為什麼我們還要用呢?自然,原因之一是我們別無選擇(因為因果或物理法不存在或不成熟)。另一個原因是,如果我們從已知樣本得到的概率相當高,然後應用高概率統計預測於個別事件,我們發現仍舊可以得到相當高的準確率。見下表:

樣本事件
10000
1000
100
10
1

預報概率:99.90%
99.97%
99.91%
99.90%
99.90%
99.90%


於是,我們可以應用統計預報於「大概率」 個別事件。然而,這對人類幫助並不是太大。因為,人類希望預報的現象(地震,氣象,股票,社會等),全部是小概率事件。舉例(此例為虛擬)來說,根據50年統計,奧運會但天北京的氣溫呈如下正態分佈(一種最常用的概率分佈):

氣溫

16-down

16-20

20-24

24-28

28-32

32-36

36-up


概率

5%

10%

20%

30%

20%

10%

5%



任何一個區間都是小概率事件。於是,無法應用統計推論於奧運會當天的較準確的氣溫預報。不過,如果我們重新組織我們得到的氣溫預測,發現當氣溫大於16度時,其概率為95%,為大概率事件。於是,我們可以應用統計預報!

可是,如果中央氣象局如此預報,得到的一定是一片罵聲,因為你的預報和老百姓的經驗,所差無幾,沒有太多的新信息。
可以想見,許多統計預報熱衷者,為了表示其統計模式可以預報(anything),其重要方法是設法提高其模式的預測概率,然而這往往都是以犧牲預測信息為代價的。

(3).如果相關性沒有因果關係,即便大概率事件,其預報也是不可靠的。
如上所說,因為通常我們不知道所應用的新的樣本資料是否和已知的樣本資料具有相同的條件,只能假定他們具有相同條件,因而具有相同的統計分佈。而這種假定,有時是不成立的,尤其是在我們不知道其因果關係時。

我們可以舉例,諸如,馬英九當選前,所有的民調(統計樣本)都預測,馬英九當選后,股票會大漲;而結果是股票大跌!

再舉一個美國次貸例子:(由於文太長,這個例子在討論中舉)。

3.推論統計學在科學研究中的地位:
(1)。對於自然界的隨機變數,利用統計(概率),可以了解其樣本空間的統計分佈,從而人們制定相應政策:如保險公司定價,賭場定價,國家制定農業政策(by干澇分佈);註:隨即變數的個別事件的預報是不可能的。

(2)。對於人們不了解其規律的確定現象(如地震,許多氣象現象,許多醫學問題,社會問題— 這個很複雜,也許其本身就是隨機的),人們通常是用統計方法去找出各種現象之間的相關性,以求其之間的「物理」聯繫。當然,一旦這種「物理」聯繫獲得發現,統計學的任務便告完成。

另一方面,正是因為人們不了解其內部規律,而不得已求助於統計學去做「預報」,儘管這種「預報」:

通常來說是不可能的,
在特殊情況下是勉勉強強的,
而在勉勉強強的情況下通常又是不太準確的。
這種預報,比祈求神靈要好一些,但它不是科學,而只是科學方法的不得已的一個替代物。
知之為知之,不知為不知,是知也

海納百川,  有容乃大
您需要登錄后才可以回帖 登錄 | 註冊

本版積分規則

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-8-5 18:09

快速回復 返回頂部 返回列表