相關和因果關係
剛才看有村友提起了相關關係和因果關係。 因為十幾年前學了不少統計的東東, 所以瞎寫一段。
統計學上說兩個東西相關時, 常用的有兩種。 常見的演演算法是把這兩個東東放到多維空間里, 計算多維空間中這兩個點的絕對距離, 或者計算這兩個矢量的夾角。 這個可能說的不通俗。 簡單說來, 如果是兩個簡單變數, 用個兩維的CROSSPLOT, 把這些點統統畫上去; 如果兩個簡單變數的點落在一條線上(可以是直線也可以是曲線), 這兩個變數就是相關性(線性的或者非線性的)很好了。 相關的好壞常用的辦法是看看相關係數, 如果接近1, 兩個東東就相關好。 如果遠小於1, 相關性就很差。
如果兩個東西相關性能很好, 這兩者可能互為因果(哪個為因, 哪個未果不一定); 也可能由第三個東東的因果關係把兩者連接起來, 比如,這兩者都是某一因(第三者)的果。
比如,太陽出來跟公雞叫晨就有很好的相關關係。 這個可能是公雞長期的演化中形成的生物鐘跟太陽的升起形成了聯繫; 這樣太陽的升起為因, 公雞的打鳴為果。
再舉個例子, 說曹操, 曹操到; 俺一說曹操, 曹操就來了;說了100次, 他來了99次;這兩者有很好的正相關關係。 裡面的因果關係,嘛, 很難找。 之一的可能, 是曹操是俺的小舅子, 俺一說, 太太給他打了個電話。