2013年10月22日

“預測達人”希爾談統計模型和中國


來源:華爾街日報
日期:2013/10/22 08:42

博客FiveThirtyEight的創始人內特‧希爾(Nate Silver)對政治感到厭倦了。

希爾因通過大數據分析兩次準確預測美國總統大選結果而聲名大噪。在最近一次美國大選中,他在選民投票之前就準確預測了50個州的選舉結果。

這位作家兼統計學家開發了各種各樣的預測項目——2003年他創建了一個棒球賽分析系統,之後他還把統計模型應用到了世界撲克大賽上,並取得了一定的成功。今年4月份,希爾宣佈結束他的博客與《紐約時報》(New York Times)之間的合作關係並轉投ESPN供職,這將是他提升自身魅力的一個機會。

希爾在一個訪談中談到了他是如何利用數據來消除偏見,以及如何可以從意想不到的角度統計中國數據的。



以下是經過編輯的訪談摘錄:

你的預測中有多少是來自直覺,而不是單純的數據分析?

統計模型一旦被設計出來,就不能再憑主觀去調整它。無論是哪種類型的複雜系統,一個模型的設計方式都是基於判斷力的。

“我不喜歡這個結果,所以讓我來調整一下這個統計模型。”我是不會這樣說的。如何應用這一模型完全靠你自律。不管你用什麼方法設計,模型設計原則都離不開科學、判斷力以及經驗。

你可以把好數據的分析方法應用到壞數據上嗎,比方說中國的數據?

美國和英國的人們都高估了經濟數據的質量。即便人們都開誠佈公,要對像美國這樣的經濟體做出估測也是很難的。放到中國的話難度就更大了。我認為一個具有共性的經驗是:看更廣泛的指標比只看某一項指標或某一個行業要有用。

“你是如何衡量中國經濟增速的?”這種思路是有問題的。可以採用的一個方法是看看更加公眾的指標,比方說,看看中國的光輸出量。

我在飛往香港的航班途中經過了北京,發現北京的物理亮度低於美國或歐洲的可比城市。

你的分析模式正在成為主流嗎?

《點球成金》(Moneyball, 又譯:《魔球》)成書快十年了,我們的分析方法已經在棒球界取得成功。球隊現在認識到數據分析所能提供的價值。他們沒有解雇球探,但可能解雇了那些根本不稱職的決策者。

但數據分析在其他許多領域的應用還很原始。不過我覺得現在人們對它的關注越來越多了,例如,你會聽到很多關於大數據的事,你在閱讀貿易期刊的時候,也會發現每兩個廣告中就有一個是有關大數據的。但我不確定人們是否真正瞭解它的含義。

讓人們完全接受它需要一段時間,通常會遇到許多阻力。

變化可能比我們想像的要慢得多。

你的終極目標是什麼?

從個人角度講,我對政治有點厭倦。我認為在這方面該證明的都證明了。

FiveThirtyEight將探索不同的領域和深度。我們會聘請更多記者報導政治消息,這仍是一大焦點。但很顯然,我們會與ESPN共同關注體育,也會關注經濟學,還可能關注一些生活方式的話題,例如旅遊。

這個世界幾乎方方面面都可以用更具判斷力、更注重實證和數據的方式來報導。找到那些能用令人信服的筆調將之書寫出來的人可能有點難度,不過那是既嚴肅又有趣的事。

我的理論絕不只適用於政治和體育。

沒有留言: