星期一, 5月 16, 2005

[數據] 怎麼看數字(5)─Pitching

 講到與投球有關的數字,最直接想到的應該就是自責分率(Earned Runs Average, ERA)這項指標,ERA 的算法是責失分除以投球局數,再乘上九,代表的意義是一個投手投九局平均所會失的分數。但是ERA 這個數字本身有一些盲點,其一是棒球進攻一次以三人出局為限,所以對一個投手來說,只要能把對方搞到三出局,就算局局都被進佔滿壘ERA 依舊會掛零,當然所謂危機處理能力雖然難以量化,但依然是實力的一部分,不過光以ERA 來講,運氣極好的投手的確能在這個數字上面騙人。其二是對於評估後援投手而言,ERA 其實能解釋的層面很小,一個投手可以在滿壘的時候上來,敗光壘上所有的跑者但ERA 依舊是零,而且以後援投手普遍投球局數少的特性來講,只要一兩場狀況不好被打一個大局,可能ERA 的成長就會以倍數計。

 WHIP(Walk plus Hits per Inning Pitching)是最近逐漸被重視的數字,算法非常淺顯易懂,就是保送加上安打除以投球局數,所代表的意義就是平均每一局投手會讓對手上幾次壘包。用WHIP配合ERA 來評估一個投手比較可以避免上述兩種情形的誤會,如果一個投手WHIP很高但是ERA 卻很低,可能的情況,一是他危機處裡能力很好,一是他運氣很好,如果是個後援投手,可能就是常常把隊友留下的跑者敗光。不過這個數字還是有一些盲點,譬如首先他不能透露投手的被打長打的機率,這點在評估一個投手好壞的時候可能影響很大。再者他跟ERA 都有一樣的問題,就是對於一局爆症的影響沒有辦法準確的反映,還有就是你很難從這個數字中去判斷,一個ERA 跟WHIP差很多的投手,到底是純粹八字重不重,還是真的是在壘上有人的時候會喇賽。

 關於這些問題,test123 之前寫過一篇介紹ERC (Earned Runs Expected)這個數字的文章,在Cobras板的1047篇。所謂ERC即是以大量的數字去跑回歸分析之後,去算出投手的各項數據與失分的關係,然後將相關係數加權後計算出的結果,其公式如下︰

(CER) = {[(H - HR)*1.255 + HR*4]*0.89 + (BB + IBB + HB)*0 .56}*{HB + H + BB}/(Total Batters Faced)

ERC = CER*9/IP - 0.56

 這個數字能反映的情況比起WHIP或者ERA都更要詳實,不過計算起來有點複雜,事實上隊多數的投手而言,前面兩樣指標已經相當足夠反映出他們的能力。

 另外在MLB 他們也會統計一項G/F 的數字,也就是投手讓打者出局的方式,G 是Groundout ,F 代表Fly out ,這個數字除了可以反映一些投手的特性讓教練做出適當的調度─譬如在需要雙殺的時候派一個容易讓對手滾地出局的投手上來,還有另一個意義是,通常讓對手打太多飛球的投手成績容易往下走,所以通常G/F 數字高的投手成績會比較好。

 另外就是K/9 跟BB/SO ,K/9 跟ERA 的算法一樣,只是分子把責失分換成三振次數,BB/SO就是單純的三振四壞比。這個數字的意義跟另外一個BABIP 的理論很有關係,簡單的說,BABIP 也就是「被打進場內的球形成安打的機率」,很多教練會說好投手要讓隊友幫你解決打者,不要老想著三振,但是這個數字被大量統計的結果,竟然跟RISPBA一樣,每年都呈現沒有趨勢的分佈,所以BABIP 的理論可能代表的意義是,一個投手的好壞,跟他的球會不會被打成安打沒有必然的關係!

 不過BABIP 這個理論還有很多被質疑的地方,拿到MLB 以外的地方也很可能不適用,但是不管怎樣,能不能用三振讓對手出局通常直接反映著投手的威力高低,而且三振也是最不會被隊友、球場問題影響的一種出局方式,在小聯盟培養新秀的階段尤其重視這個數字。

 不管是以上哪一個數字,其實很容易可以發現即使在現代棒球裡,也很難在投球的數據中找到類似打擊OBP、OPS那麼權威的數字,大部分的時候你需要參照其他幾個數字一起看,甚至針對某些特性或條件的投手還要一場一場的檢視才有辦法準確評估他的好壞。不過雖然如此,大致上ERA 這項傳統的數據還是相當可靠的,大部分的情況你都可以從ERA 中看出一個投手是強是弱,偶爾會有一些例外,不過不容易影響到ERA 的地位。