星期一, 5月 16, 2005

[數據] 怎麼看數字(6)─Defense

 如果將棒球切割成,防守、投球與打擊三個面向,無疑的至今最難用數字去量化的一定是防守。他之所以難以量化最大的原因是變化太多,大致上來說一個打者或者投手,每次上來打擊或者投球所面對的條件都差不多,就算有差也有多種方法可以約略校準。唯獨防守時所面對的情況幾乎次次不同,所以在處理數字的時候容易失真。

 最基本的防守指標是守備率(Defense Average, DA ),但同時它也相當不可靠,守備率的算法就是將製造的出局數(Put Out, PO)除以守備機會(Opportunities),所以失誤越多的人守備率就會越難看。它的問題是︰一個要避免失誤的最好方法,就是根本不要去接球-_- 所以一個選手撲得死去活來但是不小心掉了幾球,他的守備率就不如另一個站在原地裝死球員。譬如單論防守的範圍(range )而言,鄭昌明跟陽森是中職最好的兩個游擊手,而他們兩個的守備率就一向不怎樣。

 不過守備率這個數字在低階層聯盟有不同的意義。也就是當防守能力還不成熟時,守備率的確能發揮他設計的原來目的,反映一個球員的守備穩定度(fielding reliability),所以對於像是日職、大聯盟而言守備率的意義幾乎是零,但對於中職某些情況的確可以看出一些端倪,譬如前面提到的陽森,個人認為他的失誤多除了來自range 大的原罪,穩定性也仍有不足的地方。事實上前面說過的每一個數字都必須伴隨實際的觀察,特別是在討論防守方面的數據時尤其重要。

 守備率除了會受range 大小影響外,另外會忽略掉的東西則是助殺(Assist, A ),所以後來改採Fielding Percentage, FPCT來修正,FPCT的算法是PO+A/PO+A+E。不過即使這樣做還有一個問題是它無法回答的,就是對於不同的守備位置,守備率無法反映它的真實價值。譬如說棒球場上最難守的是內野的中間防線(Middle Infield, MI),包括捕手以及二游,其次是中外野,然後才是「角落」(corner)位置,所以假設防守機會一樣多,一個DA0.998 的一壘手,他的防守貢獻可能還不如一個DA0.956的游擊手。

 基於這個概念,於是發明了Range Factor, RF(台灣好像從沒用過這東西,還沒翻譯-_-)他的算法是PO+A-E/G,意思相當於每場球這個防守球員能貢獻的出局數扣掉送掉的出局數,得出來的數字就是一場球他能「實際」讓多少人出局。所以防守機會多的位置RF就會高,不同位置不同的貢獻在這個數字稍微能夠分辨出來。

 不過即使如此還是有幾個問題,一個是這個數字難以衡量代守要員,也就是那種後半段上來專門守備的,他們的出場數雖然一樣計一場,但是實際守備局數可能只有一兩局。解決的辦法是採用Adjusted Range Factor,也就是將RF跟ERA一樣,改採「每九個半局能製造的出局數」衡量。第二個問題是即便他解決了防守機會不等的問題,防守難度以及因為隊友守備影響的問題RF依然不能提供解答,而且站在一個三振能力強的投手後面守備,可想而知得到PO的機會會少的可憐,飛球投手跟滾地球投手同樣會對不同球隊的球員帶來比較時的不公平。

 針對此,米國第一間專搞棒球數據的公司STATS 想出了一套方法,稱為Zone Rating, ZR,ZR的計算方式是對於每個不同球員,STATS 公司給予他們不同的「責任區域」(zone),在責任區域內接不到的球要扣分,在責任區域外接到的球當然就可以加分。至於詳細計算的方法我並沒有看過,這個數字最大的問題是究竟那個"Zone"要多大?由誰決定?以及還是無可避免的,假設今天三個外野手給定了他們的責任區域,但是不久之後中外野換了個守備更好的選手來,對於左右外野而言,他們自己心裡面給自己的zone可能就小過原先的設定,換句話說,中外野站的人是Johnny Dammon ,左右外野可能想著我顧小塊一點,大塊的可以留給他。如果今天大門掛了,換成趙士強,那旁邊的人當然要多擔待些責任。洋基隊的游擊手Jeter,在防守能力優異的A-rod成為洋基三壘手之後,各項防守數據都有突破的表現,很多人認為A-rod在三壘大範圍的守備使得Jeter可以將心思放在靠近二壘的方向,也有人認為Jeter本身的防守的確進步了,當然,更多人傾向相信這是兩種因素綜合的結果。

 總體來說,現代棒球一直在嘗試各種管道把球員的能力量化,這樣做的好處是能夠預期這個球員接下來的表現是好是壞,這一點在打擊及投球上已經獲得了相當的成就,但是守備這邊卻還是難以找出信度足夠的方法。ZR跟RF是目前常見的指標,不過運作起來卻一直有爭議,像是2004年鈴木一朗的ZR一度跌到美聯足夠場數的外野手中的最後一名,但是還是有很多人不認為Ichiro的防守有任何退步。