星期六, 5月 28, 2005

主播的改變

最近轉播中職的單位越來越多人在討論OBP或者OPS,我覺得滿高興的,一開始會寫這些介紹的文章就是想消除語言的鴻溝,如果能幫助更多不黯英文的棒球人了解這些數字,那就達到我當初設想的目的了。

不過最近某球評教練常在講WHIP,卻有一點問題。我們知道不管是什麼數據,根本的原則是歸納過去的現象去預測未來的可能,但是這都是以長期的情況而言─收集長期的過往資料,預測長期的未來可能。也就是說,我們不會因為一場某個球員打了.500的打擊率,就認定他是.500水準的打者。同樣的,我們不會因為某個打者有.333的打擊率,就認定他「下一場」會在三個打數中「必定」擊出一支安打。所以某球評教練最近很熱衷去計算「每一場」某個投手的WHIP其實不是很有意義,這就跟去計算單場的打擊率一樣,樣本太小統計出來的數字信度非常的小。

而且就像我在怎麼看數字(5)當中談過的,WHIP在很多方面說明性仍然有限,太迷信WHIP所代表的意義基本上跟迷信AVG或者其他任何數字是一樣可惜的。相同的,這位球評在討論OPS的時候難免犯了同樣的錯誤。尤其OPS的意義非常表面,以攻擊面而言,比他更精確的數字其實並不少。

就我的立場而言,當然希望擁有媒體公器的人能將這些概念廣泛推廣出去,不過如果這當中犯了些什麼錯誤的話,到時候要改正恐怕就更困難了。

星期二, 5月 24, 2005

交易王建民?

這篇文章是王建民debut那時候在個人板上寫的,不過現在情況沒有差太多,還是可以參考。

 五月初來談交易的問題真的是太早了,不過要來猜一猜倒是無妨

 王這兩年要被交易出去我想是很有可能的事情,The Boss這幾年拿不到冠軍已經越來越接近抓狂的狀態,簽FA也好,去燒農場也好,這幾年洋基的洞會越來越多越來越大,檯面上幾個看得到臉的prospect大概都會被拿去換點什麼回來。除非老闆突然轉性,不然這個情況應該會一直持續到拿下冠軍為止...

 洋基現在的大洞就是CF跟投手,二壘相對來說是個小洞(大概只有Torre跟鍾重彩不這樣想) 不過單就今年來講,CF應該是不會動了,除非外野還有人掛掉。投手的話比較有可能,一個是rotation當中有人掛得很徹底,一種是有人大爆特爆,被拿去當交易籌碼,通常這種情況有錢如史蛋不拉會吃下他的薪水,順便送上幾個prospect。總之就是rotation當中跑出一個洞。

 如果是有人受傷的情況,小傷讓王建民上來頂個幾場是很有可能,掛掉整季大概就會尋求交易了,所以想要常常看到王建民穿條紋衣,詛咒Wright或者KB手斷腳斷未免搞錯方向了,期待他們吃壞肚子落枕抽筋還比較實際。再來一種是上面有人爆到讓人受不了,逼得洋基要向外找投手,不過即使是這種情況,交易來的也多半是另一個先發投手,王的空間依然不會太大。而且如果是老闆受不了Wright或者KB,而願意多花錢把他們送走,可以想見他對於這一季拚死拿冠軍的決心還是一樣執著,這種情況下是不用太期待他會有耐心給一個新人投手站到rotation裡面。不過這有另一個機會,就是王被打包一起送出去,然後看那一隊的情況能不能佔到一個位置,不管怎樣這大概都是六月以後的事情了,現在要猜太難了點。

 總之現在的情況就是,王這一季要常駐洋基隊應該是不可能,不管是有人受大傷或者有人演爆爆樂,王可以上去代個兩三場,再嚴重就一定會交易來別的投手了。而且這個交易發生的話王也相當有可能被打包出去,現在高階農場裡面頂多就是Andy Phillips 可能比他前面,這兩個人都是洋基留著也不太會用到的。就算季中不交易,年底大概也免不了動些手腳,就一個洋基球迷的立場,如果要改變老闆的腦袋不可能,那希望王建民丟得好一點然後去換些好貨色也許還比較實際。

星期一, 5月 23, 2005

林恩宇該不該下場?

這應該是沒什麼好討論的問題,這場球的失敗調度投手的那個人必須要負責,看起來這個決定不是佐藤下的,郭泰源自己搞掉了勝利。

不管是從投球數還是投球威力來看,這場球至少有三個時機郭泰源要有動作,八局上追平前,九局一開始,最遲在九局被上壘之後林恩宇就該下場。有三個機會讓郭泰源做選擇,三次他都選擇了贏面小的那一個選項。

有人說是要留勝投給林恩宇,勝投對於球賽或者球隊本身並不是有意義的數字,儘管因為球賽外的因素使得勝投有了價值,但是為了留給某個投手勝投反而錯失球賽勝利的機會無疑是本末倒置的。

又或者說誠泰沒有好的後援投手,這個論點更完全是個笑話,扣掉昨天出賽兩局的李明進(其實以過去的經驗來看,郭泰源是不會在乎這一點的),依然有蔡士勤、陳志誠、米力威三人可用。蔡士勤從最近的出賽來看跟以往的那個蔡士勤差很多,或許需要多一點局數才能觀察究竟只是暫時被冰壞了還是真的找不回他的stuff,但至少陳志誠做一個短中繼絕對夠稱職,不論從數據或者他的能力來看都是如此。

至於信不信任投手的問題,這跟教練的信心無關,以誠泰的隊型而言,不懂得玩RP海那是毫無勝算。誠泰的特色是投強打弱,投手不但質精尚且量多,這是誠泰一定要請兩洋打的原因,如果學兄弟那樣請三洋投,那只是把自己的優點蓋起來曝露缺點而已。這也是為什麼從去年起就不斷強調誠泰要請兩洋打的原因。

兄弟的優點是打擊即使不靠洋將也是全聯盟最強,缺點是即使請了三洋投,仍然得面對洋投體力下滑後無人可替的情況。而誠泰一旦不能信任自己的RP,那將是另一支貧打的兄弟隊,只要把林恩宇的臉換成風神就可以了。先發投手撐到沒力-->教練不敢換後援--> 被逆轉,這個情景不是很熟悉嗎?兄弟是的確沒有夠力的後援投手可換(現在好像有了,不過不久後大概就會消失),誠泰擺著陳志誠、蔡士勤、米力威在板凳上,不能發揮自己隊型的優勢,那輸球也只是剛好而已。

星期日, 5月 22, 2005

誠泰的Lineup

最近幾場的Lineup都是排這樣︰
1.郭銘仁 SS .292/.333/.333 ( 48AB)
2.楊睿智 RF .220/.288/.260
3.謝佳賢 1B .291/.415/.564
4.威拉斯 3B .390/.459/.542
5.馬力歐 CF .250/.344/.554 (56AB)
6.羅敏卿 DH .250/.359/.386
7.柯建鋒 LF .200/.294/.350 (60AB)
8.吳昭輝 C  .246/.296/.308 (65AB)
9.鄧蒔陽 2B .265/.311/.286

誠泰的Lineup在中職當中算是排得不錯的,前兩棒OBP太低不能責怪教練太多,那是整條打線找不到適合打前兩棒的人。連帶的影響是相當有威脅性的中心打者,常常上來的時候壘上沒有跑者。三四五棒的排法也有一點小瑕疵,威拉斯的power在三人當中較弱,如果參考他以往的紀錄,他現在的高長打率除了被打擊率撐起的部分外,可能還帶點運氣成分,打數增多後應該還會再往下修。由他來保護謝佳賢可能還不如馬力歐好,不過在對方教練、投補可能也只注意打擊率的情況下,或許也有誤打誤撞保護謝佳賢的效果。

我心目中的Lineup則是這樣︰
1.楊睿智 RF
2.威拉斯 3B
3.謝佳賢 1B
4.馬力歐 CF
5.鄭景益/丘昌榮 DH
6.柯健鋒 LF
7.郭銘仁 SS
8.陳克帆 C
9.鄧蒔揚 2B

楊睿智最近幾場的狀況極差,不但安打少見,十六場也只拿了兩個BB。嚴格來說今年只算是他職業生涯的第二年,到底去年真正的楊睿智是去年上半季那個,還是現在這個也還值得觀察。我個人認為去年上半季應該是個fluke,不過只要他的選球能力沒有不見,也不應該只有現在這樣的成績。

二三四棒的排法在中職應該不容易看到,不過這是發揮謝佳賢跟威拉斯威力的最好排法。如果依然找不到適合的第一棒,拉威拉斯去打第一棒也不是什麼不可以的事情。

鄭景益跟柯健鋒的能力應該都比數字上能呈現的要好,柯健鋒一向缺乏足夠的打數,鄭景益去年上半季選球大突破之後也沒太多機會證明他是真貨。我傾向給鄭景益這個機會證明他自己,畢竟每場球打開電視,看到羅敏卿勉力的揮棒實在不是太讓人開心的事情。丘昌榮可以跟鄭景益platoon DH這個位置,他打左打的能力可能是全中職最好的。

郭銘仁似乎有個不錯的開季,這跟我以往認識的郭銘仁差很多,不過沒辦法拿BB的他也不會是好的首棒人選,他的打擊率已經掉下來了,我認為他頂多維持.270左右的AVG,如果沒辦法拿到BB,他的OBP可能只有三成出頭而已。

捕手今年依然是誠泰的痛,陳克帆儘管進入職棒後有鳥槍化的傾向,不過既然他的競爭對手是吳昭輝,那還有什麼好考慮的呢?

鄧蒔揚一開始也有不錯的表現,不過他的情況跟郭銘仁很像,甚至他的打擊能力還不如郭銘仁,也一樣有著沒辦法拿BB的問題。

大致來講,現在的誠泰只有1B、CF、3B、DH這四個位置比較有攻擊能力,柯健鋒或許可期待,但現在還沒打出來。MI的問題應該是沒得期待了,雖然把許聖杰換成郭銘仁會稍微升級,除非等看看郭銘仁會不會展現出什麼不一樣的東西。

代打方面,羅敏卿一兩年內也許還可以是稱職的左手代打,陳元甲則是誠泰不得不培養的砲手,如果沒有人吃藥,誠泰三十歲以下的球員唯一有長打威脅力的球員,可能只剩下他跟二十八歲的柯健鋒,如果二軍沒有成立,以戰養戰也是不得已的辦法。吳承翰的情況就比較慘了,他本來是個.270/.350/.370左右、缺乏防守能力的LF,年紀也已經不小了,去年儘管選球功夫還在,打擊能力的退化卻已經讓他不值得繼續先發,加上新人競爭激烈,或許今年將是他職棒的最後一季。

星期四, 5月 19, 2005

My blog...

這個blog主要會是在討論CPBL,MLB也許會談到一些,如果有國際賽事大概也會提到。不過可預見的一兩年內大概看比賽的時間不會很多,所以即使是CPBL可能也會將焦點放在誠泰Cobras上面,畢竟我是蛇迷。

原則上我希望文章不要被逕自轉錄,可以轉貼網站連結,但請不要直接轉內文。

星期一, 5月 16, 2005

[數據] 怎麼看數字(8)─Sabermetrics

 這篇應該是介紹這些入門數據一系列下來的最後一篇,比較淺顯、實用的數據前面大致上介紹過了,這一篇我想談的是一個態度─面對這些數據的態度。

 全世界最大的棒球迷學術團體The Society for American Baseball Research曾經為新興起、關注數據的這門領域,取了一個全新的英文單字─Sabermetric。 中文還沒有適切的翻譯,我在網路上討論時,常常看到有人用「數據派」來形容類似關注數據的人,聽起來好像有點貶意,不過這篇文章姑且用之。

 所謂的數據派大概是指在論戰時常常提出各式各樣數據作佐證的這群網友。因為台灣的棒球圈對這些「新數據」有概念的教練球員並不太多,所以很多調度安排或者球評的言論,在這些數據的分析下表現得近乎愚蠢。有人據數據攻擊之,當然也有人護航,當中的爭執不可細數。不過就我觀察來看,多數的爭議是對於無法量化的影響因素有不同的看法,這些因素包括選手的身體狀況、運氣、或者所謂的「霸氣」。再者,數據派強調能夠量化數字的重要性,常常會讓人攻擊「乾脆開電腦算算就好了,也不用上場打球了」。而通常這些想法都是出自誤解,誤解又是出自對於Sabermetrics的不了解,我嘗試提出四點數據派理當有的想法,或許可作為參考。

 而在了解數據派之前,應該要了解數據派為什麼產生。「數據」一個很重要的目的,是要去當作做「選擇」的時候的一個工具。用經濟學的理解,人無時無刻不在選擇,有選擇就有成本,成本小的時候選擇可以隨便做,當成本大的時候選擇就會變得謹慎,而這正是現代數據會被重視的一個很大原因─選擇的成本提高了─高薪的FA制度。試想,如果簽不簽一個球員,關係到的是上百萬上千萬的美金,這個選擇能不謹慎嗎?因此要怎麼更精確(至少比傳統打擊三樣數字精確)的去衡量一個球員,就成了管理階層的挑戰。所以對這些管理階層而言,不可能說出「Bonds 跟一朗是不能比較的」這種話,因為他的任務是要去評估一個球員值得多少美金,他必須要去想出辦法來比較兩個看似無法比較的球員─甚至得去比較投手跟野手。

 大概知道現代數據興起的背景之後,或許比較容易理解以下幾點︰

第一、數據派應該是最不崇尚結果論的

 我們可以用過去預測未來,但棒球一如人生,也因為充滿了意外而有趣。譬如當年紅人簽下Ken Griffey Jr. ,當時沒有人會知道他會打成這樣,但是這個合約是不是蠢合約?就數據派的角度看並不是的,數字的樂趣是在預測,不是在結果。甚至不用數據的例子,奧運對義大利那一場九局丟上陽建福,不用多詳細的資料都能知道陽建福是當時牛棚能拿出來最好的投手,丟上陽建福沒有任何問題,被幹了逆轉砲是結果,跟當初的決定是否正確無關。所以說數據派「拿電腦算就好了」是完全不了解才會有的誤會。

 沒有意外的棒球比賽是無趣的,對任何一派的球迷都一樣。數據派並不介意預言失準,只在意做出預測的時候有沒有道理。CCLu有一個很傳神的比喻,某一堆數字是40~80 ,另一堆數字是70~120,現在要兩人各抽一張比大,先抽的人應該選擇哪一堆?選擇第二堆的人當然有可能輸,但是除非作弊,不然任誰都會認為先選第一堆的是豬腦(CCLu的原文不是這樣,我改了例子,但是說明的創意是他的。)。簡單說數據派並不否認「宇宙無常」,但是他們並不會用「宇宙無常」當作自己沒腦的擋箭牌,反而拿「宇宙無常」作為反對數據派的理由才是相當可笑的。

第二、理性是數據派溝通的平台

 在比較兩個水準很接近的選手的時候,如果去除任何數據,包括傳統的三樣指標(別忘了這三種指標也是數據,每個棒球迷或多或少都屬於數據派),事實上幾乎是無從討論的。一個日本人可以因為同鄉所以認為松井秀喜比較棒,一個多明尼加人可以因為血緣所以認為Manny Ramirez 比較強,這樣的爭論不會有結果。數字的工作就是提供一個普遍能夠接受的平台,不是讓兩個人各自「我認為」而沒有交集。

 當然如同之前每一篇文章強調的,數據在一個面向常常只能反映出部分的結果,打擊已經是現代數據可以非常準確預測的項目了,但是無法量化成數字的因素還有很多,更不要提投球跟守備了。不過即使如此,這並不表示一場比賽的打擊順序得靠擲銅板決定,精確的數據提供的是一個可信賴的範圍,當然有這個範圍以外的因素。譬如說所謂的抗壓性,或者是有一個王牌救援在陣給予對手的壓力等等,這些因素的確或多或少會影響,我認為好的數據頭不應該傲慢的忽視這些因素。這些因素雖然難以量化,但是還是可以評估,譬如就算陳金鋒上場前一直告訴你他好緊張,因此讓他坐板凳然後叫闕樹木代打他通常不會被接受。

 我想要強調的是一個估計值的概念,就像是常有人提出霸氣作為投手好不好的關鍵,但是一個有霸氣的陳義信,難道就會比溫文儒雅的Mike Mussina來得有威力嗎?當拿兩個實力差距很大的選手比較的時候,不可量化的因素影響力幾乎是零。謝佳賢可能近況不好,但是不論這個無法量化的因素多困擾他,誠泰隊一樣沒人能取代他的地位。而當實力差距有限的時候,不能否認很多慣用數據的人,依然傲慢的否決這些因素的影響,我認為完全否決這些因素是沒道理的,但是看到每天都在討論誰有霸氣誰缺霸氣這種文章還是會倒胃。在面對不可量化因素的時候,應該是更審慎的去找一個「合理」的共識。

第三、好的數據頭立場應該是很嚴謹的

 很多時候「數據派」被污名化的確是因為充斥太多假數據派,好的數據頭理當是很嚴謹的,從統計的角度來說,唯有信度跟效度都在可容許範圍的時候,數據派才有立論的基礎。舉例來說,數據派很重視樣本數的大小,王建民去年季末在3A投了三十多局的好球,在多數的球探報告裡面,即使他的成績好得讓人驚豔,也一定會加上一句保留的話語─他需要更多局數證明他自己。沒有足夠的樣本背書預測就容易失準,即使一個人打了一整季的好球,或者有一整季不如預期的表現─就像這兩年的松井秀喜。

 另外是關於解釋數據上的問題,所有的數據都是過去結果的累積平均,數據的功用不在預測一個play的成功或失敗,而應該是大量樣本累積之後的結果。譬如說在XR的公式中一次盜壘成功相當於0.36分,這並不是說黃甘霖盜上了二壘統一就拿了0.36分,而是一整季累積下來的結果,當他持續不斷的盜壘成功,整個效益平均下來一次盜壘的效益會接近這個數字。所以拿大量統計的結果去否定每次play是否該觸擊或者盜壘是不妥當的,整個統計說明的是一個趨勢,過量的觸擊會傷害球隊,但是每一次的觸擊不盡然如此。

第四、好的數據頭不會只看電腦不看球賽

 很多人想當然爾的認為信仰數據的人不看球賽,事實上通常不是這樣。會去專研數據的人多半對棒球有莫名的狂熱,要這些人不看球簡直是要他們的命。也因為數據頭對於數據的了解詳細,所以對於數據預測不足的部分更是清楚。一個好的數據頭去解釋一個投手好不好的時候往往不只是需要ERA 、WHIP這些數字,更會說明這個投手的stuff 究竟好不好。如果仔細注意,以前常在Cobras板出沒的「蛇板的大大」們,除了附帶數據說明,對於選手的觀察往往也有深入的見解。

 其實說他們是數據派實在是不妥當,就像之前講的,數據只是一種預測的工具,而越是了解現代數據的人就越是清楚現代數據的不足之處,因此也就越不可能完全依賴數據,稱這樣的人做「數據派」其實是有點冤枉了。

 或許應該這樣說,如果將棒球的可預測性分成可量化及不可量化兩部分,深受sabermetrics 影響的人只是將可量化的那部份看得更重了。如果這些人過度忽略了不可量化那部份的重要性,很顯然他們也悖離了事實,這一直是「數據派」被攻擊的地方。事實上這個爭論在美國也時有所聞,特別是在缺乏大量穩定數據的新秀評估上,傳統派的勇士隊比起「數據派」的運動家隊可是一點也不遜色。

 不過若我們假定真的有所謂可量化及不可量化的比重,無疑台灣球界對於可量化的那部份實在太膚淺。過去三十年美國球界的修正已經足夠說明在Sabermetrics出現以前的棒球,對於可量化的部分有錯誤的低估,而現在台灣球界的風氣比起三十年前的美國好不到哪去。因此即使網路上常常充斥對於數據的重要矯枉過正的言論,我依然相信提倡數據的重要對於台灣棒球的確會有正面的影響。也是鑒於多數的資訊被引進的太過緩慢,語言的隔閡常常也讓現代棒球理論的擴散不容易,所以我狂妄的想要將一些入門的資料做統整性的介紹。

 感謝CobrasTalk的板友不吝辛苦幫我除錯,這八篇文章如果有任何錯誤,請各位去找那些答應幫我檢查的CT板人算帳XD

[數據] 怎麼看數字(7)─XR, VORP and WS

 這一篇將要介紹的三個數據比較複雜,它的主要功用仍然是在比較球員,不過比起之前幾個「單純」的數字,它們運用了大量統計分析的結果,清楚的將不同的結果放在同一個平台上比較。

 XR(Extrapolated Runs )的概念最早是由現代棒球之父Bill James提出,當時他稱此想法作Runs Created(RC),也就是一個球員能製造多少分數。這個想法的源頭,是他認清一支球隊要贏球的關鍵是得的分數比別人多,但是當時大家最重視的卻是打擊率、打點等等,而一支球隊可能各項打擊數字都比別人高,卻沒有比別人得更多的分數,這就像是一間工廠真正要拿出去賣的東西是產品,但是大家卻只注意原料的好壞,忽略了究竟製造出怎樣的產品。當時他利用數年大聯盟球隊的團隊成績分析,提出了最早的RC公式︰

 安打加保送乘上總壘打數,再除以打數加上保送﹛(H+BB)*(TB)/(AB+BB)﹜

 用這個公式已經可以相當程度的估算出一支球隊一年能拿多少分。在這個觀念之上後來又產生了多種RC,光是Bill James自己就提出了至少三種,而且越來越精準,後來的數據魔人,利用大量的樣本去跑各種打擊數據的迴歸分析,又得出了這些基本數字與得分之間的相關係數,我自己常用的版本是長這樣的︰

 XR=(.50 x 1B) + (.72 x 2B) + (1.04 x 3B) + (1.44 x HR) + (.34 x (HP+TBB-IBB))+(.25 x IBB)+ (.18 x SB) + (-.32 x CS) + (-.090 x (AB - H - K)) + (-.098 x K)+ (-.37 x GIDP) + (.37 x SF) + (.04 x SH)

 這些數字主要是根據大聯盟的資料分析的,不過把它放在中職或者日本,即便有差距但也不至於影響太多,就是當兩個人分數相當接近的時候可能要保留一點就是了。不過這樣算出來的XR,就跟RF一樣有些根本的問題,也就是它衡量的是一項「總數」而非平均值,所以打席多的選手會比打席少的吃香。解決這個問題辦法是使用XR/27,XR/27的意思是一個選手出局二十七次能製造多少分數,出局數的算法是︰AB-H+SH+SF+CS+GIDP,將它乘上二十七之後就能當作分母了。這個數字的涵義除了可以用來校準XR以外,還可以解釋成假設一個球隊整條打線都是某個選手,那麼這條打線能得到幾分,順帶一提,2004年的BondsXR/27 是二十分左右,就是說如果一到九棒全都是Barry Bonds,這條打線一場球可以幫你打下二十分...由於後攻的球隊假如贏球往往不會打到二十七個出局數,所以有些人是將出局數乘上25.5。

 VORP則是一個更複雜的概念,XR雖然精確,但是它的問題是難以衡量投手的價值,特別是當投手跟打者要放再一起比較的時候。VORP則可以解決這個問題,同時VORP也是我所知道唯一能將打者跟投手放在一起客觀比較的數字。

 VORP是Value Over Replacement Player 的縮寫,Replacement Player的意思是就是一個最低標準的球員,只是暫代而且可以隨時被替代的,以大聯盟來說,大概就是任何球隊都能從3A上找來墊檔的角色。VORP的意思就是比一個Replacement Player多了多少價值,當然價值越高就是越好的球員。而VORP的單位是分數(Runs),對打者來說就是能比低標球員多打幾分,對投手來說就是能比低標投手多守下幾分。Bonds 今年的VORP是144.6 ,拿下美聯賽揚獎的Johan Santana則是78.2 。(由VORP這個數字可以觀察到,一般而言打者的價值比投手高,聯盟前20%的投手對球隊的貢獻往往不及同樣20%的打者)

 VORP的計算方式相當複雜,有興趣的可以參考http://www.stathead.com/bbeng/woolner/vorpdescnew.htm

 VOPR依然有個盲點,就是它一樣難以反映防守的價值,不過一般來說這是微不足道的,譬如大家都知道Pujols的防守比Ichiro爛上一大截,現在改去一壘之後防守價值又差更多了,不過Pujols今年的VORP大約比Ichiro多了三十分,試問要多少的防守加分才能讓Ichiro變成一個1.5 倍強的球員?所以多半時候對打擊好手而言,防守只會是Bonus 的項目。

 當初最後一個想介紹的是Win Share, WS 。不過後來看到CPBL板的Debugger介紹的實在太詳細了,我怎麼寫也不可能寫得比他好,所以有興趣的各位煩請移架CPBL板的精華區吧XD 但是談到WS,其實有一個概念可以先釐清,就是在討論這些數據的時候,「貢獻」跟「能力」是要分開來看的。貢獻是實際發生的事情,能力則是可以預期發生的事情,用最淺白的例子來看,鄭昌明在比賽中幹了三響砲那是他的「貢獻」,但是你作為一個教練,會因此認為他有打長打的「能力」因而將他排到中心棒次嗎?所以之前在Baseball板有人討論到彭政閔的打擊型態時,拿WS出來其實有點牛頭不對馬嘴,WS的確可以反映彭政閔對象隊有多少「貢獻」,但是如果要談到他自身能力上的演化過程,那WS可以代表的事實就太少也太不純淨了。

 貢獻跟能力的分野是在評定戰術好壞的時候的關鍵,有一次在一個板上大家在討論得點圈打擊「能力」的時候,一位老兄跳出來說WS有用到RISPBA,想以此證明美國數據魔人也看重RISPBA,這是完完全全搞不清楚狀況的說法,WS衡量的是「貢獻」,因此作為貢獻的一環,RISPBA當然能夠被列入考慮,不過如果要討論能力,現階段來說,就如同前幾篇文章所談到的,大部分的StatsHead都依然認為RISPBA單純是運氣下的產物而已。

[數據] 怎麼看數字(6)─Defense

 如果將棒球切割成,防守、投球與打擊三個面向,無疑的至今最難用數字去量化的一定是防守。他之所以難以量化最大的原因是變化太多,大致上來說一個打者或者投手,每次上來打擊或者投球所面對的條件都差不多,就算有差也有多種方法可以約略校準。唯獨防守時所面對的情況幾乎次次不同,所以在處理數字的時候容易失真。

 最基本的防守指標是守備率(Defense Average, DA ),但同時它也相當不可靠,守備率的算法就是將製造的出局數(Put Out, PO)除以守備機會(Opportunities),所以失誤越多的人守備率就會越難看。它的問題是︰一個要避免失誤的最好方法,就是根本不要去接球-_- 所以一個選手撲得死去活來但是不小心掉了幾球,他的守備率就不如另一個站在原地裝死球員。譬如單論防守的範圍(range )而言,鄭昌明跟陽森是中職最好的兩個游擊手,而他們兩個的守備率就一向不怎樣。

 不過守備率這個數字在低階層聯盟有不同的意義。也就是當防守能力還不成熟時,守備率的確能發揮他設計的原來目的,反映一個球員的守備穩定度(fielding reliability),所以對於像是日職、大聯盟而言守備率的意義幾乎是零,但對於中職某些情況的確可以看出一些端倪,譬如前面提到的陽森,個人認為他的失誤多除了來自range 大的原罪,穩定性也仍有不足的地方。事實上前面說過的每一個數字都必須伴隨實際的觀察,特別是在討論防守方面的數據時尤其重要。

 守備率除了會受range 大小影響外,另外會忽略掉的東西則是助殺(Assist, A ),所以後來改採Fielding Percentage, FPCT來修正,FPCT的算法是PO+A/PO+A+E。不過即使這樣做還有一個問題是它無法回答的,就是對於不同的守備位置,守備率無法反映它的真實價值。譬如說棒球場上最難守的是內野的中間防線(Middle Infield, MI),包括捕手以及二游,其次是中外野,然後才是「角落」(corner)位置,所以假設防守機會一樣多,一個DA0.998 的一壘手,他的防守貢獻可能還不如一個DA0.956的游擊手。

 基於這個概念,於是發明了Range Factor, RF(台灣好像從沒用過這東西,還沒翻譯-_-)他的算法是PO+A-E/G,意思相當於每場球這個防守球員能貢獻的出局數扣掉送掉的出局數,得出來的數字就是一場球他能「實際」讓多少人出局。所以防守機會多的位置RF就會高,不同位置不同的貢獻在這個數字稍微能夠分辨出來。

 不過即使如此還是有幾個問題,一個是這個數字難以衡量代守要員,也就是那種後半段上來專門守備的,他們的出場數雖然一樣計一場,但是實際守備局數可能只有一兩局。解決的辦法是採用Adjusted Range Factor,也就是將RF跟ERA一樣,改採「每九個半局能製造的出局數」衡量。第二個問題是即便他解決了防守機會不等的問題,防守難度以及因為隊友守備影響的問題RF依然不能提供解答,而且站在一個三振能力強的投手後面守備,可想而知得到PO的機會會少的可憐,飛球投手跟滾地球投手同樣會對不同球隊的球員帶來比較時的不公平。

 針對此,米國第一間專搞棒球數據的公司STATS 想出了一套方法,稱為Zone Rating, ZR,ZR的計算方式是對於每個不同球員,STATS 公司給予他們不同的「責任區域」(zone),在責任區域內接不到的球要扣分,在責任區域外接到的球當然就可以加分。至於詳細計算的方法我並沒有看過,這個數字最大的問題是究竟那個"Zone"要多大?由誰決定?以及還是無可避免的,假設今天三個外野手給定了他們的責任區域,但是不久之後中外野換了個守備更好的選手來,對於左右外野而言,他們自己心裡面給自己的zone可能就小過原先的設定,換句話說,中外野站的人是Johnny Dammon ,左右外野可能想著我顧小塊一點,大塊的可以留給他。如果今天大門掛了,換成趙士強,那旁邊的人當然要多擔待些責任。洋基隊的游擊手Jeter,在防守能力優異的A-rod成為洋基三壘手之後,各項防守數據都有突破的表現,很多人認為A-rod在三壘大範圍的守備使得Jeter可以將心思放在靠近二壘的方向,也有人認為Jeter本身的防守的確進步了,當然,更多人傾向相信這是兩種因素綜合的結果。

 總體來說,現代棒球一直在嘗試各種管道把球員的能力量化,這樣做的好處是能夠預期這個球員接下來的表現是好是壞,這一點在打擊及投球上已經獲得了相當的成就,但是守備這邊卻還是難以找出信度足夠的方法。ZR跟RF是目前常見的指標,不過運作起來卻一直有爭議,像是2004年鈴木一朗的ZR一度跌到美聯足夠場數的外野手中的最後一名,但是還是有很多人不認為Ichiro的防守有任何退步。

[數據] 怎麼看數字(5)─Pitching

 講到與投球有關的數字,最直接想到的應該就是自責分率(Earned Runs Average, ERA)這項指標,ERA 的算法是責失分除以投球局數,再乘上九,代表的意義是一個投手投九局平均所會失的分數。但是ERA 這個數字本身有一些盲點,其一是棒球進攻一次以三人出局為限,所以對一個投手來說,只要能把對方搞到三出局,就算局局都被進佔滿壘ERA 依舊會掛零,當然所謂危機處理能力雖然難以量化,但依然是實力的一部分,不過光以ERA 來講,運氣極好的投手的確能在這個數字上面騙人。其二是對於評估後援投手而言,ERA 其實能解釋的層面很小,一個投手可以在滿壘的時候上來,敗光壘上所有的跑者但ERA 依舊是零,而且以後援投手普遍投球局數少的特性來講,只要一兩場狀況不好被打一個大局,可能ERA 的成長就會以倍數計。

 WHIP(Walk plus Hits per Inning Pitching)是最近逐漸被重視的數字,算法非常淺顯易懂,就是保送加上安打除以投球局數,所代表的意義就是平均每一局投手會讓對手上幾次壘包。用WHIP配合ERA 來評估一個投手比較可以避免上述兩種情形的誤會,如果一個投手WHIP很高但是ERA 卻很低,可能的情況,一是他危機處裡能力很好,一是他運氣很好,如果是個後援投手,可能就是常常把隊友留下的跑者敗光。不過這個數字還是有一些盲點,譬如首先他不能透露投手的被打長打的機率,這點在評估一個投手好壞的時候可能影響很大。再者他跟ERA 都有一樣的問題,就是對於一局爆症的影響沒有辦法準確的反映,還有就是你很難從這個數字中去判斷,一個ERA 跟WHIP差很多的投手,到底是純粹八字重不重,還是真的是在壘上有人的時候會喇賽。

 關於這些問題,test123 之前寫過一篇介紹ERC (Earned Runs Expected)這個數字的文章,在Cobras板的1047篇。所謂ERC即是以大量的數字去跑回歸分析之後,去算出投手的各項數據與失分的關係,然後將相關係數加權後計算出的結果,其公式如下︰

(CER) = {[(H - HR)*1.255 + HR*4]*0.89 + (BB + IBB + HB)*0 .56}*{HB + H + BB}/(Total Batters Faced)

ERC = CER*9/IP - 0.56

 這個數字能反映的情況比起WHIP或者ERA都更要詳實,不過計算起來有點複雜,事實上隊多數的投手而言,前面兩樣指標已經相當足夠反映出他們的能力。

 另外在MLB 他們也會統計一項G/F 的數字,也就是投手讓打者出局的方式,G 是Groundout ,F 代表Fly out ,這個數字除了可以反映一些投手的特性讓教練做出適當的調度─譬如在需要雙殺的時候派一個容易讓對手滾地出局的投手上來,還有另一個意義是,通常讓對手打太多飛球的投手成績容易往下走,所以通常G/F 數字高的投手成績會比較好。

 另外就是K/9 跟BB/SO ,K/9 跟ERA 的算法一樣,只是分子把責失分換成三振次數,BB/SO就是單純的三振四壞比。這個數字的意義跟另外一個BABIP 的理論很有關係,簡單的說,BABIP 也就是「被打進場內的球形成安打的機率」,很多教練會說好投手要讓隊友幫你解決打者,不要老想著三振,但是這個數字被大量統計的結果,竟然跟RISPBA一樣,每年都呈現沒有趨勢的分佈,所以BABIP 的理論可能代表的意義是,一個投手的好壞,跟他的球會不會被打成安打沒有必然的關係!

 不過BABIP 這個理論還有很多被質疑的地方,拿到MLB 以外的地方也很可能不適用,但是不管怎樣,能不能用三振讓對手出局通常直接反映著投手的威力高低,而且三振也是最不會被隊友、球場問題影響的一種出局方式,在小聯盟培養新秀的階段尤其重視這個數字。

 不管是以上哪一個數字,其實很容易可以發現即使在現代棒球裡,也很難在投球的數據中找到類似打擊OBP、OPS那麼權威的數字,大部分的時候你需要參照其他幾個數字一起看,甚至針對某些特性或條件的投手還要一場一場的檢視才有辦法準確評估他的好壞。不過雖然如此,大致上ERA 這項傳統的數據還是相當可靠的,大部分的情況你都可以從ERA 中看出一個投手是強是弱,偶爾會有一些例外,不過不容易影響到ERA 的地位。

[數據] 怎麼看數字(4)─Lineup

 在了解了幾項基本的攻擊指數之後,我們馬上可以挑戰的是傳統的排棒觀念。譬如說,以前球評常說二棒要排「助攻」能力強的選手,也就是像羅國璋一類的觸擊魔人,但是一旦了解了出局數是棒球場上最珍貴的資產,就應該能夠理解將全場打擊機會第二多的位置交給一個生涯OBP 只有.307的球員並不是多麼聰明的做法。又或者,某球評老是愛強調四棒要有「打點能力」,你也可以知道他是在放... 了。

 那麼現代棒球中的棒次應該怎麼排呢?我們知道棒球的進攻分為上壘和推進兩個部分,所以一個基本的概念就是,在會推進的打者前面排會上壘的人,而越會上壘的人應該擁有越多打擊的機會。因此理論上,OBP 最高的球員應該擺在前兩棒,而第三棒放的則是全隊最好的打者,第四棒要有保護第三棒的功能。所謂的保護,就是不讓對手大膽的保送第三棒,而我們知道一個保送是一個壘包,所以要保護第三棒,第四棒要求的不只是OBP ,他的長打能力會更為重要。長打能力強,代表的是可以將隊友從一壘送上三壘甚至本壘,如果第四棒的長打能力不強,那麼對手即使保送三棒,讓你打一支一壘安打也不過變成一二壘有人而已。

 同樣的道理,第五棒的功用其實跟第四棒類似,但是因為他能得到的打數較少,因此一般會把比較好的打者擺在第四棒。六七棒常常是一支球隊攻擊組的結束與守備組的開始,後段棒次的排棒原則基本上也不脫OBP 高的擺前面,長打能力強的擺後面保護這個原則。當然,現實的情況往往後段棒次是找不到OBP 或者長打能力多強的球員,反正這些人的價值是在守備,打得好算賺到,打不好也是應該。

 這種排法跟傳統排法最大的不同就是在二、三兩棒的角色變化。傳統的排法中除了二棒應該要是觸擊魔人之外,四棒通常才是一個球隊的指標人物。我認為最好的打者從四棒轉移到三棒的原因,應該是在二棒角色的不同。

 傳統排法中,理想的模式是一棒上壘後二棒推進到得分位置,然後讓三四棒來清,而之所以將最好打者擺在四棒而非三棒的原因,是因應若一棒沒能上壘,二棒理所當然出局之後,如果把最好的打者擺在三棒會形成浪費。因此將這名打者往後移,而在他之前安插一位上壘率也相當高的三棒,形同是幫自己最好的打者買了雙保險 (一棒與三棒)。而在現代棒球下,二棒的角色等於是傳統三棒的提前,因為觸擊被認為是浪費重要的出局數而不在現代棒球中受重視,因此將這個雙保險提前到一二兩棒。這樣做的好處有兩個,一是不浪費第二棒全場次多的打擊機會,二是讓最好的打者因為提前一個棒次而擁有更多的打擊機會。說穿了這樣的不同其實只是在於一個觀念的發展,那就是出局數對於一場棒球比賽的重要性。

 我們以誠泰職棒十五年某場比賽的先發陣容為例子來實際檢討一下︰

1.楊睿智 .311/.385/.406
2.許聖杰 .195/.250/.250
3.丘昌榮 .287/.344/.435
4.謝佳賢 .286/.388/.541
5.鄧蒔揚 .293/.322/.333

 這種排法以上面的觀念去檢視,有哪些不妥的地方?首先,是許聖杰打第二棒,在誠泰教練團的想法裡他是要拿來作觸擊魔人使用的,但是他的OBP 只有約.250,也就是上來打四次只有一次會上到壘包,一旦楊睿智沒有上壘,誠泰想要在中心打者上來前壘包上有人的機會並不怎麼高。其次,是丘昌榮與鄧蒔揚的棒次。我們可以很清楚的看到謝佳賢無疑是誠泰最好的打者,並且領先其他人一大截,所以我們希望在謝佳賢上來前,壘包上有人等著他送回休息室,丘昌榮並不是最適合的那個人,吳承翰才是,這是單以數據而言,而以打擊型態來說,吳的選球比丘好太多太多,更應該排在謝佳賢前面。

 鄧蒔揚當時的OBP 相當不錯,但是他缺乏保護謝佳賢的長打能力,也就是說如果對手面臨危機,只要一壘是空著,保送謝佳賢會是一個非常好的選擇。因為鄧蒔揚的上壘以一壘安打為主,保送謝佳賢之後,鄧蒔揚打安打並不會讓對手多損失什麼分數,即使本來在得點圈的跑者因此回來得分,被保送的謝佳賢都不會因此賺到什麼,而對手則以較小的代價避開了最可怕的打者。所以如果要要把謝佳賢排在四棒,當時的情況鄧三丘五會是比較好的排法。

 這邊講的一樣只是個原則性的做法,實際上因應對方投手、守備能力的不同,自己隊上打擊能力的強弱勢必得做些調整。有興趣的也可以想想看九一連線是不是合理的做法,或者有沒有可能因為某些特殊條件而變得合理。

[數據] 怎麼看數字(3)─RBI, RISP & Clutch hitter

 在我小時候剛開始看中華職棒之初,一直被強調的觀念就是打點才是一個球員最重要的數據,什麼打擊率全壘打都只是美帝個人英雄思維下的幼稚產物,只有打點才能代表一個球員對團隊的貢獻。

 這個說法某種程度上來說沒有錯,打點(Run Batted In, RBI)的確反映了一個球員對於球隊的攻擊有多大的貢獻,但是當你要衡量一個球員的能力的時候,打點卻成了沒有什麼意義的數字。

 只要用一個很簡單的例子就能了解為什麼,同樣是打一支安打,你的隊友是坐在板凳上擦手套,還是站在二壘上準備跑回來得分,這樣的差異就可以決定你會不會有打點。也就是說,如果前面的隊友上壘能力很強,後面的打者就有很多機會可以拿到打點,相反的,如果前面的隊友沒有辦法上到壘包,後面的球員再會打也很難得到大量的打點。

 傳統的棒球觀念會告訴你即使如此,一個選手有沒有「適時安打的能力」仍然會左右打點的多寡,也就是說有些人不管前面的隊友是不是很會上壘,一旦有隊友上到壘包,他們就會像吃了大力丸一樣變得很會打安打。於是得點圈打擊率(Runners In Scoring Postion Batting Average, RISPBA) 開始出現,它的算法是只取出得點圈有隊友的打數作樣本,然後來估算打擊率有多高。理論上來說,即使某個選手因為隊友太肉因此遇到得點圈有人的機會比較小,只要他的確具有「適時安打的能力」,RISPBA就應該會還他一個公道。看起來很合理,但現在看來我們大概也可以說這仍然近乎一個無用的數據。

 如果說RISPBA是一種「能力」的話,那麼即使它會隨著球員的逐漸成熟或老化而有消長,它應該還是會呈現出一個趨勢─逐漸衰退或者逐漸成長,一如所有其他已經被認為是「能力」的數字如打擊率、長打率等等一樣。但事實上,當美帝的數據魔人用多名球員連續多年的成績去分析之後,他們發現RISPBA的消長整體來說沒有任何趨勢可言,一名球員的RISPBA可以某一年高的誇張,隔一年卻爛到想哭,然而他的OBP、SLG等等卻依然維持在同一個水平。這個結果代表的意義就是RISPBA其實是樂透之神的傑作,是的,用中文說就是得點圈打率根本就是誰有拜媽祖誰就打得高。

 這個結論做出來之後,在棒球圈引起了很大的風暴。如果RISP是運氣的產物,那等於是說所謂的關鍵打者(Clutch Hitter)並不存在,只有關鍵安打(Clutch Hit) 才是有形有體的東西。我在ptt CCF 板上講到有關這個理論的時候,被拿出來質疑這個理論的人是Joe Carter,他的生涯成績如下︰

 http://www.sports-wired.com/players/profile.asp?ID=9693

 可以看看他在86年到97年這段時間的RBI 跟他的AVG ,對一個持傳統觀念的人來說,他簡直是神一樣的人物,用這樣的AVG 居然可以打出這樣的RBI ,除了說他很會打關鍵安打之外還能怎麼解釋?

 但事實上,當你檢視他這幾年AVG 的變化,相對於RBI 的變化的時候,會發現一點道理都沒有,譬如95年,他在558 個打數中打出141 支安打,只有76分打點,但是在90年,他在634 個打數中打出147 支安打,卻有115 分的打點,六支安打差了近四十分打點,而他95年不論是AVG 、OBP 還是SLG 都領先90年。如果光拿這兩年的Joe Carter來看,無疑95年的那個他是比較好的打者,但是他卻在只少了六支安打的情況下少了四十分的打點。誰能解釋這個情況呢?兩種可能是,要不就是90年當他上來打擊的時候前面總是有一堆跑者等著讓他清,要不就是95年他忘了去安太歲,偏偏這麼帶塞。

 有些人會把什麼打點的「能力」列為球員的標準配備,打點其實很可能只是一個「現象」而已,在發明出人間金手指可以查出人類的運氣值大小之前,打點的功用僅僅可以評估一個球員對於球隊的貢獻有多大,但是那並不表示作出這個貢獻是他的能力,Andre 舉過一個很好的例子︰「毛利新助殺了義元就代表毛利新助超強嗎 只不過他運氣好前面有服部小平太幫他犧牲觸擊給他打點機會而已。」

 其實以台灣職棒而言,你要說服一個人RISPBA沒有意義也不必這麼囉唆,很多球員一年遇到得點圈有人的打數不過幾十個,前面Grant44 講過,以一百個打數而言,只要多打五支安打RISPBA就是.250跟.300的差別,更何況是幾十個打數呢?拿著五十個打數的成績叫啊跳的,其實是非常沒有意義的事情。

 在這篇文章的初稿完成將近十個月後,我看到Bill James又寫了一篇文章在討論Clutch Hitter的問題。大意是說,儘管過去的研究從未找出任何穩定的Clutch Hitter,但是也有可能是這些研究資料的來源被污染過,或者他們使用的方法不夠好,不能貼近事實。

 Bill James認為Clutch Hitter可能是存在的,不過以大聯盟一年一百六十二場來講,Clutch Hitter能給予的幫助可能只是比起別人多了幾支長打而已,換句話說,同樣能力的兩個打者,具備或者不具備關鍵一擊的能力,一年打上五六百個打數下來,打點的差距可能只是區區幾分而已。即使以Bill James這篇幾近翻案的文章而言,用RBI來衡量一個球員依然是極為不公平的指標。

[數據] 怎麼看數字(2)─SLG, HR & IsoP

 全壘打(Homerun, HR) 在傳統的三項攻擊數據中似乎是存有價值還較高的一樣,主要是因為一個長打能力優異的球員通常全壘打也不會太少,所以我們可以將全壘打視為觀察長打能力的一個簡易指標。但是這個數字顯然太籠統又太不具體,全壘打非常容易被球場、風向、溼度等因素影響,而且最重要的是,光以全壘打來衡量長打能力,就很容易忽略其他的長打數字,像是二壘安打跟三壘安打。

 在了解長打能力之前,應該先要有一個概念,棒球攻擊面最重要的兩點就是上壘與推進,上壘我們在上一篇已經談過了,而這裡要談的長打能力則主要反映球員的推進能力。

 一般衡量長打能力的數字,會用長打率(Slugging Pecentage, SLG) 為主。SLG 的算是法總壘打數(TB)除以打數(AB),其實翻譯作長打率並不貼切,長打率字面上的解釋應該是「出現長打的機率」,但事實上,SLG 代表的意義應該是「每一次打擊可以貢獻幾個壘包」,由這個譯名的問題可以延伸出SLG 這個數字的盲點,譬如以下這兩個球員︰

 Player AB 1B 2B 3B HR AVG SLG
A 200 89 1 0 0 .450 .455
B 200 20 20 0 5 .225 .400
 很明顯的B 選手的長打能力比A 選手優異,但是當你光檢視SLG 的時候,會發現A 選手在這項數值上明顯勝過B 選手,其原因就是因為SLG 的分子是TB,TB當中包含了並非長打的一壘安打,所以對於一個很會打一壘安打的選手,SLG 往往失去了衡量長打能力的意義。(當然這是過度誇張的例子,但是意思就是這樣)

 彌補SLG 盲點的方法是使用IsoPow.(Isolating Power),它的算法很簡單,SLG 減掉AVG就是了。這個數字的意義在於扣除SLG 被AVG撐起的那一部份,得到的結果就是選手真正的長打數字。

 儘管SLG 有它的盲點,但是一般而言在意義上它的代表性仍然勝過IsoPow. ,嚴格來說要使用這兩個數字評斷選手的時候應該是不可以將它們分開的,但實際上像上面所舉的那個例子並不會常見,所以多數的情況SLG 已經能夠相當程度反映球員的長打能力。在現代棒球的討論中常常會看到這三個數字並列︰

 .233/.287/.355

 它的意思就是AVG/OBP/SLG,後面兩個數字的重要性前面已經講過,AVG仍然放在裡面,則是因為它簡單易懂:D,並且將它跟SLG 列在一起,可以讓人一眼看出這個球員SLG 是否被AVG撐起了大部分。

 在OBP 跟SLG 的觀念建立起來以後,又發展出了OPS(OBP Plus SLG) 的觀念,算法如同字面上的意義,就是OBP 直接加上SLG 。這個數字並沒有什麼深奧的道理,但是它可以簡單快速的衡量一個打者的優劣。後來又出現了許多種OPS*,主要著眼都是在傳統OPS 算法中,賦予OBP 跟SLG 的地位是相同的,但事實上OBP 代表的是打者避免出局的機率,這個數字應該要比較重要。所以有些人的OPS*是將OBP 乘上1.4 或者1.2 之後再加上SLG 。有的人則將OPS*再除以四,目的是讓得出來的數字比較貼近一般人對於攻擊指數高低的印象。舉例來說,一個OPS*1.432的打者跟1.677的打者,兩者間的差距有多大?如果不是看過大量的OPS*恐怕很難有個概念,但將這兩個數字除以四之後會比較貼近一般人所熟悉的範圍。

 用SLG 跟IsoPow. 去衡量一個打者的長打能力遠比使用全壘打有道理,而且信度也比較大。全壘打在比較兩個長打能力有明顯差異的球員時可以做簡單明瞭的判斷,但是當比較長打能力接近的球員的時候,並不具有太大的說服力。所以拿全壘打,或者HR/AB 來評斷廖敏雄、林仲秋或者謝佳賢誰的長打能力好是很無聊的事情,反而去比較SLG跟IsoPow.才比較有道理。

[數據] 怎麼看數字(1)─AVG,OBP & eye

 打擊率(Batting Average, AVG )在傳統數字中一向是最被看重的攻擊指標,但是在現代棒球,AVG已經不再佔有主流地位。AVG的算法是安打(H)除以打數(AB) ,這個數字的意義是一個球員在他面對投手的時候可以敲出安打的能力,但是它卻忽略了一個重要的指標,也就是保送。

 保送之所以被重視,是因為有些人開始用科學的方式檢視棒球的數字。一場比賽最珍貴的是什麼東西?除了選手自己的身家性命之外,僅僅有的二十七個出局數是棒球場上決勝的關鍵,出局數之於棒球就好比時間之於籃球、足球,所以怎樣利用出局數,就跟在籃球場上要怎樣掌握時間一樣重要。在這樣的思考邏輯下,保送作為一種打者可以掌握的上壘方式,這層意義上它的地位跟安打應該是相當的( 所謂打者可以掌握的方式,是相對不能掌握的,如失誤之類的上壘方式而言。) 所以取代AVG而在現代棒球中受到重視的指標,就是上壘率(On-Base Percentage, OBP),上壘率的算法是安打(H)加上保送(BB)除以打席(PA),所代表的意義很明顯,就是一個選手每一次上來,有多少機率靠著自己的能耐上到壘包。

 在凹保送的能力被重視之後,進一步發展出來的指標是plate discipline ,中文大概翻作「本壘板保護能力」,或者嫌它麻煩,姑且稱作選球也可以接受啦。這項能力之所以重要,可以從下面幾點分析︰

1.打擊狀況容易有高低潮,但是選球能力幾乎不會有起伏,所以假設有兩個打者︰
 Player A B
AVG 300 280
OBP 320 350

 在傳統的數字下,一般會認為A 是比較好的打者,但是事實上B 比A 還要不容易出局,他保護了球場上最珍貴的東西,並且當兩個人都在低潮的時候,B 由於選球能力沒有受到影響,所以他仍然能繳出比較好的成績。

2.選球能力幾乎等於是讓投手願意給你好球打的能力,我們可用一個很簡單的邏輯想像,如果一個打者沒有辦法分辨好壞球,做一個投手,你會丟好球讓他打,還是丟壞球讓他打也打不到、打也打不好?由這個面向去剖析,你會得到另外一個AVG之所以不可靠的結論,AVG可以被看作是「攻擊好球的能力」,所以一個越是能分辨好壞球的選手、越是等不到好球打的選手,AVG對他而言只是一個樣本數不足的情況下的結果。而我們知道當樣本數不足的時候,常常樂透之神會取代棒球之神決定一切,反而一個比較好的打者,有可能會被誤解成比較差的打者。

 一般來說,衡量選球能力主要用兩個數字,四壞球與打數比(BB/AB) 以及四壞球與三振比(BB/SO) 。BB/AB 的意義,就是一個打者靠著保送上壘的能力有多強,這個數字越高的打者,越不容易受到狀況高低潮的影響。

 BB/SO 有比較複雜的涵義,了解這個數字之前,必須先修正一個台灣職棒特有的觀念「先求打到球,再求打安打」,用這種觀念養出來的球員,在兵器譜上我們把他歸類在鳥打流,最近最紅的掌門人就是鍾教練重彩XD。所謂的Plate Discipline,最重要的就是要打者自己設定一個好球帶,哪些範圍內的球是要攻擊的,哪些範圍內的球是要放掉的─就算是好球也一樣。這麼做的原因在於,要擊出長打首要的任務就是揮擊動作要完整,為什麼鳥打打不出長打?任何握過球棒的都知道,當你隨時想著要因應來球去「碰」它的時候,是不可能將自己的力量釋放得多好的。在兩好球以前,有些人會放過自己不要的好球,就算因此球數落後也在所不惜。

 這樣的打者通常是所謂的slugger ,也就是強力打者,你可以想像這樣的打者當然容易被三振,但是相對來說投手對付他的時候也會盡量投些邊邊角角的球,所以也增加了他們被保送的機會。所以如果看一個slugger 只看他的三振,你會覺得他簡直應該丟回去打少棒,但是如果他的保送相對三振來說也相當多,那麼我們就不應該評價他的選球差,而是就他的Plate Discipline而言,他是一個成功的打者,他會被三振,但同時也讓人畏懼。很可惜台灣有這樣觀念的球迷還是教練都並不夠多,因此謝佳賢從未得到他應該有的尊重,他是Plate Discipline最好的中職打者,很多人光拿三振次數質疑他是非常搞不清楚狀況的。

 如果以擊球的心態設定來說,我們可以粗略將打者分成上述的slugger跟contact hitter。contact hitter的擊球策略就比較偏向會去「撥」球的那一種,但是那跟鳥打仍然是截然不同的兩回事。鳥打流視三振為十惡不赦的罪過,還要扣錢XD

 我這邊講的是以多數的情形而言,要找到可以供討論的反例個案其實不難,譬如有些人會因為長期的低潮而改變出棒的策略,從不會打壞球的球員變成愛打壞球的球員。這種例子常常是討論的話題,但是這邊我們只講個大約的輪廓,謝謝收看第一集。