正文

老化曲線與相似分?jǐn)?shù)(2)

信號(hào)與噪聲 作者:(美)納特·西爾弗


赫卡貝的系統(tǒng)則假定存在26條明顯的老化曲線,每一條都適用于不同類型的球員。如果他的假設(shè)是正確的,你就能評(píng)判出哪條曲線適合哪個(gè)球員,并以此預(yù)測(cè)出該球員職業(yè)生涯的走勢(shì)。如果一個(gè)球員符合鮑勃·霍納的老化曲線,那就預(yù)示著他會(huì)少年得志,但衰退期也會(huì)早早到來(lái);如果一個(gè)球員符合馬丁內(nèi)斯的老化曲線,那就預(yù)示著他將大器晚成。

在赫卡貝的“弗拉迪米爾”預(yù)測(cè)系統(tǒng)中,每個(gè)球員對(duì)應(yīng)著不同的曲線;而在詹姆斯創(chuàng)建的平緩的預(yù)測(cè)系統(tǒng)中,所有球員都對(duì)應(yīng)著同一條曲線。盡管如此,從赫卡貝發(fā)布的一些預(yù)測(cè)結(jié)果看,“弗拉迪米爾”系統(tǒng)的預(yù)測(cè)準(zhǔn)確度比詹姆斯的老化曲線高不了多少。預(yù)測(cè)準(zhǔn)確率不高,在一定程度上是因?yàn)楹湛ㄘ愒O(shè)定的26條曲線沒(méi)有科學(xué)依據(jù),只是隨意選定了這個(gè)數(shù)目。這樣一來(lái),為球員匹配曲線就成了一個(gè)科學(xué)和藝術(shù)并重的技術(shù)活。

然而,要將棒球隊(duì)員的技術(shù)水平發(fā)揮到較高的程度,一個(gè)人一定要對(duì)自己的身體技巧和精神技能進(jìn)行多種多樣的排列組合才行:肌肉記憶、體能耐力、手眼協(xié)調(diào)性、擊球速度、投球識(shí)別力以及失利時(shí)強(qiáng)大的意志力,這些因素都要科學(xué)合理地運(yùn)用。如此看來(lái),“弗拉迪米爾”預(yù)測(cè)系統(tǒng)關(guān)于不同老化曲線的概念貌似更符合人類行為固有的復(fù)雜性。在創(chuàng)立PECOTA預(yù)測(cè)系統(tǒng)時(shí),我盡量從詹姆斯和赫卡貝的系統(tǒng)中借鑒了一些元素來(lái)完善自己的預(yù)測(cè)系統(tǒng)。

在1986年的《摘要》中,詹姆斯介紹了“相似分?jǐn)?shù)”的概念。顧名思義,設(shè)計(jì)者設(shè)計(jì)了這些分?jǐn)?shù),用來(lái)對(duì)任意兩名大聯(lián)盟球員的職業(yè)數(shù)據(jù)的相似性進(jìn)行評(píng)定。這個(gè)概念比較簡(jiǎn)單。評(píng)定人員首先將兩名球員分為一組,每組賦值1 000分,每發(fā)現(xiàn)兩人之間的一次不同則扣若干分。結(jié)果,高相似度的組可得到950分甚至975分,但低相似度組的組員間的差異會(huì)迅速增大。

略懂棒球歷史的人都會(huì)發(fā)現(xiàn)相似分?jǐn)?shù)的方法很得人心,評(píng)定人員并沒(méi)有一門心思地只顧研究球員的統(tǒng)計(jì)數(shù)據(jù),而是提供了一定的歷史背景。例如,佩德羅亞在25歲時(shí)的數(shù)據(jù)與歷史上的很多球員相似,比如20世紀(jì)70年代統(tǒng)帥明尼蘇達(dá)雙城隊(duì)的隊(duì)長(zhǎng)、一個(gè)偉大的巴拿馬人羅德·卡魯,以及大蕭條時(shí)期老虎隊(duì)的明星查利·格林格。

詹姆斯主要是想用相似分?jǐn)?shù)進(jìn)行反向檢測(cè),比如分析一個(gè)球員是否有資格入選名人堂。如果想論證你最喜愛(ài)的球員是否夠資格入選庫(kù)佰斯頓球員名冊(cè),就可以借用相似分?jǐn)?shù)。若通過(guò)觀察你會(huì)發(fā)現(xiàn)已經(jīng)入選的球員中有9/10的人的數(shù)據(jù)和他的相似,你就得到了一個(gè)非常有力的論據(jù)。


上一章目錄下一章

Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)