正文

第1章 重要問題的取舍

數(shù)據(jù)科學(xué)家訪談錄 作者:[美] 單研(Carl Shan),陳子蔚(William Chen),汪強(qiáng)明(Henry Wang),宋邁思(Max Song) 著;田原,劉奕 譯


第1章 重要問題的取舍

RelateIQ產(chǎn)品部副總裁DJ Patil

DJ Patil是“數(shù)據(jù)科學(xué)家”這個(gè)術(shù)語的創(chuàng)造者之一,也是哈佛商業(yè)周刊文章《數(shù)據(jù)科學(xué)家:21世紀(jì)最誘人的工作》(Data ScientistSexiest Job of the 21st Century)的共同作者。

由于折服于數(shù)學(xué)的魅力,年輕時(shí)代的DJ在加利福尼亞大學(xué)圣地亞哥分校取得了數(shù)學(xué)學(xué)士學(xué)位,然后在馬里蘭州立大學(xué)取得應(yīng)用數(shù)學(xué)博士學(xué)位。在攻讀博士期間,他主要研究非線性動(dòng)態(tài)過程、混沌理論以及復(fù)雜系統(tǒng)。在進(jìn)入科技領(lǐng)域以前,他在氣象領(lǐng)域做了將近十年的研究工作,并且為美國國防部和能源部提供咨詢服務(wù)。在他的職業(yè)生涯中,DJ曾在eBay擔(dān)任首席架構(gòu)師和研究科學(xué)家職位,然后在LinkedIn擔(dān)任數(shù)據(jù)產(chǎn)品主管,正是在那段時(shí)光里,他與Jeff Hammerbacher一同創(chuàng)造了“數(shù)據(jù)科學(xué)家”這個(gè)術(shù)語,并且打造了一個(gè)出類拔萃的數(shù)據(jù)科學(xué)團(tuán)隊(duì)。他曾是RelateIQ公司產(chǎn)品部副總裁,RelateIQ是新一代基于數(shù)據(jù)科學(xué)開發(fā)的客戶關(guān)系管理軟件(customer relationship management software)。近期,RelateIQ公司因?yàn)槠涑霰姷臄?shù)據(jù)科學(xué)技術(shù)而被Salesforce.com收購。

在對(duì)他的訪談中,DJ將會(huì)談?wù)撟プr(shí)機(jī)的重要性,通過獨(dú)立學(xué)習(xí)、團(tuán)隊(duì)工作,激發(fā)興趣并回饋幫助過自己的社區(qū),以此不斷提高自己。

2015年,DJ被任命為美國歷史上第一位首席數(shù)據(jù)科學(xué)家。

您的演講中打動(dòng)了很多人的一部分內(nèi)容是您曾經(jīng)的失敗經(jīng)歷??吹较衲@么成功的人公然討論自己過往的失敗經(jīng)歷是挺讓人驚訝的。您能更多地告訴我們一些相關(guān)內(nèi)容嗎?

在初入職場(chǎng)的時(shí)候,很多人都在掙扎面對(duì)的一個(gè)問題是,如何才能正確地走進(jìn)這個(gè)領(lǐng)域的招聘市場(chǎng)。首先你要明白,當(dāng)你走進(jìn)去的時(shí)候,你必然已經(jīng)把自己放在一個(gè)特定的“盒子”里呈現(xiàn)到了大家面前,而大家一定程度上會(huì)根據(jù)你所在的“盒子”來評(píng)估你所擁有的技能。比如說,如果你以一個(gè)銷售人員的身份進(jìn)入了人才招聘市場(chǎng),大家就會(huì)默認(rèn)你尋求的是銷售職位;如果你以一個(gè)媒體人的身份進(jìn)入市場(chǎng),大家就會(huì)默認(rèn)你對(duì)媒體公司有興趣;如果你是生產(chǎn)產(chǎn)品的人,大家就會(huì)覺得你對(duì)于生產(chǎn)企業(yè)更感興趣。在這個(gè)時(shí)候,相比形形色色的很多“盒子”,一些特定的“盒子”就更容易讓你轉(zhuǎn)入或轉(zhuǎn)出相關(guān)的領(lǐng)域。

比如學(xué)術(shù)這個(gè)“盒子”就是一個(gè)非常不容易轉(zhuǎn)型的例子。因?yàn)轱@而易見,在大家的印象中,你就是一個(gè)擁有學(xué)術(shù)背景的人。你所面對(duì)的問題有:我在目前的情況下有什么出路?如何轉(zhuǎn)入其他的“盒子”里?我認(rèn)為這方面一個(gè)頗具挑戰(zhàn)的現(xiàn)狀就是,組織機(jī)構(gòu)和招聘人員更傾向于尋找與他們自己更類似的人。比如,在Ayasdi(一個(gè)拓?fù)錂C(jī)器學(xué)習(xí)公司)里,只有非常少量的數(shù)學(xué)家,卻有非常多的拓?fù)鋵W(xué)家。

對(duì)于大部分從學(xué)術(shù)界過來的人來說,招聘你就意味著公司可能需要在你身上冒一定的風(fēng)險(xiǎn),除非你跟他們中的很多人有過非常非常多的溝通交流。我花了6個(gè)月才獲得eBay的工作崗位。不要指望會(huì)有人在咖啡館發(fā)現(xiàn)你,走過來跟你說:“嗨,你好,我看到了你在餐巾紙上寫的那些東西,你一定是一個(gè)非常聰明的人!”工作不是這樣找到的,在你獲得機(jī)會(huì)之前,你必須要清楚地意識(shí)到,任何招聘你的人都是在你身上冒險(xiǎn)。

不要指望會(huì)有人在咖啡館發(fā)現(xiàn)你,走過來跟你說:“嗨,你好,我看到了你在餐巾紙上寫的那些東西,你一定是一個(gè)非常聰明的人!”工作不是這樣找到的,在你獲得機(jī)會(huì)之前,你必須要清楚地意識(shí)到,任何招聘你的人都是在你身上冒險(xiǎn)。

在你的求職過程中,你一定會(huì)失敗很多次,那是因?yàn)樗麄冏罱K不愿意在你身上下注。在很多公司惡狠狠地把職位的大門對(duì)你毫不留情地關(guān)上之前,估計(jì)你是不太可能找到一份稱心的工作的。并且,求職可不是你準(zhǔn)備一篇稿子,然后在每一次需要介紹自己的時(shí)候,千篇一律地講出來。而是需要你每一次都針對(duì)不同的聊天對(duì)象修改對(duì)自己的介紹和描述。其中的精髓正和做數(shù)據(jù)科學(xué)如出一轍,你需要不斷地在展示自己和研究如何展示自己之間反復(fù)循環(huán)。

最終,有人愿意試試聘用你了,但是當(dāng)你剛剛找到工作的時(shí)候,迎面而來的問題就是:如何在走進(jìn)公司以后盡快地讓自己的事業(yè)走上快車道?我認(rèn)為目前數(shù)據(jù)科學(xué)領(lǐng)域的一大優(yōu)勢(shì)就是它并沒有過于清晰的職位技能需求,所以很大一部分擁有偏才的人其實(shí)都是適合這個(gè)領(lǐng)域的。人們會(huì)說:“啊,你當(dāng)然可以成為一名數(shù)據(jù)科學(xué)家!也許你的編程功底不如軟件工程師那么出色,但是你研究問題以及運(yùn)用工具解決問題的能力是相當(dāng)出色的。”

公司里根本沒有人知道具體該使用什么工具來解決正在面對(duì)的問題,所以你必須去搞清楚,而這恰好給予了你足夠的自由度。一本還沒有開始動(dòng)筆的書,才有可能成為一本精彩的著作。

您能不能給我們一些起步的建議,例如您一開始在那個(gè)市場(chǎng)上是怎么做的,以及您如何想辦法弄清楚那個(gè)領(lǐng)域內(nèi)的“新人必知”之類的知識(shí)?新人如何在其中展現(xiàn)出自己的價(jià)值?

你首先需要做的就是,證明你可以完成一些任務(wù),然后證明你可以創(chuàng)造一些東西。

我曾經(jīng)讓我的每一個(gè)研究生都做如下的測(cè)試——當(dāng)我自己曾經(jīng)還是一個(gè)研究生的時(shí)候,我經(jīng)常在我的公寓附近散步并且喃喃自語:“我想要成為一個(gè)數(shù)學(xué)家。當(dāng)我說‘?dāng)?shù)學(xué)家’的時(shí)候,它對(duì)我來說意味著什么?什么是每一個(gè)數(shù)學(xué)家都應(yīng)該知道的事情?”

當(dāng)我還是研究生的時(shí)候,我就是這樣做的,然而經(jīng)過一段時(shí)間的思考,我卻得到了各種不同的結(jié)論。天知道我該怎么辦!根本沒有人對(duì)于數(shù)學(xué)家有一個(gè)很明確的定義?。〉俏矣X得,一定還是應(yīng)該有一些基準(zhǔn)吧,畢竟都是過來人(數(shù)學(xué)家),對(duì)于一些問題還是應(yīng)該有一些共識(shí)的。在思考了一段時(shí)間之后,我大概總結(jié)出了3~4個(gè)針對(duì)這些問題的不同觀點(diǎn)和結(jié)論。而這其中,我覺得最重要的結(jié)論,就是那種讓你在一個(gè)糟糕的想法上最終遭受失敗以后,還能有機(jī)會(huì)轉(zhuǎn)行到其他領(lǐng)域的結(jié)論。

基于上述的想法,我開始上大量形形色色的推公式的課程以及一堆概率統(tǒng)計(jì)課,盡管后者其實(shí)并不是我的研究方向。我給學(xué)生上課,我也知道如何編程,我曾經(jīng)學(xué)過很多物理學(xué)知識(shí)——總而言之,我做每一件事的目的,就是希望它能給我?guī)砀鼜V闊的眼界和出路。

很多學(xué)術(shù)界的人技能都過于單一,只專注于特定的問題和緯度。他們并沒有證明他們有能力創(chuàng)造任何東西,只是在不斷證明他們可以學(xué)會(huì)一些沒人關(guān)心的東西(除了他們的導(dǎo)師以及他們實(shí)驗(yàn)室過往兩屆的學(xué)生們)。在我眼里,這是不對(duì)的。其實(shí)在那一段時(shí)間里,你可以同時(shí)搞定你的博士研究課題,并且學(xué)會(huì)其他的一些技能。

你首先需要做的就是證明你可以完成一些任務(wù),然后證明你可以創(chuàng)造一些東西。

比如說,除了在實(shí)驗(yàn)室的時(shí)間,你可以出去走走,多跟人交流,去參加一些課程充電,參加黑客馬拉松活動(dòng),以及學(xué)習(xí)如何制作一些東西。正如我們絕對(duì)不會(huì)跟一個(gè)人說“你必須先學(xué)會(huì)做科研,然后再去學(xué)怎么跟人交流”一樣。這些事情本應(yīng)該是同時(shí)發(fā)生的,并且彼此相互協(xié)同促進(jìn)。

所以我的論點(diǎn)就是,現(xiàn)在的科研人員完全不知道如何去創(chuàng)造一些東西。在你學(xué)會(huì)如何創(chuàng)造東西以后,你還需要學(xué)會(huì)如何講故事,這樣才能告訴大家你為什么想要做這個(gè)東西。

還有另一件學(xué)術(shù)界的人非常不擅長的事情。他們很喜歡滔滔不絕地說話,而不是靜靜地聆聽你的需求,所以他們不太擅長傾聽別人的問題在哪里。在學(xué)術(shù)界,你需要做的第一件事就是關(guān)上門,靜靜地坐在自己的桌子前。但是硅谷是沒有門的!一旦走進(jìn)企業(yè)界,你就好比走到了空曠的空地上一樣。在第一次聽到別人告訴他們“不,你必須要工作、合作、交流、溝通、競(jìng)爭(zhēng)、辯論,而不是躲在門或者辦公桌的背后”的時(shí)候,這些人往往都是一臉的震驚。

我覺得這正是學(xué)術(shù)界的不足之處:對(duì)這些方面的訓(xùn)練太少了。他們幾乎沒有機(jī)會(huì)參與團(tuán)隊(duì)合作,或者以小組的形式工作。

相反,現(xiàn)在的本科教育正在經(jīng)歷巨大的轉(zhuǎn)變。如果我們比較一下過去幾年和現(xiàn)在的大學(xué)里黑客馬拉松、合作、小組項(xiàng)目一類的數(shù)量,我們就會(huì)發(fā)現(xiàn)轉(zhuǎn)變的趨勢(shì)。本科教育確實(shí)正在把學(xué)生訓(xùn)練成非常適合工作的一類群體。碩士生也有一些類似的機(jī)會(huì),但是博士是幾乎沒有的。我覺得這種情況的原因主要是很多學(xué)者更愿意把學(xué)生訓(xùn)練成重復(fù)性的科研勞工,而不是設(shè)身處地為學(xué)生著想,讓他們變得更適應(yīng)社會(huì),并且給他們選擇自己人生路線的更多機(jī)會(huì)。

學(xué)術(shù)界的項(xiàng)目合作與業(yè)界的相比有哪些不同?

人們錯(cuò)就錯(cuò)在總是會(huì)忘記數(shù)據(jù)科學(xué)其實(shí)是一個(gè)團(tuán)隊(duì)游戲。人們可能會(huì)指著我、Hammerbacher以及Hillary或者Peter Norvig這樣的人驚叫:天吶,快看,是他們!這是完全不對(duì)的,沒有任何一個(gè)數(shù)據(jù)科學(xué)家可以為自己的成就獨(dú)自邀功。數(shù)據(jù)科學(xué)是一個(gè)團(tuán)隊(duì)游戲,必然需要有些人去把數(shù)據(jù)收集到一起,有些人去轉(zhuǎn)移這批數(shù)據(jù),有些人來分析它們,有些人來把分析的結(jié)果和想法大聲地告訴世界。

人們錯(cuò)就錯(cuò)在總是會(huì)忘記數(shù)據(jù)科學(xué)其實(shí)是一個(gè)團(tuán)隊(duì)游戲。

如果沒有Facebook核心團(tuán)隊(duì)其他成員的幫忙,Jeff絕對(duì)不可能做出他的畢生成就,而那個(gè)團(tuán)隊(duì)也是他協(xié)助創(chuàng)建的。我的工作依賴于其他非常非常多的人的幫助,這一點(diǎn)對(duì)于任何人都是相同的!因?yàn)樽鰯?shù)據(jù)科學(xué)與搞科研其實(shí)是非常類似的。人們總是看到數(shù)據(jù)科學(xué)家獨(dú)來獨(dú)往地工作,這是完全錯(cuò)誤的表述,更多的原因估計(jì)是現(xiàn)在媒體以及其他方面的錯(cuò)誤解讀。

您認(rèn)為現(xiàn)在有沒有可能存在一種趨勢(shì),就是有些人在數(shù)據(jù)科學(xué)領(lǐng)域工作了一些年,然后把這其中的技能轉(zhuǎn)而用于其他的行業(yè)和領(lǐng)域,比如市政學(xué)、教育學(xué)或者健康領(lǐng)域?

我覺得這樣的趨勢(shì)正在開始,而且我希望這樣的轉(zhuǎn)變會(huì)發(fā)生。Datakind就是其中的一個(gè)例子,同樣Social Good的數(shù)據(jù)科學(xué)方向也正是如此。而且這其中有一個(gè)讓我非常揪心的公司叫Crisis Text Line。它是從DoSomething.org這個(gè)公司分出來的——他們做的事情是非常聰明地將自然語言文本技術(shù)用于避免自殺行為的電話干預(yù),在公司的產(chǎn)品結(jié)果中,那些算法分析出的與自殺有關(guān)的文字看上去實(shí)在是非常令人心痛。

在從這些人的信息中分析出有關(guān)自殺原因的一些非常悲慘的語句的時(shí)候,他們馬上就會(huì)被電話聯(lián)通?,F(xiàn)在社會(huì)很多年輕人很少通過聲音來彼此溝通——打電話說話其實(shí)很困難,而發(fā)文字信息卻容易很多。通過Crisis Text Line技術(shù)分析得到的往來于受困、需要幫助的人和那些愿意提供幫助的人之間的信息量巨大得驚人。

我們是如何做到的?這一切背后的原理是什么?該產(chǎn)品背后有一群非常聰明的數(shù)據(jù)科學(xué)家坐鎮(zhèn),他們一直致力于研究完善該系統(tǒng),就因?yàn)楫a(chǎn)品的目的是幫助那些深陷泥潭的年輕人。現(xiàn)在,我們的身邊有非常多的新興科技,使得我們可以輕松地完成很多五六年前需要耗費(fèi)巨資和重大科研設(shè)備才能實(shí)現(xiàn)的任務(wù)。今天,我們可以輕松地選擇我們喜歡的工具做任何想做的事情。

這些人做的事情是非常了不起的。換言之,他們一直在節(jié)約我們所有人的時(shí)間。這個(gè)公司背后那一套復(fù)雜精巧的運(yùn)行系統(tǒng),完全可以與其他許多龐大知名而且資金充足的大機(jī)構(gòu)相匹敵。他們能做到,就是因?yàn)樗麄兇_實(shí)是這方面的行家里手。他們能玩轉(zhuǎn)這些技術(shù),并且他們有足夠聰明的大腦。正在有越來越多的人希望貢獻(xiàn)自己的技術(shù),加入他們的團(tuán)隊(duì),去幫助他們把這件事情做得越來越好。我們并不覺得這僅僅是數(shù)據(jù)科學(xué)這一個(gè)領(lǐng)域的事情,而是一個(gè)非常開放普及的事業(yè)。這么多的技術(shù)專家甘愿投身于這個(gè)項(xiàng)目并幫助他們的原因,就是因?yàn)檫@件事情非常偉大而且有意義。

Jennifer Aaker最近剛剛在《紐約時(shí)報(bào)》上發(fā)表了一篇文章,主題是千禧年那一代人比起他們的祖輩,做事情有更強(qiáng)的目標(biāo)性。他們以助人為快樂之本。我認(rèn)為這個(gè)社會(huì)正在發(fā)生一些根本上的轉(zhuǎn)變。主導(dǎo)我們這一代人的情結(jié)是同情,主導(dǎo)你們這一代人的情結(jié)是扶助。同情僅僅意味著去理解他人的痛苦,而扶助意味著真正地幫助別人走出困境,根本性地去解決問題。從數(shù)據(jù)科學(xué)的視角上來說,這樣的細(xì)微轉(zhuǎn)變就類似于,以往的數(shù)據(jù)科學(xué)只能以圖像的形式向你展現(xiàn)出問題和數(shù)據(jù),而現(xiàn)今的數(shù)據(jù)科學(xué)是通過鞭辟入里的分析得出結(jié)論,并告訴你可以采取什么行動(dòng)。這絕對(duì)是質(zhì)的飛躍。

對(duì)于開發(fā)一個(gè)簡潔漂亮的產(chǎn)品來幫助減輕他人的痛苦來說,同情心確實(shí)是非常重要的。您平時(shí)在工作和產(chǎn)品開發(fā)中最看重的品質(zhì)是什么?比如對(duì)于數(shù)據(jù)的解讀能力?

我認(rèn)為人們經(jīng)常沒有意識(shí)到的一個(gè)問題是:很多選擇從事或者研究非常難的問題的人,本身已經(jīng)擁有非常強(qiáng)的技術(shù)背景。

我用Electronics的Fry舉一個(gè)例子。John Fry是Electronics公司的創(chuàng)始人,他同時(shí)也是一位數(shù)學(xué)家。他在Morgan山為一個(gè)數(shù)學(xué)學(xué)會(huì)建造了一座城堡。他對(duì)于數(shù)學(xué)的熱情可見一斑。然后我們可以看看Netflix的Reed Hastings,他也是一位數(shù)學(xué)家。我的父親以及他那個(gè)時(shí)代的很多老一輩硅谷精英,都曾經(jīng)是計(jì)算機(jī)核心硬件方面的科學(xué)家。這樣的例子數(shù)不勝數(shù),我只是想說明,如果你去花力氣了解每一個(gè)這樣的地方,你都會(huì)找到很多難以想象的故事。

公司里有兩樣事情是非常吸引我的:第一個(gè)是你可以從頭開始做一些東西,第二個(gè)就是我們的目的是開發(fā)一個(gè)實(shí)實(shí)在在的產(chǎn)品。為什么這兩點(diǎn)很重要?因?yàn)槿绻阋獎(jiǎng)?chuàng)建一個(gè)公司,你必然需要產(chǎn)品,而如果你需要產(chǎn)品,你就必然要想辦法把它們做出來。我指的就是在物理意義上把一個(gè)東西從無到有地創(chuàng)造出來。下面的問題就來了:你要怎么做這個(gè)產(chǎn)品?你可以依據(jù)自己的擅長和偏好,選擇任何你喜歡的工具來做。另外,現(xiàn)在人們經(jīng)常說的市場(chǎng)調(diào)查也是很重要的,你可以做一個(gè)詳細(xì)的市場(chǎng)調(diào)查,找到現(xiàn)在市場(chǎng)上的不足和缺漏,然后把它作為目標(biāo)。

有市場(chǎng)類的產(chǎn)品,意思就是你創(chuàng)造一些東西,然后把它們投放到讓人們?nèi)呵榧ぐ旱氖袌?chǎng)上,市場(chǎng)是自己會(huì)發(fā)生效應(yīng)的。也有工程類的產(chǎn)品,它們會(huì)讓人們驚訝——你會(huì)覺得它背后的工程技術(shù)是如此精巧、非常了不起,以至于根本沒有人能理解它背后的運(yùn)作機(jī)制,這樣的產(chǎn)品就是這么出色而純粹,這就是純工程產(chǎn)品。也有設(shè)計(jì)類的產(chǎn)品,它們往往是非常漂亮的東西。當(dāng)然,也有數(shù)據(jù)類的產(chǎn)品。

我最喜歡的人都需要理解兩樣?xùn)|西,缺一不可。一個(gè)是用戶體驗(yàn)(user experience),另一個(gè)是數(shù)據(jù)。為什么偏偏是這兩樣呢?很多人說他們只擅長其中的一樣,我完全不認(rèn)同這樣的結(jié)論,因?yàn)榻鉀Q數(shù)據(jù)問題的最好方法恰好就是用戶體驗(yàn)。有時(shí)候,你可以通過簡單而獨(dú)具匠心的數(shù)據(jù)分析來聰明地解決一個(gè)用戶體驗(yàn)上的難題。

鑒于這個(gè)時(shí)代事物轉(zhuǎn)變得如此快速,我們最應(yīng)該培養(yǎng)自己的地方,就是讓自己多元全能。

比如說,“你認(rèn)識(shí)的人(People You May Know)”(LinkedIn公司的連接社交圖譜的工具)就是使用數(shù)據(jù)解決了現(xiàn)實(shí)中的設(shè)計(jì)問題的一個(gè)經(jīng)典案例。你加入那個(gè)網(wǎng)站,然后網(wǎng)站就會(huì)在你登錄的時(shí)候自動(dòng)給你推薦你可能認(rèn)識(shí)的人。但是如果“你認(rèn)識(shí)的人”的推薦結(jié)果太好了,可能會(huì)讓人覺得毛骨悚然,盡管其實(shí)那只是基于一個(gè)叫作Triadic closing的算法計(jì)算出來的結(jié)果。人們會(huì)問“你是怎么知道我們之間的關(guān)系的?我們才剛剛見過面而已!”而回答這類問題的答案就是“你們倆都認(rèn)識(shí)Jake”,這下就一目了然了。就是這樣一個(gè)簡單的設(shè)計(jì),成功解決了一個(gè)數(shù)據(jù)問題。我的信條就是,你把兩個(gè)簡單的東西放在一起,它們可能會(huì)創(chuàng)造一個(gè)新的世界。

另一個(gè)問題就是:你如何讓自己多元全才?你如何讓別人也成為多面手,能夠適應(yīng)多種多樣的工作和任務(wù)?我之所以這么問,是因?yàn)橄啾扔趶那埃覀冞@個(gè)時(shí)代改變得越來越快?,F(xiàn)在的東西淘汰的速度是非常驚人的。當(dāng)我為eBay工作的時(shí)候,那是一個(gè)激情澎湃的地方,但是現(xiàn)在eBay已經(jīng)在轉(zhuǎn)型。雅虎曾經(jīng)像猛犸象一般堅(jiān)不可摧,但是現(xiàn)在也在每況愈下。我們已經(jīng)見證了太多公司的興衰起伏。

我見過太多的市值幾十億美元的公司起起落落。這是一個(gè)劇變迭起的年代。想想微軟,十年前它是多么輝煌而不可一世?顯而易見,它已經(jīng)今非昔比了。

鑒于這個(gè)時(shí)代事物轉(zhuǎn)變得如此快速,我們最應(yīng)該培養(yǎng)自己的方向,就是讓自己多元全能。我想我們也同樣應(yīng)該認(rèn)識(shí)到,接觸不同的事物能讓人有多元的視角。正如現(xiàn)在的數(shù)據(jù),這方面的人才太稀缺了。不過人們正在意識(shí)到這樣的轉(zhuǎn)變正在發(fā)生?,F(xiàn)在這個(gè)時(shí)代,懂?dāng)?shù)據(jù)科學(xué)的人實(shí)在是優(yōu)勢(shì)太大了。

您曾經(jīng)說過,在曾經(jīng)希望成為一名數(shù)學(xué)家的時(shí)候,您盡力地讓自己對(duì)于生活的選擇權(quán)更多更大。那么作為一名數(shù)學(xué)科學(xué)家,您認(rèn)為應(yīng)該學(xué)習(xí)哪些技術(shù)來讓拓寬自己的眼界以及讓自己多元全能?

我認(rèn)為數(shù)據(jù)科學(xué)給了我們一個(gè)得以接入不同行當(dāng)?shù)慕^好入口。其性質(zhì)就像是你坐在中間,周圍的很多產(chǎn)業(yè)生意都圍繞著你,但是你必然也需要花力氣去研究這些不同的領(lǐng)域,去了解其他人在做什么,以及思考如何可以把你的所學(xué)用在這些領(lǐng)域。換言之,你永遠(yuǎn)在不停地努力學(xué)習(xí),而不是躺在板凳上吃“鐵飯碗”。所以你必然需要花很多時(shí)間去了解這些其他的領(lǐng)域,而這最終會(huì)給你帶來變化。

我經(jīng)常告訴新入行加入公司的年輕數(shù)據(jù)科學(xué)家的一件事就是,他們最好是每天最早到公司但是最晚離開的人。

我認(rèn)為現(xiàn)在很多人都無法清楚地看到數(shù)據(jù)科學(xué)這一項(xiàng)工作需要耗費(fèi)多少力氣。比如RelateIQ這個(gè)公司,我是公司產(chǎn)品部的一員(雖然他們說我是他們的頭,但是我覺得這是一個(gè)團(tuán)隊(duì)事業(yè),所以我更認(rèn)同我和他們是平等的),我經(jīng)常每周工作超過100個(gè)小時(shí)。如果我有更多時(shí)間,我會(huì)花更多的時(shí)間在里邊。我認(rèn)為人們很難意識(shí)到這背后需要花費(fèi)多少時(shí)間去溝通交流。無論你有多資深,或者你技術(shù)有多好,你都需要花費(fèi)這些時(shí)間去做這項(xiàng)事業(yè)。

你不要覺得我說的是現(xiàn)在社會(huì)上流行的那個(gè)10000小時(shí)理論(我根本就不相信那個(gè),因?yàn)槲矣X得它完全就是錯(cuò)的,它默認(rèn)大家的學(xué)習(xí)效率是線性的,而沒有考慮也許可以通過并行學(xué)習(xí)來加速這個(gè)過程)。我的意思是你需要花費(fèi)很多時(shí)間來學(xué)習(xí)很多相互獨(dú)立、看似不相關(guān)的事情,并最終把它們拼湊在一起。就像是燉湯,燉一鍋好湯的秘訣就是四個(gè)字——“歷久彌香”。

我經(jīng)常告訴新入行加入公司的年輕數(shù)據(jù)科學(xué)家的一件事就是,他們最好是每天最早到公司但是最晚離開的人。如果這意味著你每天只能睡4~5個(gè)小時(shí),你只能去習(xí)慣它。這樣的生活至少要持續(xù)6個(gè)月甚至于一年多。

這就是你如何加速你的學(xué)習(xí)曲線。一旦你入門了,你就可以到達(dá)與人交流的階段。在這個(gè)階段,你可能需要經(jīng)常與人交流到凌晨兩點(diǎn)。你會(huì)精疲力竭,和你溝通交流的人也同樣疲憊不堪。你的所有情感防線都將會(huì)崩塌。而這個(gè)時(shí)候,就意味著你上道了。這其實(shí)就是為什么美國海軍陸戰(zhàn)隊(duì)有著地獄一般的青訓(xùn)。他們?cè)诿恳粋€(gè)士兵的起步階段就把他們放在了地獄一般的生存環(huán)境中。因?yàn)槿绻谡鏄寣?shí)彈的時(shí)候才把未經(jīng)世事的士兵投入戰(zhàn)場(chǎng),那就意味著讓他們?nèi)ニ退?。在上?zhàn)場(chǎng)之前就讓他們經(jīng)歷痛苦,可以迫使他們團(tuán)結(jié)努力,讓他們?cè)谖磥淼恼鏄寣?shí)彈面前可以團(tuán)結(jié)彼此依賴對(duì)方,然后齊心協(xié)力增加他們?cè)谡嬲膽?zhàn)火面前的生存概率。所以,在實(shí)戰(zhàn)里面學(xué)習(xí)是不行的,必須要在上戰(zhàn)場(chǎng)之前就學(xué)好。

這就是我對(duì)于全球所有尖端數(shù)據(jù)科學(xué)公司或者研究所中的人的看法。他們所有人都比我努力十倍以上,因?yàn)檫@是唯一的出路。他們就是這樣一遍一遍不斷地磨礪自己的能力的,這就是為什么他們?nèi)绱藘?yōu)秀。

您認(rèn)為是否有某些日復(fù)一日的習(xí)慣和堅(jiān)持,讓您最終成為一名如此優(yōu)秀的數(shù)據(jù)科學(xué)家?

你看孩子在繞著一條跑道瘋跑,他的父母想要走了,孩子總是央求他的父母:“再讓我跑一次!再讓我跑一次!”但是你再看那些在敲打筆記本鍵盤的成年人,他們滿腦子都是抱怨:“我還要再做這樣的事情多少次?”

這么說吧,我從來不覺得我們?nèi)祟愂菬o所不知的。我也從來都覺得我們的數(shù)據(jù)還不夠多。另外,我也覺得我們對(duì)于做得好的事情和做得不好的事情還沒有足夠清晰的認(rèn)識(shí)。我說這些話的原因就是,針對(duì)你的問題,我們當(dāng)然可以說肯定是有一些事情是增加了某個(gè)人事業(yè)的成功的可能性的。這不僅是在數(shù)據(jù)科學(xué)領(lǐng)域,在所有領(lǐng)域都是。這些品質(zhì)就有很多了,從認(rèn)真傾聽他人,到做一個(gè)團(tuán)隊(duì)合作者,小到出門撿垃圾,再到認(rèn)真陪孩子做每一個(gè)游戲,不浪費(fèi)食物,以及做事情重視團(tuán)隊(duì)利益而不僅是自身利益。當(dāng)然,還有一絲不茍地完成自己的任務(wù),不辜負(fù)任何人和任何任務(wù)。

在做這些事情的時(shí)候,你要想象總是有一個(gè)客戶在你面前(他其實(shí)可以是任何人,外在的,或者你自己想象的)。我認(rèn)為,這就是讓自己進(jìn)步的絕好辦法。除了上述的這些常規(guī)小事,我覺得還有一些很重要的素養(yǎng)應(yīng)該強(qiáng)調(diào)一下——講故事的能力和敘事能力。另外,永遠(yuǎn)不要丟掉內(nèi)心里的激情和好奇心。

我覺得那些投身于科研領(lǐng)域的人是非常有激情的。是否記得你曾經(jīng)聽課時(shí)學(xué)到的一些東西引得你大叫“酷!這個(gè)腦洞開得太大了!”?是否記得你曾經(jīng)在大學(xué)里說“該死!我怎么就沒預(yù)見到這件事情呢?”的時(shí)候?為什么我們要丟掉那個(gè)時(shí)候的澎湃激情呢?

這是完全可以類比的。你看孩子在繞著一條跑道瘋跑,他的父母想要走了,孩子總是央求他的父母“再讓我跑一次!再讓我跑一次!”但是你再看那些在敲打著筆記本鍵盤的成年人,他們滿腦子都是抱怨:“我還要再做這樣的事情多少次?”他們總是在數(shù)著分秒地盼著下班回家,而不會(huì)激動(dòng)地說“這個(gè)東西太棒了!”

我覺得每一次人們從孩子長大成為我剛才說的后一種人的時(shí)候,他們內(nèi)心的一些東西已經(jīng)丟失掉了。你們一定要努力用那些曾經(jīng)讓你瘋狂激動(dòng)的東西重新填滿你的生活和內(nèi)心。再多交流一次,再多努力一次,再來一次。如果你能找到這樣的感覺,那你已經(jīng)相當(dāng)不容易了。如果你的生活中圍繞著你的人都是這樣的雞血滿滿,每天給你帶來無止境的新信息、新故事,那么你已經(jīng)非常幸運(yùn)了。

所有的學(xué)習(xí)都是一樣的嗎?作為一名年輕的數(shù)據(jù)科學(xué)家,您能給比自己更博學(xué)的前輩長者們帶來什么價(jià)值?

知識(shí)和智慧是不一樣的。我認(rèn)為這正是學(xué)術(shù)界長期在面對(duì)的一個(gè)經(jīng)典問題。一個(gè)高中生可以比一個(gè)算法博士更好更快地寫一個(gè)手機(jī)軟件,這是因?yàn)槟莻€(gè)高中生的知識(shí)恰好在手機(jī)軟件領(lǐng)域。而智慧是另一件事:比如你在研究一個(gè)非常艱深的學(xué)術(shù)問題,經(jīng)過經(jīng)年的研究學(xué)習(xí),然后最后你宣布:“這個(gè)東西的算法復(fù)雜度是O(n2)”。

我覺得我本人是非常幸運(yùn)的,在初入eBay的時(shí)候,我恰巧在一個(gè)擁有非常多的智慧的小組。盡管我們小組所參與的項(xiàng)目在eBay這個(gè)公司里進(jìn)展緩慢,但是我身邊的人真的擁有非常多的智慧可以分享,所以當(dāng)時(shí)我真的是小組里最傻的人,當(dāng)然,我也有最輕最少的任務(wù)。但即便如此,我也為那個(gè)團(tuán)隊(duì)貢獻(xiàn)了我自己的能量,因?yàn)槲铱梢钥吹絼e人看不到的東西。所以在生活中,我們需要找到哪里有智慧存在而哪里沒有。

另一個(gè)對(duì)我有重大影響的公司是LinkedIn,在那里我與公司一同經(jīng)歷了一段指數(shù)級(jí)增長的進(jìn)步曲線。人們會(huì)說,“你僅僅在那個(gè)公司待了三年半而已”,但是恰好就是我在的那幾年,LinkedIn公司的員工數(shù)從幾百人激增到了幾千人。在一個(gè)快速發(fā)展崛起的公司工作是很容易給你帶來相當(dāng)?shù)闹腔鄣?,我覺得這就是所謂的“量變引起質(zhì)變”。

現(xiàn)今的很多年輕人都在知識(shí)和智慧上遇到很多問題。他們經(jīng)常會(huì)問自己:我是應(yīng)該做那些我最感興趣而且有非常強(qiáng)烈的激情的事情呢,還是做那些馬上能給我?guī)磉M(jìn)步的事情?我是應(yīng)該加強(qiáng)特定方面的技術(shù)知識(shí)呢,還是應(yīng)該更多地增加針對(duì)特定領(lǐng)域的宏觀智慧?

這是一個(gè)不斷重現(xiàn)江湖的難題。我個(gè)人算是曲線解決了這個(gè)問題:我永遠(yuǎn)去接納我的那個(gè)地方去。我的意思就是:無論你去哪里,記得要跟最優(yōu)秀的人在一起。

我是學(xué)徒文化的堅(jiān)定擁躉。我是非常幸運(yùn)的,因?yàn)槲耶?dāng)時(shí)有機(jī)會(huì)與James Yorke一同共事,他提出了“混沌理論”。我經(jīng)常和塞吉·布林的父親在一起。我總是和很多非常出色的人在一起,而他們與我的交流對(duì)話是對(duì)我人生產(chǎn)生最重要影響力的東西。我真的覺得能和他們有過交集是我人生一大幸事。和Reid Hoffman、Jeff Weiner這樣的人在一起絕對(duì)能讓你變得優(yōu)秀,并且你能從中學(xué)到很多智慧。

這就是我的答案。如果你要去跟一些在Google公司工作的頂尖人才共事,好極了!如果你要去跟教育系統(tǒng)中一些非常優(yōu)秀的人才共事,好極了!只需要確保無論自己去哪里、做什么,都可以讓自己獲得盡量多的進(jìn)步就行了。你的人生坐標(biāo)最好時(shí)刻指向那個(gè)時(shí)候?qū)δ銇碚f最好的方向。記住人生努力的方向是非常重要的。

您是如何面對(duì)風(fēng)險(xiǎn)的?您又是如何識(shí)人的?

每一個(gè)人都需要寫就自己的人生。我唯一確定的事情就是,作為一個(gè)個(gè)體,你一定要不斷地問自己問題,然后通過問問題和解答問題,你才能慢慢勾勒出最適合自己的故事輪廓。如果你的人生故事寫錯(cuò)了,那你就有責(zé)任自己把故事寫回來。一句話,如果你不喜歡自己正在做的事情,那就想辦法改變它。

如果你的人生故事寫錯(cuò)了,那你就有責(zé)任自己把故事寫回來。一句話,如果你不喜歡自己正在做的事情,那就想辦法改變它。

這一切也許不容易,看起來不體面,會(huì)給你帶來很多痛苦,但事實(shí)是,在你年輕的時(shí)候做這樣劇烈的轉(zhuǎn)變是可以接受的,這總比你老了以后重頭再來要好得多。我現(xiàn)在已經(jīng)無法完成我曾經(jīng)完成過的成就中的哪怕一半了,而且我真的很嫉妒那些年輕力強(qiáng)的人。但這就是生活,在你有了家庭責(zé)任或者開始養(yǎng)育下一代的時(shí)候,你就無法再像從前那樣無所不能了。你的父母?jìng)冊(cè)谝粋€(gè)小城里度過了他們?nèi)松^大部分的時(shí)光,抑或一些頂級(jí)高校的教授也一樣,他們幾乎不需要考慮這些事情,也無須思索這背后的風(fēng)險(xiǎn)和艱辛。

這就是你可以發(fā)力的地方。這也是單打獨(dú)斗和團(tuán)隊(duì)合作之間的區(qū)別所在。生活中你并不總是可以做自己想要做的事情。這也是我并不那么非常精于技術(shù)的原因,至少相比于Monica Rogati和Peter Skomoroch這兩位LinkedIn的杰出數(shù)據(jù)科學(xué)家和工程師來說我的技術(shù)不那么厲害。那么我大部分的時(shí)間用來做什么了呢?想辦法和他們競(jìng)爭(zhēng)?去堵死他們的路?然后也和他們一樣花大量的時(shí)間去調(diào)試程序?qū)懘a嗎?

我做的事情,其實(shí)也是我所在的職位對(duì)我這項(xiàng)工作的要求,就是幫助別人移除他們前進(jìn)道路上的障礙。我的工作就是開辟一條康莊大道,然后讓別人在上邊順利快捷地完成工作。而他們做得確實(shí)非常好。

您曾經(jīng)談到過,您視自己的研究工作為一項(xiàng)回饋大眾的行為。那么現(xiàn)今這個(gè)社會(huì),有沒有一些您覺得可以通過數(shù)據(jù)科學(xué)家的杰出才華來實(shí)現(xiàn)進(jìn)步和提升的領(lǐng)域?

做事一定要從簡單的做起,然后慢慢做一些復(fù)雜而且艱難的事情,那個(gè)時(shí)候你才有辦法解決那些復(fù)雜的事情。

我覺得我們可以從組成社會(huì)的每一個(gè)小的元素著手分析這個(gè)問題。Crisis Text Line所在的領(lǐng)域就是其中至關(guān)重要的一個(gè),這也是我為什么在它身上投入了這么多的精力和時(shí)間。當(dāng)然還有其他的很多方面:國家安全、基礎(chǔ)教育、政府、為美國編程項(xiàng)目(Code for America)。我環(huán)視我們當(dāng)今的環(huán)境,想要去理解氣候,想要了解很多很多的東西。我真的很希望我們可以攻克那些難題。

通過傳統(tǒng)的方法,想要找到一條合適的切入這些難題的路徑并不是一件容易的事情,因?yàn)槿绻x擇的方向不慎,機(jī)遇的大門就可能關(guān)閉。但是數(shù)據(jù)很有魅力的一點(diǎn)就是,通過它,我們可以有很多種打開一個(gè)問題大門的方式。我醉心于研究氣候就是因?yàn)槟莻€(gè)領(lǐng)域有數(shù)據(jù)。我對(duì)自己說:“我能做到!”最終,我可以說,我成為數(shù)據(jù)科學(xué)家的起點(diǎn),就是下載了那一批瘋狂的數(shù)據(jù),然后在我的公寓里開始著手分析他們。那一批數(shù)據(jù)讓我有可能成為氣象領(lǐng)域的專家,并不僅僅是因?yàn)槲一ㄙM(fèi)了很多年在其中做研究,而是因?yàn)槲覐男牡紫矚g它,是這樣的動(dòng)力和激情促使我得以縱情其中很多年。

從重拾好奇心到探索數(shù)據(jù),再到拓展更多的領(lǐng)域,您的生活看似是一個(gè)不斷最大化您的生活的可能性,也不斷探索各種領(lǐng)域和機(jī)會(huì)的過程。那么未來您將會(huì)選擇往哪個(gè)方面發(fā)力呢?

前往那些門檻和阻礙比較低的方向。其實(shí)我并不喜歡挑硬骨頭啃。我的博士生導(dǎo)師給我上過很重要的一課——他說做事一定要從簡單的做起,然后慢慢做一些復(fù)雜而且艱難的事情,那個(gè)時(shí)候你才有辦法解決那些復(fù)雜的事情。

所以,訣竅就是從簡單的事情做起?

從簡單的事起步就好。

我是學(xué)徒文化的堅(jiān)定擁躉。


上一章目錄下一章

Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)