帶著這個問題,the Seattle Data Guy 採訪了西雅圖周邊的許多頂級科技企業的管理人員,嘗試了解他們對企業里的高級數據科學家有哪些期待、希望數據科學家有哪些產出。這些他們了解到的信息相信不僅可以幫助想要成長的數據科學家,也可以幫助想要激勵數據科學家成長的企業管理者們。AI 科技評論把他們的發現介紹如下。
根據訪談得到的結果,the Seattle Data Guy 發現科學家的成長和編程、演演算法設計都沒什麼關係(這都是初級數據科學家的基本功了)。當問及這些管理者希望從更資深的數據科學家身上看到什麼時,得到的回答是「自我驅動的員工,他們能簡明地溝通、能為自己考慮、對公司業務有深入的了解,而且能管理自己的上級」。
數據總會有自己的缺陷。如果你也曾在數據上花過成百上千小時,那你一定知道這是什麼意思。當你在數據中瀏覽,或者把數據繪成圖表的時候,你常常會發現一些奇怪的模式,你會不禁停下來琢磨:「為什麼 x 和 z 看起來這麼像?」年輕的數據科學家往往會花太多精力在完成項目本身上,他們還沒有學會如何停下來仔細分析這些奇怪的模式。這些模式的出現有可能是因為系統的默認輸出就是 -1 或 1 這樣的特定值,也有可能是讓爬蟲收集電商網站上的顧客購買數據時出現了偏差,以及其它一千多種可能的原因讓數據產生了誤導性。