盗墓笔记,完美世界前传下载,欢乐颂第一季

因為信任，所以簡單。

深圳小程序開發(fā)|深圳APP開發(fā)|微信小程序開發(fā)|小程序軟件開發(fā)|抖音小程序開發(fā)

本文是我從2019年1月底接手CRO線NLP算法團隊以來，在團隊組建、能力建設、以及管理上的一些思考，全部是沒有科學論證的主觀判斷，不過都進行了實踐。我沒有任何管理學背景知識，把拙見沒羞沒臊地寫出來，是為了拋磚引玉，和同學們交流討論。

團隊的定位是什么？——做正確的事

定位

團隊的定位是重要的事情之一，有了偏差，后續(xù)做得越多錯得越多。確定團隊的定位花了我很長時間，中間還發(fā)生了一次組織變化，和兩任主管有多次討論。

首先，這個團隊配置在CRO線，肯定要為風險管理業(yè)務服務；同時，這又是一支能力團隊，還要考慮和業(yè)務團隊的協(xié)同關系。最終，我確定了3點：

1、能力建設為主，同時也需要有業(yè)務抓手；

2、不做業(yè)務團隊已經(jīng)做得好的事情；

3、立志高遠，勇攀高峰，要做就做到最好。

壁壘與價值

不夸張地說，現(xiàn)在是NLP領域的大航海時代，新算法層出不窮，日新月異，后浪各種把前浪碾死在沙灘上。尤其是 BERT 橫空出世之后，整個 NLP 的研究范式都發(fā)生了變化，從原來的 task-specific 的模型結構設計轉變到語言模型 pretrain+ 下游任務 finetuning 的模式，預訓練模型是含金量高的工作。研究一下預訓練模型，你會發(fā)現(xiàn)這是個需要海量金錢+數(shù)據(jù)+技術才能玩的游戲。

這就陷入兩難：如果搞預訓練模型，沒那么多資源；如果不搞，用開源模型做下游任務，實際上很難有什么技術壁壘。其實就算你真的搞出什么新算法可以充當技術壁壘，可能兩三個月之后就又有人做出了更強的結果。

困境的根源在于，目前 NLP 算法這個領域發(fā)展速度太快了，在高速變化的領域是很難形成壁壘的。所以，我們需要結合自身所處的環(huán)境，尋找變化不那么快的東西。

我經(jīng)過好多天的考慮之后，認為沉淀風險管控知識可以作為壁壘。原因：1）風險知識隨時間有變化，但速度明顯比算法慢很多；2）CRO 線在這方面有一定積累，也需要用于實際業(yè)務管控，并沉淀到產(chǎn)品。

所以，團隊的宗旨我定義為：基于知識驅動的 NLP 算法團隊。為 CRO 線乃至集團沉淀風險知識，并提供不同層次的服務：

4層服務體系

最近，CRO 線在清華舉辦了 AI 與安全研討會，會上張鈸院士談到了第三代人工智能，尤其強調了其中知識的核心作用；我們走訪中科院信工所，對方的宗旨也是建設基于知識驅動的算法，和業(yè)界發(fā)生的共鳴，更堅定了我們走這條道路的決心和信心。

團隊需要什么能力？

先要搞清楚團隊所處的環(huán)境。

阿里是一個什么結構的組織？

有人說是矩陣式的，有人說是樹+網(wǎng)狀的，我不知道確切的答案。不過，如果把每個小團隊看作節(jié)點的話，有 2 點是確定的：

1、體量巨大，各種節(jié)點（業(yè)務、產(chǎn)品、工程、算法）種類繁多數(shù)量大。

2、單元節(jié)點之間比較容易發(fā)生跨大團隊甚至跨 BU 的聯(lián)系，條件合適可以發(fā)生協(xié)同關系。

繼續(xù)觀察，你會發(fā)現(xiàn)：

1、你所需要的一切資源幾乎都能找到提供者，而且往往不止一個。

2、你也可以給各種需求節(jié)點提供服務，只要還在你的能力范圍內。

3、由于規(guī)模巨大，需求節(jié)點和資源節(jié)點相互之間往往不知道對方在哪。

基于以上，我認為一個身處中臺的算法團隊，需要具備 4 項能力：連接-生產(chǎn)-傳播-服務。

能力中臺的算法團隊需要具備的能力

四項能力

連接

就是尋找到自己所需要的資源，篩選出其中最優(yōu)的，建立長期穩(wěn)定的合作關系。比如算法團隊需要的爬蟲、標注工具、分布式模型訓練工具、模型的評測工具等，都能在公司范圍內獲取，就沒必要刀耕火種從頭開始自己建設了。

生產(chǎn)

這是傳統(tǒng)意義上算法工程師的工作，指獲取數(shù)據(jù)后產(chǎn)出效果和效率達標的算法模型，并上線。

對算法的要求，主管的主管早有論述：算法要全！算法要強！算法要快！算法要便宜！精煉簡潔，振聾發(fā)聵，細化一下就有：

圖-對算法的要求

傳播

針對中臺的算法團隊提的要求，因為你需要讓目標業(yè)務節(jié)點知道你的存在，知道你的能力項，以及細節(jié)。ATA 是個不錯的對內傳播途徑，之前在 CV 團隊時，很多業(yè)務方是通過 ATA 找到我的。

服務

如果是專屬某業(yè)務的算法團隊，只需要考慮該業(yè)務下的 SLA 即可；如果是中臺的算法團隊，還需要考慮如何滿足不同業(yè)務節(jié)點的需求，同時又不至于做開發(fā)和維護成本很高的個性化定制，避免隨著接入業(yè)務的增長各種資源的開銷也隨著線性增長。

能力雷達圖

團隊的能力雷達圖是由成員的個人能力長板組成的。（話越短意思越長）

圖-團隊能力雷達圖

組織與個人的關系

為什么需要一個組織呢？

先從一個現(xiàn)象出發(fā)：在小區(qū)業(yè)主和物業(yè)公司的糾紛斗爭中，業(yè)主獲勝的概率很低。從人數(shù)、個體的教育背景和素質來看，業(yè)主都占據(jù)絕對優(yōu)勢，可是為什么會輸？

粗略分析，大體有三個原因：

1、共同利益，目標明確。物業(yè)的目標非常清晰，就是為了從業(yè)主那里賺錢，這也是物業(yè)人員的共同利益。業(yè)主人多，情況各有不同，各自的利益訴求差異大，容易被分化。

2、組織嚴密，相互協(xié)同。物業(yè)內部有明確的分工，平時也長期一起工作，相互間有信任感，能夠進行配合。業(yè)主彼此之間往往是陌生人，缺乏信任感，難以統(tǒng)一行動，是原子化的散點。

3、局部相對優(yōu)勢。相對單個業(yè)主，物業(yè)具有明顯力量優(yōu)勢。比如，物業(yè)有資金，而業(yè)主因為缺乏信任很難籌措資金。

好，看出來了，小規(guī)模組織的力量可以超過大規(guī)模原子化散點存在的個體集合的力量。

組織為個人提供什么？

1、組織能使資源增效組織能把各種資源組合成有機的整體，使各種分散的力量形成合力，從而產(chǎn)生大于這些資源和力量機械總和的效能。這個原理 2000 多年前亞里斯多德就論述過了，后來馬克思又更嚴密地論述過一次。

2、組織是實現(xiàn)目標的依托

個人可以依托組織的能力和資源去做事，而組織的能力和資源遠大于個人，所以依托組織的時候，個人能夠實現(xiàn)比單打獨斗模式大得多的目標。

舉個例子，我們團隊做了 UGC 場景效果超越開源模型的預訓練模型，每個同學都可以在這個預訓練模型的基礎上去做下游的有監(jiān)督學習任務，起點就比別人高。

個人為組織提供什么？

是否有短板不是那么重要，關鍵是要有長板，能夠對組織的能力雷達圖做貢獻。

這一節(jié)留一個思考題：公司設置主管這個職位的目的是什么？是為了像幼兒園阿姨那樣，保障每一個小朋友都有自己喜歡的玩具，高高興興上學來，平平安安回家去？

招聘團隊需要的人才

招聘為什么特別重要？

世界有個普遍規(guī)律：在前序階段做嚴格的控制會大大降低后序階段的實現(xiàn)難度，比如數(shù)據(jù)標注、寫代碼、模型中的預處理等等。人招進來之后是要用要管的，招聘的時候高標準嚴要求，后續(xù)管理會輕松很多；如果降低標準甚至放水，后續(xù)管理付出的代價遠遠高于招聘時偷懶省的功夫。

所以，我花了至少 1/3 的時間在招聘上。對的，至少 1/3 ，你沒有看錯。從 2019 年 2 月到現(xiàn)在，社招弄了 300+ 份簡歷；校招 100+ 份簡歷。在這里特別要感謝團隊里球夫、天逸、開陽3位同學，犧牲了大量業(yè)余時間做簡歷評估和初面。從統(tǒng)計數(shù)據(jù)看，每 100 份簡歷產(chǎn)生 2-3 個offer，入職 1-2 個人。從 100 份簡歷中招來的人絕對比 10 份簡歷中招來的省心很多。

我給算法團隊找來過不少人，both 社招 and 校招，具體的展開討論見彩蛋部分的【招聘】。

招聘要考察哪些能力？

招聘，首先要確定 job model 。限于篇幅，這里只討論“生產(chǎn)”環(huán)節(jié)所需要的能力。

所處的時代背景：快速變化，新算法層出不窮。

不變的是什么：數(shù)學基礎、計算機基礎、動手能力。

我們很難預測新技術的具體實現(xiàn)，但是當新技術出現(xiàn)的時候，需要能夠快速地分析、學習、掌握。而且，我們經(jīng)常要解決從來沒有遇到過的新問題，這就要求候選人在面對沒見過的問題時具備分析判斷，在具體約束條件下找完整解決方案的能力。另外，在復雜的業(yè)務場景里，問題經(jīng)常沒有確定性的答案，我們往往通過對過程的合理性來判斷整個方案是否合乎要求。尋找答案的過程很少有一帆風順的，大概率會遭遇挫折，非常需要候選人不斷嘗試不斷修正去抵達終點。

至于教育背景、之前從業(yè)經(jīng)歷，反而不怎么重要。我不贊成對于畢業(yè)好幾年的社招候選人還要參考畢業(yè)學校、最高學位，甚至本科學校是否 985 ——如果一個人能力強，是不需要靠學校學位來旁證的，直接用行動證明就行了。

對于候選人的考察，我往往從基礎的硬技能、創(chuàng)新性/開放性思維、精神素質三方面考察。

硬技能

數(shù)學：概率論與數(shù)理統(tǒng)計、矩陣論、隨機過程。

計算機基礎：操作系統(tǒng)、組成原理、數(shù)據(jù)結構。

算法能力：領域內主流模型的演進，優(yōu)缺點對比；在具體設定的場景下選擇合適的方案。

動手：C++/python/Java （什么？你說matlab？工業(yè)界里這個不算編程語言）。

有人說，面試過程中要求做代碼測試，就像相親時要求看存款證明一樣殘暴。我贊同這個說法，因為不少候選人聽到要寫代碼就高傲地拒絕了。我給大家推薦一個在線代碼測試工具：

http://collabedit.com

從我長期的觀察情況看，發(fā)展得好的算法同學，動手能力都比較強。畢竟，算法工程師，首先是一個工程師。

創(chuàng)新性/開放性思維

其實我還經(jīng)常干比代碼測試更令人發(fā)指的事情——做智力題。這個不是我的創(chuàng)新，是跟 Google 等公司學來的，而且是直接找網(wǎng)上流傳的面試題換個馬甲來用。

前面的硬技能，看的往往是結果；這里對思考能力的考察，看的是過程：是否有方法論，思路是否清晰，是否言之有據(jù)。所以，這種問題的面試方式往往是討論式。

如果候選人能夠完成，最后再請TA做個總結，觀察歸納要點的能力，視線的高度。

有些候選人結束面試后仍然會繼續(xù)思考，給出更好的回答。

精神素質

公司對人才的要求是：樂觀、皮實、聰明、自省。

你看，四個詞里面有兩個都在強調堅韌不拔。在面試過程中，我會看候選人在解題不順時的表現(xiàn)，有時甚至故意小刺激一下觀察候選人的反應，偶爾還會故意中途改變限制條件。阿里內部競爭激烈，經(jīng)常需要擁抱變化，如果心理承受力脆弱，是不適合當同路人的。

還有一點很重要：自我驅動力。這是從降低對內管理成本來要求的，后面會具體說。

在我看來，硬技能、創(chuàng)新性/開放性思維和精神素質缺一不可。即使這三方面我都滿意了，如果主管，主管的主管， HR 對候選人明確提出疑慮，我一般不申辯直接放棄掉。因為，他們比我 level 高，閱人無數(shù)，往往不會錯。

有的同學會問：這樣子做，會不會錯失優(yōu)秀人才？是的，我的方式幾乎可以確保招進來的同學肯定是好的，但會漏掉一些優(yōu)秀的候選人，不過這不會造成嚴重的后果。相比之下，招進來不合格的人才會有大麻煩。

用人

主管的角色是什么？

以前有句話，叫做“火車跑得快，全靠車頭帶”，這說的是前動車時代。動車和高鐵為什么比傳統(tǒng)的火車速度更快？根本原因是：大多數(shù)車廂都能提供動力。

同樣的，如果一個團隊完全靠主管來驅動，來提供動力，主管很容易成為團隊的瓶頸。我的團隊成員，很多都是自己領域的高手，專業(yè)能力在我之上，我就應該順應實際情況，不要拿自己的愚見去束縛同學們的發(fā)揮。因此，我的角色更多的是眺望遠方，掌握方向盤，有時踩一下剎車；團隊大多數(shù)同學一起構成動力引擎。

動車/高鐵跑得快，是因為大多數(shù)車廂都提供動力

對內管理模式

一個不恰當?shù)谋扔鳎悍叛颉?/p>

這么做，堂而皇之的理由是“因為信任，所以簡單”。技術層面的原因，對算法類同學做過程管理性價比太低。

算法類工作，創(chuàng)造性在其中占據(jù)重要地位，而創(chuàng)造性很難在過程中量化度量，也很難從外部觀測現(xiàn)象來判斷。比如：身邊的同學坐在工位直視屏幕目不轉睛，我不知道他到底是在思考論文中的公式還是在回味昨天晚上看的電影。再比如，我base在杭州，沒辦法知道團隊內base北京的同學是不是在工作時間打游戲。

所以，我選擇信任我的同學，只在一些必須監(jiān)管的事項上把關，比如數(shù)據(jù)安全、安全生產(chǎn)等，其他事項一般不做過程管理，只做結果管理。得益于招聘時把關嚴格，絕大多數(shù)同學的自我驅動力都比較強，我并不用操心偷懶的事情；相反，偶爾需要操心一下少部分同學拼過了頭的問題。關于這一點，更多的內容見彩蛋中的【認真生活，快樂工作】。

肯定有同學問：上面說的是不擔心出工不出力，那么，怎么解釋出力的問題呢？你難道不指導同學做項目嗎？

我一般只給出項目的目標，有時給一個粗略的方案設想，有時不給。公司對于P6同學已經(jīng)有“獨當一面拿結果” 的要求，大家都應該具備獨立作戰(zhàn)的能力。而且，按照前面說的，團隊內大部分同學都應該是提供動力的車廂，沒必要依賴我。人是否有自我意志？這個問題我不知道答案。但我知道，如果一個人認為主意是自己想出來的，決定是自己做的，會更有動力去實現(xiàn)。嘗試做決策，嘗試完成不確定的任務，都有利于自己的成長。

思考題：管理有很多種style。有的主管喜歡自己做需求分析，然后拆解細化到原子級的技術問題，讓下屬做執(zhí)行。這種模式，和“放羊”模式相比，從主管視角，以及下屬視角看，各有什么優(yōu)缺點？

綜合以上兩點，我覺得放羊是可行的。而且，放羊這件事，羊倌也是要做很多工作的：選擇合適的天氣，找到草地，把羊群帶到草地，放哨保護羊群，是不是？如果還要把青草割好喂給羊吃，那成什么了？

羊倌應該把更多的精力花在尋找豐美的草地，購買強壯的羊，與其他羊倌交流這些事情上，要是成天忙于喂羊，督促偷懶的羊快點吃草，拉開打架的羊這些內部事務，羊群怎么發(fā)展壯大？更多的展開見彩蛋中的【因為信任，所以簡單】。

鼓舞團隊信心，最好的方式是什么？

痛痛快快地贏一次。如果不夠，就兩次。

接手團隊的時候，在商業(yè)化方向上局勢是很差的：去年三次PK競品都輸了，穩(wěn)定性問題頻發(fā)以至于新版本都無法發(fā)布……團隊好幾個人都撲在這一個陣地上干得很苦但就是拿不到結果。

這個時候我要是去發(fā)表個類似《至暗時刻》里丘吉爾那樣讓人熱血沸騰的演講是否可以解決問題？可能有短暫的強心劑作用，但是不長久，因為實際困難沒解決。何況，我也肯定不具備丘吉爾的演說能力。最有用的辦法，還是分析失敗的原因，制定正確的打法，指導同學們獲得一次成功。鼓舞信心最好的方式還是靠實實在在的成功。

結果大家都看到了，今年我們PK競品的戰(zhàn)績是N：0，付費調用量上漲25倍以上。大家肯定好奇：正確的打法是什么樣的呢？我放在后面《正確地做事》那一節(jié)講。

做有吸引力的事情

目標要定得高一些，有挑戰(zhàn)性，達成的時候內心的成就感會更高一些。這個很容易理解，就好比你打游戲，虐了個菜，沒多少快感；如果能贏下之前屢戰(zhàn)屢敗的對手，一定會興奮很久。我跟部分同學說過，大家的眼光不要局限在三號樓，也不要局限在聚橙路，而是要放眼世界。

目標定得太低，不僅不能逼出自己的潛力，還容易讓自己關注于一些雞毛蒜皮的小問題。

前幾天，我的主管在一個項目 kick off 會上說，當你回首往事時，要有一件做過的事情能夠拿出來吹牛逼，人生才有意義。深以為然。

過程即享受

在阿里的工作肯定是辛苦的，我沒看到過誰能隨隨便便就成功。如果只是沖著收入來做工作，難免在過程中會感覺到很多痛苦。物質的刺激是短暫的，不管是加薪、年終獎，或者 option ，興奮高興個幾天就過去了。如果喜歡自己做的事情，專注于工作本身，從中源源不斷地獲得成就感，就能做到雖然辛苦但是不痛苦。我家做飯的阿姨是拆遷戶，坐擁 N 套房，每天仍然跑幾家做飯，我問她為什么？她說，以前是開蒼蠅館子的，拆遷后沒得開了，但是自己就是喜歡做飯。理想狀況下就是要招聘這種人。

采取什么工作模式？——正確地做事

四個在線化

互聯(lián)網(wǎng)的本質是連接，最大價值也是連接。

這句話不知道是誰說的，第一次聽說是在《計算機網(wǎng)絡》課程上。互聯(lián)網(wǎng)連接的可以是人和人，人和文檔，人和數(shù)據(jù)，人和代碼，人和……和一切你工作中需要的東西。

接手團隊之后，我發(fā)現(xiàn)同學們的工作模式真的是自耕農(nóng)一般：各做各的模型，各用各的數(shù)據(jù)，各讀各的 paper ，完全是原子化的散點存在。說得不客氣一點，除了聚餐的時候，平時感覺不到這是一個組織。也就是說，身處中國頂級互聯(lián)網(wǎng)公司，大家卻像農(nóng)業(yè)社會時期一樣在進行生產(chǎn)，當著不折不扣的“碼農(nóng)”。

團隊里一個同學說得很好：相互間建立信任關系的最好辦法是發(fā)生工作上的協(xié)同。我覺得，要發(fā)生工作上的協(xié)同，前提就是把工作相關的資源都在線化，與組織成員發(fā)生連接，于是，我設想做4個在線化。

文檔、數(shù)據(jù)、代碼、評測在線化

1、文檔在線化

春節(jié)期間我建了個團隊語雀，自己做頂層設計，寫好框架，然后讓同學們把業(yè)務、技術、資源、技術影響力等等和工作相關的內容都填寫其中。這樣子，每個同學都可以看到團隊的各種信息和資源，以及其他人的工作。目前團隊的語雀還對部分關聯(lián)緊密的兄弟團隊完全開放。

2、數(shù)據(jù)在線化

如果同學們各自管理自己的數(shù)據(jù)，形成數(shù)據(jù)孤島不說，發(fā)生機器重裝，或者轉崗、離職，往往數(shù)據(jù)就丟了。接手的時候，能清理出來的有標簽數(shù)據(jù)遠遠低于應有的數(shù)量，就是因為一直沒有做數(shù)據(jù)的在線化管理。團隊里的言奇同學做了樣本大表項目，已經(jīng)完成了將整個智能認知團隊的全面標簽數(shù)據(jù)在線化。這一點非常重要，后續(xù)在開發(fā)各種新模型，以及做預訓練模型時，就擁有不同業(yè)務不同場景不同風險的大量數(shù)據(jù)，在短時間內取得了良好的效果。

3、代碼在線化

這個正在進行中，預期 S2 結束時完成，出發(fā)點是：

a.代碼是團隊重要的技術資產(chǎn)，應該統(tǒng)一管理，提高安全性。

b.在線化后方便團隊協(xié)作，共享優(yōu)秀代碼

c.基礎性模塊代碼統(tǒng)一，降低維護成本

4、評測在線化

也在進行中，設想是在一些特定任務上做幾種經(jīng)典模型和確認無誤的主流模型，能夠一鍵實現(xiàn)自己的模型和前者的自動化比對，提升工作效率。除此之外還有個作用：經(jīng)典模型的結果可以作為baseline，幫助驗證深度模型的正確性。因為，你做了一個深度模型，效果好也就罷了，效果不好的時候都搞不清楚是模型不適用，還是自己的代碼寫錯了。

找對前進的方向

主管最重要的職責之一是當同學們迷茫的時候明確前進的方向。

接著前面商業(yè)化的例子，詳細情況是這樣的：我們通過阿里云對外輸出文本風險識別的算法能力做商業(yè)化，比如涉政、色情低俗、廣告、辱罵等。我接手的時候，有 3-4 個同學全職投入這項工作，他們工作非常努力，干得也很辛苦，但是效果并不好， PK 競品的時候并無勝算。出了什么問題呢？

分析之后，我發(fā)現(xiàn)以下問題：

1、確實是一個內容維度的問題，但只使用了分類模型一種方式。

分類模型適合解決靜態(tài)標準的問題，并不適合及時響應業(yè)務上的快速變化。模型迭代更新的速度做到極限也只能是 T+1 或者 T+2 天，且人力消耗高。之前的主管為了解決這個問題，在分類模型中塞了一個風險詞包，由算法同學維護更新，接到運營反饋的 badcase 之后手動添加到風險詞包，然后定時推送到分類模型應用中。這個復雜的機制帶來了詞典的頻繁構建，結果導致應用的穩(wěn)定性問題頻發(fā)，甚至已經(jīng)無法更新。

2、缺乏頂層設計，同學們各自為戰(zhàn)。

幾個風險各自單獨做模型，技術選型高度自由，百花齊放，starspace、SVM、CRF、kenlm、textCNN 都有，難以統(tǒng)一提升能力，維護的難度大。

3、做了過多的個性化定制，導致后續(xù)維護和升級的成本非常高。

幾乎為每一個稍微大一點的用戶都單獨做了模型，付費調用量不大，模型倒是有了好幾十個。同學們頻繁地做模型的迭代更新（每周都至少有 1-2 次），占用大量人力。

怎么辦呢？

建設技術體系去解決某一類問題，而不是某個技術點去解決某一個問題；結合安全業(yè)務的特點，設計可以強化通用算法效果的基礎能力或處理框架。

——上面兩句話不是我說的，來源于前主管。（插一句：本文還有一些內容來源于前主管和主管，向主管學習是提升自己的一個重要途徑。）

具體來說，解法有幾點：

1、明確風險詞包、相似性檢索、分類模型、風險知識圖譜 4種手段適合完成的任務，且相互配合。

2、把風險詞包從分類模型中拆出來，降低應用的復雜度，以及模型迭代的頻率，解決穩(wěn)定性問題。

3、分類模型的結構盡可能統(tǒng)一，標準盡可能不變，持續(xù)把效果做強。

4、自從 BERT 提出以來，NLP 問題的基本范式從原來的 task-specific 的模型結構設計轉變到語言模型 pretrain+ 下游任務 finetuning 的模式。工作重點應該轉向預訓練模型與知識蒸餾。

由于目前對內的內容交互風險管控業(yè)務也在我的團隊內，我就貼一張全局視角的問題分析與解決方案。

全局視角的UGC風險管控思路

明確解法之后，同學們快速做了實踐，到 4 月份就基本扭轉了被動的局面，隨后打了翻身仗，付費調用量增長 25 倍。現(xiàn)在模型的更新周期降低到以月為周期，穩(wěn)定性大幅度提升，同學們也不再疲于奔命；而且，投入的人力也明顯下降了

績效的考核

績效考核決定了收益的分配，也是團隊最重要的事情之一。

如果把團隊比作一個模型，考核的標準就是 loss function。loss function 一旦確定，模型的優(yōu)化方向也就定了，團隊成員會按照利益最大化原則沿著這個方向調整自己的 action 。

所以，考核標準的設計需要體現(xiàn)團隊的定位、價值和需求；在執(zhí)行的過程中需要滿足平等性。

績效考核的3個維度

業(yè)務結果

阿里有個文雅的說法是：為過程鼓掌，為結果付酬。

還有個話糙理不糙的說法是：沒有過程的結果是垃圾，沒有結果的過程是放屁。

你覺得哪一句對你的胃口就看哪一句。

配置在業(yè)務BU的算法團隊，幫助業(yè)務目標達成肯定是首要任務。今年以來，AI 行業(yè)也都漸漸擠出泡沫，回歸本質，開始強調創(chuàng)造業(yè)務價值了。

能力進步

從價值觀上講，今天的最好表現(xiàn)是明天的最低要求。

從業(yè)務需求講，量級越來越大，業(yè)務形態(tài)越來越復雜，老算法是解決不了新問題的。

從團隊利益講，成員的能力進步可以擴展團隊的能力雷達圖。

參加百阿的時候，一位講師的發(fā)言我到現(xiàn)在都記得：在座的各位最終都是要離開阿里的，離開的時候無非兩種情況：1，公司不要你了；2，你不要公司了。怎么離開，取決于是你的能力提高快，還是公司對能力的要求提高快。

技術影響力

什么是技術影響力？

有形物：Paper 、競賽成績、著作、專利、 ATA 文章等。

無形物：對內對外合作、對外 PR 、對內分享、組織機構任職、參會做報告等。

為什么要建設技術影響力？

1、團隊的四項基本能力：連接、生產(chǎn)、傳播、服務，其中“傳播”就需要技術影響力。

2、 CRO 線的使命“四心”中，有一條叫“讓監(jiān)管單位放心”。技術影響力是讓監(jiān)管放心的有效方式之一。

3、商業(yè)化需要資質：搞過投標的同學都知道。

4、招聘需要名氣：對候選人講解我們的技術水平時，如果用內部業(yè)務舉例，不容易產(chǎn)生共鳴；但是如果直接亮出頂會論文、刷榜名次之類的，對方馬上就懂了。

5、個人的市場價值需要證明：這些東西都可以作為個人技術品牌，到哪都能帶著。

假定一個場景，有人問：“你說這個業(yè)務做得好，說明你的算法水平高。會不會換一個人能夠做得更好？”你打算怎么回答這個問題？

再假定一個場景，你打算給自己團隊的算法能力定性為“xx領先”或者“xx第一梯隊”，如果沒有硬核的技術影響力做支撐，是否還能理直氣壯？

平等性

團隊協(xié)作的基礎是團結，團結的基礎是平等。

平等性最重要的體現(xiàn)，就是在考核過程中盡可能只衡量以上三項，不去考慮地域、教育背景、從業(yè)經(jīng)歷、之前表現(xiàn)、顏值、性別、個人動向等等其他因素。我認為：結果體現(xiàn)的就是能力，直截了當，最能服眾。

當然，這個世界上是否有完全客觀的判斷？或者，完全客觀的判斷如果存在，是不是就是最合適的？我不知道答案。不過，我覺得不能因為做不到完全的平等而放棄追求平等。

按照慣例，it's the timefor employment ad 。我們需要研究這些領域：

1、安全場景特有的問題

1.1 無限制條件下的攻擊與防御

現(xiàn)實世界里，違規(guī)者的變形變異方法是不受約束的，思路非常廣，讓人防不勝防。我們需要研究無限制條件下的攻擊與防御以提升我們對于業(yè)務（尤其是信息治理與商品）中層出不窮的變形變異，這屬于核心能力。

1.2 模型的可解釋性

是AI的一大發(fā)展趨勢。我們作為安全AI，這張牌更需要打出來，體現(xiàn)安全領域的特色；也需要給業(yè)務同學提供人可以理解的原因，放心地做決策。

1.3 小樣本學習

安全場景經(jīng)常因為不可抗力不能搜集到足夠的樣本，或者長尾風險因為成本的原因無法去做樣本收集，必須要發(fā)展只憑借少量樣本快速獲取“夠用”的模型的手段。

2、預訓練與知識蒸餾

自從 BERT 提出以來，NLP問題的基本研究范式從原來的 task-specific的模型結構設計轉變到語言模型預訓練+下游任務微調的模式。這是歷史必然的趨勢，不可扭轉。

2.1 預訓練

預訓練模型自身的提高，可以帶來分類、檢索、 NER 等 NLP 基本任務（這些都是我們需要具備的核心能力）的水平提高，且有利于 NLP 技術體系的統(tǒng)一化。可以把我們的各種應用算法能力比喻為船，預訓練模型是水，水漲就能船高。

2.2知識蒸餾

由于目前還存在模型復雜度和計算資源的尖銳矛盾，對于我們這種業(yè)務量動輒十幾億的情況，模型的計算效率具有非常重要的財務意義。如何在盡可能保障效果的前提下降低計算資源的消耗具有非常現(xiàn)實的意義。

上一篇：重塑云上的 Java 語言下一篇：“5G”物聯(lián)網(wǎng)的天下

穩(wěn)定

產(chǎn)品高可用性高并發(fā)

貼心

項目群及時溝通

專業(yè)

產(chǎn)品經(jīng)理1v1支持

快速

MVP模式小步快跑

承諾

我們選擇聲譽

堅持

10年專注高端品質開發(fā)

亚洲乱码卡一卡二卡三永久-亚洲乱码一二三四区-亚洲乱码一区二区三区在线观看-亚洲伦理一区-成人在色线视频在线观看免费大全-成人在线91

首頁

方案

資訊

支持