深度學習開發框架,是巨頭卡位AI關鍵環節的重要一步棋
任何一個產業,都是由供需兩端決定的。要想成為行業霸主,無非就是兩條路:最大程度的滿足市場需求,或者最大程度的控制市場供給。
對于一般行業而言,比較通用的做法是先關注市場需求,然后以更有效的方式組織市場供給,以此來增強競爭力。無論做什么,市場需求是第一出發點。
這一做法,對于科技行業貌似有點不一樣。不是說科技行業的市場需求不重要,而是說科技尤其是軟件行業是我們所說的“賦能”工具,市場需求分散在各行各業,不太容易形成規模優勢。而供給端就不一樣,由于代碼低成本復制的特點,其在供給端是很容易形成規模優勢的。
這個規律,對于人工智能行業尤其適用。人工智能的應用需求目前還不明確,對于巨頭而言,與其苦苦探索需求場景,不如快速占據供給市場。壟斷了供給端,無論以后市場怎么發展,自己也有很大概率成為“摘桃子”的人。
人工智能的供給端都有哪些呢,關鍵環節是什么?人工智能的核心是算法模型,占據了算法模型市場,就占據了供給端的話語權。另一個角度,人工智能的生產人員,是一個個的算法工程師,如果有一個平臺,讓算法工程師產生依賴,那這個平臺就會有很大的生命力。
下圖是人工智能體系的架構:
人工智能的核心在于人工智能算法,而軟件框架的主要作用就是將AI算法進行封裝,為上層應用提供算法調用接口。我們耳熟能詳的TensorFlow,MXNet,Caffe/2+PyTorch,主要干的就是算法封裝的事。大部分模型的開發、部署,都要用到上面的這些軟件框架,需要通過他們調用各種模型,需要用到他們的各種工具組件,需要他們調用底層硬件計算資源。
對于一個市場而言,用戶習慣和生態是最難培養的, 但一旦養成了就會是最大的競爭力。AI開發框架平臺就是在培養人工智能從業人員的用戶習慣,培養應用生態。至于上層的應用場景探索,無論是計算機視覺領域、語音識別領域還是自動駕駛領域,甚至是深入到金融、零售、電商、制造這些行業里的應用,最終都會需要通過這些底層的深度學習開發框架,來調用各種算法,開發各類模型。既然這是一條無法繞開的道路,那就只能等著交過路費了。這就像手機行業的“高通稅”,高通壟斷了上游,即使不生產手機,也能攫取整個手機行業里很大一部分利潤。
而且,人工智能很大程度上可以看作一門以數據為基礎的生意。AI開發框架平臺,會成為各路數據的一個重要匯聚點,數據匯聚必然伴隨著價值匯聚。
這么好的一門生意,當然很多人都想做。但平臺的生意,往往門檻都很高。AI開發平臺,需要很強的技術實力和資本實力。要得到大家的認可,往往需要在平臺處理性能、計算資源調度能力、平臺易用性、安全性、生態豐富度這幾個方面表現突出才行。
經過這幾年的競爭,最終只有幾家在這場競賽中勝出了。在AI開發框架領域,TensorFlow 、 Caffe/Caffe2 占據了相對主導地位,此外主流訓練框架還有MXNet,PyTorch,Keras、PaddlePaddle等。
可以看到,目前主流的AI開發框架還是被國外的谷歌、臉書、亞馬遜、微軟所主導。雖然現在都倡導開源,但鑒于目前中美嚴峻的政治形勢,考慮到未來幾十年很可能更加嚴峻的中美政治形勢,保不齊以后人家也在源頭上斷了你的路。況且,人工智能是美國也很關注的戰略產業,不惜一切代價壓制中國人工智能行業發展,已經成為美國政治精英的共識,未來他們很可能會采取更加激進的行動。
所以,著力培養國產的AI開發框架,是在非常時期發揮關鍵作用的“備胎”。中國的互聯網巨頭以及人工智能獨角獸企業,現在已經在有意識地構建底層平臺,但差距還是肉眼可見的。如果要取得更大突破,需要在三個方面發力:底層AI理論和技術積累,企業更大的戰略決心和資源投入,國內企業的團結協作。