首頁 > 科技 > 正文

飛天 AI 平臺重磅發布!阿里擁抱 AI 這五年

更新日期:2020-01-13 20:08:25

簡介: 2014 年,一個名為“iDST”的神秘部門的誕生開啟了阿里的人工智能新征程,5 年后,初長成的達摩院成為了阿里 AI 崛起的代表性力量。如今,阿里已躋身全球人工智能技術研發的第一梯隊,成為時下這 AI 技術洪流中不可或缺的力量。這份出彩的“成績單”背后,是阿里 AI 團隊過去 5 年的籌謀、堅守與突破。在杭州召開的阿里巴巴云棲大會上,AI 悄然占據 C 位,新任“阿里云智能計算平臺掌門人”賈揚清、阿里巴巴達摩院機器智能實驗室負責人金榕、阿里巴巴達摩院語音實驗室負責人鄢志杰等三十幾位達摩院技術專家在大會第二天發布了阿里在 AI 領域的最新研究進展和成果。


飛天 AI 平臺首次亮相

阿里的 AI 能力再上新臺階。在云棲大會第二天,新任“阿里云智能計算平臺掌門人”、阿里巴巴集團副總裁、阿里云智能計算平臺事業部總裁賈揚清正式對外發布飛天 AI 平臺。

飛天 AI 平臺是賈揚清入職阿里巴巴后首次發布的機器智能產品。采訪中,賈揚清向 AI 前線展示了飛天 AI 平臺的“硬”實力。


飛天 AI 平臺到底是什么?

我們先聽一下賈揚清的定義:“這次發布的飛天 AI 平臺,不僅是阿里 AI 整體能力的結構化展示,更是一個開發者更易觸達的 AI 平臺,開發者在飛天 AI 平臺上,可按需調用平臺的能力,無論是軟硬件一體的編程環境,還是云邊端一體的高性能訓練和推理引擎;無論是阿里云已經開源的能力,還是成熟的商業版服務?!?strong>賈揚清表示,“這些都會讓開發者擁有更多自主可控的技術路線、同時擁有更加強大的 AI 能力”。

據了解,飛天 AI 平臺主要包含兩層:高性能訓練與推理引擎框架,多模態算法開發與部署平臺。


飛天 AI 平臺重磅發布!阿里擁抱 AI 這五年

框架層面:

飛天 AI 平臺包含 Alink(FlinkML)、MNN(輕量級深度學習端側推理引擎)、XDL(面向高維稀疏數據場景的深度學習開源框架)、SQLFLOW、PAI TensorFlow(阿里云優化的商業版 TensorFlow)、PAI Blade(編譯優化)、Elastic DL 等;

性能層面:

  • 飛天 AI 平臺通過資源調度能力優化,可提升 30%GPU 集群利用率;


飛天 AI 平臺重磅發布!阿里擁抱 AI 這五年
  • 在大規模稀疏模型訓練場景下,相同資源最高提升 7 倍性能;


飛天 AI 平臺重磅發布!阿里擁抱 AI 這五年


  • 接近理論的線性的分布式訓練擴展能力;


飛天 AI 平臺重磅發布!阿里擁抱 AI 這五年


  • 以及普惠的系統自動編譯優化能力。


飛天 AI 平臺重磅發布!阿里擁抱 AI 這五年

AI 開發與部署平臺層面:飛天 AI 平臺是一個自帶最佳實踐的交互式 AI 開發平臺,他將 AI 編程系統和大數據編程系統有機結合,在開發者實際操作過程中,不同崗位、不同技術背景的工程師之間往往有設計理念及技術實現細節上的差異,隨著業務復雜度、技術復雜度的增加,這種差異帶來的影響被進一步放大。飛天 AI 平臺經過多年的沉淀、打磨,在阿里巴巴集團及阿里云業務的實踐中,積累了一整套“歷經實戰演練”的數據處理、特征工程、算法、評測組件,并以模塊化的方式通過統一的 AI 開發環境提供標準服務,解決實際業務問題。

  • 開發者一站式拉起的輕量級 AI 開發平臺


飛天 AI 平臺重磅發布!阿里擁抱 AI 這五年
  • 數據科學家更加喜愛的大數據和 AI 協同開發平臺(全新功能)


飛天 AI 平臺重磅發布!阿里擁抱 AI 這五年
  • AI 推理服務平臺


飛天 AI 平臺重磅發布!阿里擁抱 AI 這五年

賈揚清表示,與目前市場上的 AI 平臺相比,阿里飛天 AI 平臺最大的不同點在于它是阿里自己在用的 AI 平臺,如電商搜索、個性化推薦、廣告、智能語音客服、無人駕駛、城市大腦等,都是在飛天 AI 平臺上開發出來的,這也是飛天 AI 平臺“學以致用”的最佳體現。

此外,飛天 AI 平臺與它的“孿生兄弟”飛天大數據平臺緊密結合,形成了飛天 AI 平臺的一大特色。大家都知道大數據技術是 AI 發展的重要基礎,而在今年 9 月,飛天大數據平臺的自研大數據計算平臺 MaxCompute 和開源大數據計算平臺 E-MapReduce 分別在 TPCx-BB 和 TPC-DS,首次將數據集規模拓展至 100PB,并在 30TB 數據規模排名中雙獲第一。放眼市場,能夠將大數據和 AI 技術完整結合,并取得如此成績的平臺可能只有阿里一家。在賈揚清看來,在 AI 更廣泛落地的大背景下,單純用一個深度學習平臺或框架做計算是不夠的,一定要跟大數據平臺緊密結合。

賈揚清強調,作為一個平臺,飛天 AI 平臺所提供的能力是讓開發者能夠利用這些能力進行應用升級,平臺關注的應該是給開發者、給上面的應用提供和創造更多的可能性。

接下來,飛天 AI 平臺和飛天大數據平臺、達摩院將構建起數據、算法、計算的 AI 生態閉環,更好地為開發者服務,為客戶創造價值。


飛天 AI 平臺重磅發布!阿里擁抱 AI 這五年

阿里 AI 內核看達摩

在今年的云棲大會上,AI 悄然占據了 C 位,多項關鍵性創新技術成果的發布代表著阿里技術長征又邁向了一個新的階段。

阿里對于 AI 的最早布局,要追溯到 2014 年,一個神秘部門的誕生。

彼時,在硅谷上市活動剛結束不久,阿里便宣布在硅谷建立 iDST(institute of Data Science&Technologies,數據科學與技術研究院),自那以后,馬云對外的演講里便高頻出現“DT”這個詞,在 IT 概念還未褪熱之時,馬云提出的“DT”也著實時髦。

iDST 自誕生起就縈繞幾分神秘色彩,它甚少在出現在媒體報道中,鮮有人知道,這個單從名字上看研究數據科學的部門到底在做些什么。它的目標在那時也顯得格外宏大,確立阿里巴巴集團在未來數十年的技術領先地位。

iDST 的奠基團隊里,大咖云集?,F任阿里巴巴達摩院高級研究員,機器智能實驗室負責人金榕和螞蟻金服副總裁兼首席數據科學家漆遠是 iDST 的兩位創始人,二人都是應王堅之邀加入阿里。

“阿里巴巴是坐在金山上啃饅頭,阿里擁有龐大的數據金山,而數據的真正價值卻并沒有發揮出來”,王堅拿出了當年彭蕾游說他的理由招徠漆遠,令王堅吃驚的是,“他真的非常果斷就來了”。之后,華先勝、周靖人、任小楓等頂尖科學家陸續加入 iDST。

“阿里 AI 戰略發展過程中,最大的轉折點是被團隊里很多前輩稱之為‘上山下鄉’的運動”,阿里巴巴達摩院語音實驗室負責人鄢志杰回憶他在 iDST 時的日子,“我其實加入三個月后,就開始擁抱變化了,我被‘下放’到業務團隊,到了阿里云 iDST”。

當時 iDST 的團隊成員多為科學家,他們重視基礎理論研究卻缺乏業務和實戰經驗,常被業務部門批評“不懂業務”。于是,為彌合這兩種矛盾,iDST 的團隊兵分三路“下鄉”,深入到業務團隊之中:金榕帶領一撥人加入了淘寶和天貓的搜索部,漆遠和幾位同事去了螞蟻金服,原先做語音的團隊留在了阿里云。

經過“上山下鄉”運動后,iDST 從直屬集團變成了阿里云下屬的一個部門,看似力量削弱了不少,但實際上通過這三路”尖兵“,阿里的 AI 技術能力在各個核心的業務場景中全面開花。金榕去淘寶、天貓搜索部后做出了拍立淘,還拿到了阿里最高榮譽“集團 CEO 獎”,漆遠去了螞蟻金服后,也收獲了 6 項阿里巴巴集團算法大獎。

如今,iDST 升級為達摩院并成了阿里的核心技術中樞,但達摩院做技術布局與研發的思路仍與 iDST 一脈相承,并在原基礎上做了延伸和發展。

2017 年,達摩院宣布成立時,馬云對它寄予厚望,他希望即便有一天阿里沒了但達摩院還在,達摩院必須活得比阿里巴巴更長。兩年過去了,達摩院逐漸成為阿里前沿技術實力尤其是 AI 實力上的代言者。

目前,達摩院關注機器智能、數據計算、機器人、金融科技以及 X 實驗室五大領域,設置有 14 個實驗室。其中,機器智能實驗室是阿里做 AI 研發最核心的部門,是阿里 AI 力量的匯聚地,其下設語音、視覺智能、語言技術、決策智能、城市大腦五個實驗室和一個智能客服團隊,這些基本涵蓋了阿里在 AI 技術方向上的核心布局。機器智能實驗室的負責人金榕向 AI 前線表示,阿里將技術劃分成三個層面:基礎技術、業務技術、應用技術,并按照這個邏輯選定了上述研究方向。

在傳承 iDST 的基礎上,機器智能實驗室的定位也發生了一些變化,其在為當下的 AI 技術做布局的同時,也在為未來技術來做一些基礎性的研究,金榕表示。

阿里巴巴達摩院語音實驗室負責人鄢志杰回憶,伴隨著 iDST 的架構設立,阿里開始對以語音交互等技術進入嚴肅投入期。發展到一定階段和規模的阿里需要做一些技術儲備,從這個角度上看,iDST 的布局是有一定前瞻性的,到現在的達摩院,也一直貫徹同樣的思路。

又一年云棲至,這一年來,機器智能實驗室有哪些技術創新和進展?金榕向 AI 前線介紹道:

在自然語言處理方面,最大的進步是深度語言模型,如今自然語言處理最大的挑戰是如何讓將人類語言變成數學能夠表達的東西,過去語言模型只是比較簡單的統計,現在的深度語言模型可以做到把語言很好地映射到數學空間上,這是一個很大的進步。深度語言模型另一個比較成功的應用是在問答上,又叫做機器閱讀理解,它跟一般的問答不同在于,過去 AI 問答一般需要事先設定一些 QA Pair,所有問題都需要判斷它跟 QA Pair 中的哪個問題比較像,再返回對應的回答?,F在的機器閱讀理解可以直接給機器輸入一篇很長的文章或多篇文章,模型可以從文章中自動搜尋跟問題有關的答案。

計算機視覺方面:過去阿里最大的一項突破就是超大規模圖像識別,目前阿里超大規模圖像識別技術已經可以做到幾千萬 SKU,所有物品在阿里商品庫均能做到 87% 左右的識別率,其中的核心是如何有效進行大規模訓練和優化。金榕希望未來這個 SKU 還能再推到幾個億。

語音方面:目前阿里的語音合成技術已經能做到跟真人非常接近的程度,并被收錄到了 MIT 2019 十大突破性技術中,與谷歌、亞馬遜同屬行業前列,其技術實現上借鑒了機器翻譯的一些方法。此外,阿里的語音合成技術不僅能在 Profile 上實現很好的效果,研發團隊還花了大量時間精力使模型的計算成本降低了一個數量級,從而很好地彌合了研究與商業化應用之間的鴻溝。

以下為達摩院兩周年的成績單:


飛天 AI 平臺重磅發布!阿里擁抱 AI 這五年


鄢志杰表示,目前在阿里集團內部的電話客服、政務、智慧地鐵等多業務場景都用到了語音交互技術能力。近幾年阿里在語音交互領域取得的重大技術成果主要體現在兩方面,一是,語音識別的聲學模型在交互效果上更加自然。二是,去年發布的業界最小的語音模組真正做到了簡單“復制”與機器交互的能力。在本次云棲大會上,這個模組又有了最新的升級:體積更小、功耗更低、更便宜、更易被集成。這里的“被集成”指阿里的語音技術可以幫助其他在語音交互領域探索的客戶做業務升級。

在我們團隊,禁止講‘賦能’”。

賦能無疑是當下科技互聯網圈常用的高頻熱詞之一,阿里為何禁提“賦能”?鄢志杰繼續解釋道,很多傳統企業在垂直領域深耕多年,專業能力扎實,阿里的技術并非為其賦能,而是幫助客戶產生價值,阿里技術的價值在于將門檻降低、讓更多人使用,從而產生廣泛的社會價值。

現在,達摩院更多扮演了阿里巴巴 AI 技術中臺的角色,其核心能力通過云來輸出,當小前臺需要語音、圖像等技術的時候,技術中臺會為其提供源源不斷的技術服務和支持。

科學家下田野

曾經在較長的時間里,很少有人會覺得阿里是一家技術公司?!鞍俣鹊募夹g、騰訊的應用、阿里的產品”,業界常認為在 BAT 中,阿里是技術實力最弱的,片面印象的形成除了阿里強大的電商基因,還因為英語老師出身的馬云不懂技術,這在技術公司中是少見的,不論是李彥宏、馬化騰還是張一鳴、雷軍、周鴻祎、丁磊等人皆是程序員出身。

兩年前,在達摩院成立時,馬云談到這點時說道,“我沒覺得不懂技術多丟人,不懂技術裝得懂技術才丟人。我確實不懂技術,但我們尊重技術、欣賞技術、信仰技術”。

今天,可能已經很少有人否認,不懂技術的馬云帶出了一家技術最強大的公司之一。甚至有觀點認為阿里在技術上的成功恰恰是因為馬云“不懂技術”。

2018 年 10 月 31 日,在退休之前,馬云最后一次以董事局主席的身份致信股東,他表示,9 年前阿里已經轉型為一家技術公司,已在大數據、云計算、人工智能、物聯網上做了全面布局和準備。

“阿里在商業上的成功掩蓋了它技術上的實力和投入“,阿里巴巴首席技術官行癲(張建鋒)曾感慨,言語之間夾雜著些許“委屈”的情緒。

普華永道發布的《2018 全球創新企業 1000 強》報告中顯示,阿里巴巴的研發支出連續三年居中國上市企業之首。2018 年,阿里研發支出達 247 億元,是騰訊的 1.3 倍、百度的 1.8 倍、攜程的 2.7 倍、京東的 4 倍,其最近兩年的研發費用占總收入的比例高達 15.65%。

伴隨著人工智能熱潮的來臨,BAT 紛紛擁抱 AI。在 AI 的布局上,三家也各有千秋。

百度對 AI 的布局是最早的,阿里次之,騰訊最晚。2013 年 1 月,百度宣布成立深度學習研究院(IDL),李彥宏親自擔任院長,同年 4 月,百度深度學習研究中心在美國成立。為布局 AI,百度先后招徠了吳恩達、陸奇等 AI 大神加盟。在百度的 AI 布局中,百度大腦、自動駕駛、百度智能云是重點押注的方向,百度大腦整合了深度學習、語音技術、視覺技術、自然語言處理、知識圖譜等核心技術,目前已經升級到 5.0,且由百度大腦核心能力支持的 Apollo 和 DuerOS 兩大 AI 開放平臺的生態體系漸豐。在自動駕駛方面,百度在該領域的專利申請量居國內第一。

相較 BA,騰訊在布局 AI 上有些后知后覺。在 2017 年 11 月的騰訊全球合作伙伴上,騰訊 CEO 任宇昕將“AI in all”作為騰訊發展 AI 的愿景。在去年 9 月進行的第三次組織架構調整中,云和 AI 被騰訊視為擁抱“產業互聯網”的關鍵武器。在內部,騰訊的 AI 力量較為分散,主要有騰訊 AI Lab、騰訊優圖、WechatAI 三大實驗室,專注計算機視覺、語音和語義理解、自然語言處理和機器學習等方向,因為存在賽馬機制,三大實驗室關注的研究方向會有重合之處。近兩年,騰訊一直倡導“科技向善”,試圖將其打造成騰訊 AI 具有辨識度的標簽。目前,在計算機視覺領域,騰訊 AI 優勢明顯,其在醫療、金融、零售方面的應用較強。

依托電商場景和數據金礦優勢,阿里在智能客服、語言 / 語義理解、自然語言處理、計算機視覺等 AI 研究方向上具有顯著優勢。阿里最早做 AI 時主要是業務驅動,完全從算法角度做,現在越來越完善,從算法到框架到硬件,最近兩年,在軟件之外,阿里 AI 還在向硬件發力。去年 9 月 19 日,在 2018 云棲大會上,阿里巴巴 CTO、達摩院院長行癲宣布成立平頭哥半導體公司。成立近一年來,平頭哥先后發布了芯片玄鐵 910 和一站式芯片設計平臺 “無劍”。

在 9 月 25 日云棲大會現場,阿里巴巴 CTO 行癲(張建鋒)發布了由平頭哥研發的阿里巴巴第一顆“大芯片”—含光 800,據稱它是全球最高性能的 AI 推理芯片,在業界標準的 ResNet-50 測試中,含光 800 推理性能達到 78563 IPS,比目前業界最好的 AI 芯片性能高 4 倍;能效比 500 IPS/W,是第二名的 3.3 倍。隨著含光 800 的發布,平頭哥端云一體全棧產品系列初步成型,涵蓋處理器 IP、一站式芯片設計平臺和 AI 芯片,實現了芯片設計鏈路的全覆蓋。

“在全球芯片領域,阿里巴巴是一個新人,玄鐵和含光 800 是平頭哥的萬里長征第一步,我們還有很長的路要走”。 張建鋒表示,阿里巴巴未來將用“軟件的優勢”、“互聯網公司的速度”做芯片,目標是轉型為一家軟硬件協同一體化的科技公司。芯片或許會成為阿里布局 AI 生態具有辨識度的一個標簽。

在技術公司轉型的過程中,阿里強大的電商基因與技術戰略相互融合,倒是形成了一種饒有特色的新特點。場景能夠與技術深度融合是阿里發展 AI 技術最大的優勢和發展策略??v觀如今的 AI 創業公司發展現狀,90% 的 AI 創業公司燒錢太厲害卻賺不到錢,根源在于找不到合適的落地場景、天然具有大規模應用場景、業務倒逼技術發展的阿里則很好地規避了這個問題。

達摩院成立伊始,馬云就曾直截了當地告訴王堅,這 1000 億啟動資金給你就是創業啟動資金,未來是要靠自己掙錢的,90% 以上研究的東西,不能只在實驗室里面,必須在市場上。馬云認為,只有讓企業家和科學家完美結合,這個世界才有未來。

“阿里有一大特色,叫做科學家下田野,科學家也會去見客戶”。

鄢志杰打趣地說道,這個特色在 iDST“上山下鄉”運動時已經體現得淋漓盡致。他認為,商業價值倒逼需求也是阿里 AI 的與眾不同之處,“AI 技術怎樣上云,如何幫助阿里云生態的伙伴創作價值,在一定程度上,這并不是一個主動選擇,而是一種被迫選擇,是阿里云天然使命的倒推。除了刷榜和純技術因素以外,一項技術能夠給社會產生什么樣的價值,阿里云在這方面的思考比別人早一點?,F在看到,別人也都走上這條路了。在聽到來自市場、商業環境前線的‘炮火’的時候,阿里希望去做一些真正對 AI 產業化產生影響力的產品”。

擁抱 AI 已經成了全球科技公司的主流戰略,但不同的公司有各自的技術路線,賈揚清覺得阿里最大的優勢是學以致用,與很多公司通過算法需求往下設計系統、搭建架構不同,阿里是一個囊括底層架構、硬件等的更加全棧的環境,上面的業務需求、應用很容易通過融進業務中接受到大規模的錘煉并找到接下來的演進方向。


飛天 AI 平臺重磅發布!阿里擁抱 AI 這五年


阿里 AI 全景圖

一般而言,衡量和評判一家公司的 AI 實力,需要從三個維度做考量:系統能力、算法能力、應用能力。系統能力主要考慮 AI 的基礎架構、軟件協同設計,可從整個開發者平臺的實力、落地場景中體現出來;阿里的算法能力主要體現在達摩院上,如在圖像識別方向的算法研究上,阿里已取得顯著成果。應用能力的目標是希望讓每一個人都非常自然地使用 AI,談到該能力,賈揚清認為,目前整個業界在 AI 應用層面還處于早期階段,應用能力的提升是最終讓“AI 擁有無限可能”的必經之路,這也是阿里推出飛天 AI 平臺的目標所在。

今天,阿里巴巴首次公布了其人工智能調用規模:每天調用超 1 萬億次,服務全球 10 億人,日處理圖像 10 億張、視頻 120 萬小時、語音 55 萬小時及自然語言 5 千億句。


飛天 AI 平臺重磅發布!阿里擁抱 AI 這五年

一年前,金榕曾在接受采訪時表示希望能夠幫助阿里巴巴從一個技術的跟隨者變成領導者,并在一些重要技術上取得領先?,F在再來看這個目標,金榕欣喜地看到阿里 AI 發生了兩個很重要的變化:已經不少團隊在順著這個目標為核心去努力,且有很多團隊不僅在考慮解決當下單純的業務問題,而著眼到更遠處希望解決未來根本性的問題。

我認為這兩件事能夠讓阿里在未來做到 Leader。做 Leader 一定是一個堅持的過程”。


相關:

梅根密友:哈里夫婦受威廉“霸凌”,退出王室是被逼的英國蘇塞克斯公爵夫婦逍遙過完自己六周的假期后回到英國,扔出一個爆炸性的消息:“辭去高級王室官員職位”,引起了軒然大波。梅根早已“逃回”了加拿大,扔下哈里王子一人跟整個王室談判。據此前報道,查爾斯王子..

“20200202”遇休息日,多地民政局將加班辦結婚登記今年2月2日,因完整寫法為“20200202”,被稱為“完全對稱日”。又因其諧音為“愛你愛你”,也被網友戲稱為“最佳領證日”。遺憾的是,當天正好是周日,正常來說,民政部門不會上班。澎湃新聞(www.thepaper.cn)..

海南航校訓練飛機在湖北失事 一名教練兩名學員遇難1月13日中午,據湖北機場集團空管站消息:海南航校一訓練飛機載1名教練員及2名學員執行訓練飛行任務。在返航過程中與塔臺失去聯系,懷疑在湖北長陽縣資丘、火燒坪一帶失事。15時20分許,該訓練飛機在長陽檢珠山一..

相關熱詞搜索:計提壞賬準備的會計分錄 計提工資會計分錄 計無施 婚戀網站排名 婚戀網站婚戀網

上一篇: 蘋果公司回收舊款iPhone手機,欲成為“閉環”制造商?
下一篇: 注意!衛星電話可以辦理了,但并不適用于普通用戶

百变王牌开奖