清华大咖~分享终于有人把云计算、大数据和人工智能讲明白了
人工智能已經逐漸走進我們的生活,并應用于各個領域,它不僅給許多行業帶來了巨大的經濟效益,也為我們的生活帶來了許多改變和便利。那么我們很多覺得學習人工智能是一件很難的事情,接下來小編想通過這些文章的分享,讓大家對編程和人工智能有更進一步的認識!
巨量模型是 AI 發展的大勢所趨
雖非蟾宮謫降仙,何懼冰殿冷徹骨。窺簾斜視金屋小,多少俊才在此關。
上面這首名詩并非是中國古代那位大家之作,而是浪潮新近發布的全球最大規模人工智能巨量模型—— “源1.0”?的杰作。“源1.0”,其參數量高達 2457?億,借助文本分析模型,獲取 5TB?高質量中文數據集,其作為語言模型可較好完成尤其針對中文的閱讀、理解、推理、邏輯判斷等任務。
為什么會出現如此體量巨大的模型那?隨著各類行業人工智能場景應用的增多,AI?模型越來越多樣化、復雜化,AI?小模型可以完成各行各業中的實際應用,但其通用性較差,精準度也存在局限性,應用場景更換,AI?小模型有可能就無法適用。
“人工智能如何發展出像人類具備邏輯、意識和推理的認知能力,是人工智能研究一直在探索的方向。目前來看,通過大規模數據訓練超大參數量的巨量模型,被認為是非常有希望實現通用人工智能的一個重要方向。”王恩東院士認為,隨著巨量模型的興起,巨量化已成為未來人工智能發展非常重要的一個趨勢。
巨量模型將是規范化創新的基礎。在過去的十年間全球范圍內,人工智能模型參數大小逐級遞增,由千萬級增長至千億級。2020?年,OpenAI?在發布?GPT-3?深度學習模型具備 1750?億參數,正式將語言模型帶入千億參數時代。2021?年,世界范圍內也出現了幾個超大模型,例如英文領域有微軟和英偉達推出的 MT-NLG?巨量模型,具備 5300?億參數;中文領域有浪潮推出的具備 2457?億參數的源1.0,百度和 PCL?團隊推出的具備 2600?億參數的 ERNIE 3.0 Titan?, 甚至還有 Switch Transformer?這種 1.6?萬億參數的模型(Switch Transformer?使用混合專家 Mix of Expert,MoE,不是單體模型)
從 2021?年巨量模型的研究發展來看,巨量模型的趨勢才剛剛開始,2022?年,甚至會推出萬億級別的單體模型。同時,巨量模型的資源使用方面的優化也會成為新的研究方向,相信未來會出現更多參數但需要更少 GPU?的巨量模型。
對于人工智能的發展來說,在實現理想泛化能力的基礎上,越小的模型,將會更加廣泛與靈活地適配應用場景。但在這條通完理想的道路上,首先需要使用大模型、通過提取海量有價值數據進行充分的訓練和學習,才能逐漸調優至最優最理想結果,然后在進行小模型的訓練,實現靈活廣泛的適配。
AI 不斷超邊緣側滲透
邊緣計算指的是在網絡邊緣結點來處理、分析數據。邊緣結點指的就是在數據產生源頭和云中心之間任一具有計算資源和網絡資源的結點。比如手機就可以是人與云中心之間的邊緣節點,網關是智能家居和云中心之間的邊緣結點。
在物聯網技術迅速發展的當下以及日益增長的業務實時性要求使邊緣測和端側計算能力變得越來越重要。例如在工業互聯網中,對數據采集的準確性以及實時性要求不斷提高,采集的數據量也越來越巨大。為了更好的實時分析數據以及處理海量終端數據并減輕云端網絡傳輸壓力,人工智能算力會不斷向邊緣滲透,無論是更接近端側數據的輕邊緣或者更接近核心數據中心的重邊緣,2022?年,都將會迎來黃金發展契機。
IDC?預測,到 2023?年,將近 20%?的處理器將部署在邊緣側,用于處理 AI?工作負載;70%?的企業將在物聯網邊緣運行不同級別的數據處理。
端側的發展同樣會迎來黃金契機,端智能自身具有高實時、低時延、強隱私,近幾年有著飛速的發展,廣泛應用于人臉識別、手勢識別、圖像搜索、互動游戲等。雖然端智能存在算力不足的嚴重限制,但據 IDC?預測,用于推理工作負載的服務器市場份額將在不久的將來超過訓練,并在預測期內保持這一趨勢。而且隨著各大公司不斷推出算力性能更高的 XPU?,端智能受算力的限制會越來越小。
?AI 催生芯片多元化發展
在人工智能領域,數據、算法、算力是三個關鍵要素,而談到算力,就離不開芯片,近年來,人工智能應用落地場景越來越豐富,因此人工智能芯片呈現出多元化發展趨勢,通過不斷演進的架構,為下一代計算提供源源不斷的動力。
- 從需求側而言: 隨著智能城市、智能制造、智能金融、自動駕駛等領域的快速發展,支持語音識別、計算機視覺、自然語言處理的應用場景不斷廣泛,企業對人工智能芯片的需求越來越大。
- 從供給側來說: 人工智能在不同行業不同場景的差異化使用也催生了具備差異化特征的人工智能芯片。人工智能芯片的廣泛應用和應用常用的不斷豐富,為專門開發人工智能芯片的廠商帶來了絕佳發展機會,人工智能芯片產品呈現出更加細分多元的特征。例如寒武紀、地平線等都參與到芯片行業中,加速芯片的研發與進步。
需求和供給兩方面的變法推動著人工智能芯片行業和技術的多元化創新發展:
芯片類型
AI?芯片從技術架構來看,大致可以分為兩種類型:
- 算法加速型芯片: 以常用的一些芯片架構為基礎,增加對AI算法的加速單元,比如利用 CPU、GPU、ASIC?和 DSP?等架構,來加速現有的一些 AI?的算法。
- 自適應智能芯片: 這類芯片自身具備更多的靈活性,有能力去調整自己,改變自己,適應新的工作需求,甚至有一些自主學習的能力。比如神經擬態芯片、軟件定義可重構芯片等。
解決人工智能芯片功耗過大的一個思路就是比起主流的人工神經網絡更進一步地模仿生物神經元的工作方式,而這樣的方法也被稱為“神經擬態”(neuromorphic)。
人工智能行業日新月異,芯片廠商需要不斷研發和升級新的芯片產品來應對這一挑戰,特別是 GPU,同樣也包括 FPGA、ASIC?和 NPU?等。
IDC?研究發現,2021?年上半年中國人工智能芯片中,GPU?依然是實現數據中心加速的首選,占有 90%?以上的市場份額,而 ASIC,FPGA,NPU等其他非 GPU?芯片也在各個行業和領域被越來越多地采用,整體市場份額接近 10%,預計到 2025?年其占比將超過 20%。
神經擬態芯片具有低功耗、低延遲、高處理速度等優勢,其產業化和商業化還在持續演進中,機器學習的發展和對腦研究的深入將為神經擬態芯片的進一步發展帶來更多可能性。
部署位置
AI?芯片可以部署在云端、邊緣側和終端側。云端是數據和大型算力中心,承擔海量數據處理和大規模計算的載體,云端 AI?芯片需要具備高存儲容量、高浮點處理速度以及高擴展性。為了分擔云端的算力壓力及提高應用場景的實時響應速度,未來 AI?芯片會大規模且分散的部署在邊緣側,這要求芯片具有強大的適配能力,能適配各類復雜場景。
行業發展
隨著人工智能的廣泛應用,各類 AI?芯片需求層出不窮。
- 算力要求: 人工智能需要對非結構化數據進行資助操作,AI?芯片需要提供強大的算力才能高效應對各種使用場景。
- 高校散熱手段: 算力提高的同時,高效散熱手段越來越重要,高算力低能耗是 AI?芯片發展的趨勢。
- 算法靈活性: 未來會有深度學習以外的新型算法脫穎而出,這要求 AI?芯片不止能適應深度學習算法,也需要適用不同的算法。
AI 與云加速融合
AI?與云計算是天生一對,AI?與云計算的結合是大勢所趨。
國內外頂尖大廠都開始布局云智能領域。百度云和阿里云都分別升級為百度智能云和阿里智能云。京東云與 AI?事業部正式將原京東云、京東人工智能、京東物聯三個品牌統一為“京東智聯云”品牌。同時亞馬遜 AWS?、谷歌云和微軟 AZURE?,雖然沒有在名字上增加“智能”二字,但均已將 AI?視作戰略在布局。
AI?產業化飛速發展,loT、5G、邊緣計算等新技術的快速發展,提供的數據量飛速增加且數據結構日趨復雜,應用對算力的需求呈現指數級別增長,計算過程越來越復雜。AI?與云計算融合,催生了很多新的架構方式。
- 邊緣計算: 形成云端-邊緣的新計算架構
- 融合視覺、語音、語義等 AI?能力的多模態計算
- 高實時低時延的實時類 AI?應用,例如自動駕駛。
AI?與云的融合是必然趨勢,AI?公有云服務可以使企業高效的部署人工智能應用,輕松在云上獲取 AI?能力從而有效的接入和使用人工智能技術。人工智能技術的發展速度不斷加快,采用 AI?公有云服務可以在初期以較少的成本快速迭代。
行業領先企業也開始部署私有云,以支撐其包括人工智能在內的新興業務應用。搭配公有云、私有云和傳統數據中心的混合 IT?架構的發展趨勢對企業技術和業務創新產生顯著影響。
人工智能場景多點開花
隨著人工智能技術的發展,人工智能逐步實現在生產、經營環境的落地部署甚至是規模化應用,輔助各行各業向更加智能化、綠色化、綜合化以及多元化方向發展。
根據 2021?年 IDC?對于人工智能技術的應用現狀調研來看,計算機視覺目前是最熱門的應用技術,后面依次是視頻監控、圖像識別、智能攝像頭、人臉識別等企業應用。預計未來,企業會加深語音識別、自然語言處理等技術的應用。下圖是企業已部署和三年內部署人工智能場景的比例。
?從行業應用來看,人工智能的應用場景已經從碎片化過渡到深度融合的一體化,從單點應用轉換為多元化應用場景。人工智能在金融、能源、制造業、交通等方面應用廣泛,具體而言:
- 企業算力投入程度高,覆蓋面廣,進入成熟應用階段的反欺詐、風險評估、智能推薦等
- 智能供應鏈、智能之間、智能設備運維等制造業方面發展迅猛
- 受限于發展時間、算力、模型、技術、資金等原因的視覺感知、智能油田等應用場景仍處于發展初期階段,未來前景廣闊。
- 響應低能耗、低排放、可循環、可持續發展理念,人工智能可應用于綠色能源及環境生態治理中。
另外 IDC?針對不同行業在 AI?方面的投入、行業應用場景的成熟度、數據平臺成熟度等多維度進行全面評估,2021?年,人工智能行業應用滲透都排名 TOP5?的行業依次為互聯網、金融、政府、電信、制造;交通、醫療、能源、教育位列第六位到第九位。下圖是 2021?年中國人工智能行業滲透度。
?可見人工智能技術的落地為行業帶來更多價值,不僅提高了企業的運作效率、生產效率,還推動了企業創新的能力。2022?年,人工智能領域會迎來更廣泛更全面的應用,多點開花,全面整體推進社會的進步與發展。
政策利好,AI 如九天鯤鵬
人工智能行業作為戰略性技術之一,能有效推進疫情期、新常態下全球經濟復蘇和企業創新。人工智能受到世界各國的高度關注,各國加速人工智能國家級戰略布局,AI?受利好政策驅動,發展如九天鯤鵬,摶扶搖而上者九萬里,不斷加深在各領域中的應用。
自 2017?年到 2021?年,我國多次制定政策鼓勵人工智能不斷從基礎理論研究到行業應用實現全產業鏈發展。“十四五”規劃綱要中更是把新一代人工智能作為要公關的七大前沿領域之一,鼓勵加速人工智能前沿基礎理論突破、專用芯片研發、深度學習框架等開源算法平臺構建,促進學習推理與決策、圖像圖形、語音視頻、自然語言識別處理等領域創新,加速人工智能與諸如大數據、物聯網、邊緣計算等數字信息技術的融合發展,促進產業優化升級、生產力整體躍升。
2021?年 8?月美國國土安全部(DHS)科技局(S&T)發布《人工智能與機器學習戰略規劃》,該戰略規劃制定了三大目標:推動下一代人工智能和機器學習技術在國土安全部中運用,增加研發投資,利用這些技術建立起安全的網絡基礎設施;促進現有已成熟的人工智能和機器學習能力在國土安全部任務中的部署;建立、培養一支跨學科的 AI/ML?勞動力隊伍。
2020?年歐盟委員會發布的人工智能白皮書為歐洲的人工智能設定了一個清晰的愿景:一個卓越和可信任的生態系統。2021?年 4?月,歐盟委員會提出了一項旨在加強人工智能(AI)技術監管的法規草案。這項草案擬創建一個所謂“AI?高風險應用場景”的清單,對 AI?技術在關鍵基礎設施、大學招生、申請貸款等被認定為“高風險”應用領域的開發和使用制定新的標準,并進行有針對性的監管。
根據經濟合作與發展組織資料現實,目前全球已有 60?多個國家和地區陸續出臺人工智能政策和優先發展事項,制定和發布國家級 AI?戰略,各國重視人工智能產業生態發展,加強研究能力、強化相關產業配套、提升企業競爭力和創新力,積極探索負荷自身需求和優勢的 AI?發展途徑。
2022?年,在各國政策利好的基礎上, AI?必定迎來輝煌的發展。
這篇文章分享到這里就結束了,我還要推薦下我總結的一些資料,我自己是一名從事了5年人工智能工程師,辭職目前在做線上教育講師,創了一個交流功重浩,我每天都會在里面免費直播分享講座解答!今年年初我花了一個月整理了一份最適合2022年學習的人工智能干貨,在這里相信有許多想要學習人工智能的同學,保存一下圖片掃一掃即可免費領取一整套系統的人工智能基礎學習教程!
?
總結
以上是生活随笔為你收集整理的清华大咖~分享终于有人把云计算、大数据和人工智能讲明白了的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Java游戏编程不完全详解-2
- 下一篇: 申报2021国家高新技术企业认定,有哪些