盡管新冠所釋放的顛覆性力量仍在持續重塑著全球商業生態系統,但一個重要趨勢仍未改變:當前全球正穩步邁向數字化、智慧化世界。數據作為新型生產要素,成為讓物理世界和數字世界靈魂互通的橋梁。那么數據新型要素需要怎樣的新存儲呢,未來哪些應用將影響到數據存儲產業的發展走勢呢?
早在2020年1月,浪潮信息首席架構師葉毓睿曾經寫過《2020:下一個十年,存儲發展的趨勢是什么》一文,從下往上的視角,談到未來十年數據存儲需要以更高效、更低成本的方式,圍繞著數據從產生、存放、保護、優化、利用,直至成為資產的全生命周期,滿足數據對存儲提出的要求。文章還提出十個存儲關鍵詞,分別是:分布式存儲、云存儲、容器存儲、全閃存、AI存儲、區塊鏈存儲、邊緣存儲、生物存儲或基因存儲等等。
這次,我們從上往下,站在業務應用的角度,從各個行業、各個領域篩選正在或可能加速數據存儲創新的十大應用,包括:數據倉庫、運營商網絡云、醫學影像、傳媒和影視、自動駕駛、智能制造,以及處在萌芽或起步階段的區塊鏈、圖技術、生成式AI、元宇宙等等。
一、商用階段
1. 金融:數據倉庫、數據分析
IDC在《IDC FutureScape:金融行業與支付科技十大預測 -- 中國啟示》中提出,到2025年,30%的處于第一梯隊銀行將基于云部署其數據倉庫和數據分析業務。
實時有效的數據分析將為提供客戶的規?;睬轶w驗、提高機構運營效率、改善企業風險管理以及前所未有的安全和欺詐檢測水平。而金融機構的數據孤島現狀,是實現所有這些能力的一大挑戰?;谠频臄祿渴鹂梢猿浞掷肐T平臺豐富的數據管理運營經驗和專業知識。而行業用戶則可以專注提升數據及數據分析使用者的技能提升,最大程度發揮數據價值。
以交通銀行為例,創始于1908年的交通銀行,不僅是中國歷史最悠久的國有大型商業銀行之一,更是數字化、智慧型銀行建設的先行者。交通銀行堅持“數據驅動發展”戰略,通過全量采集、智能處理,將業務數據轉化成可以被記錄、存儲和使用的數據資產,同時推動數據業務化,用數字化思維創新產品設計、重構業務流程。隨著數據實時存儲、處理需求提升,交通銀行基于浪潮集中式存儲,加速構建“安全可靠、高效經濟”的金融數據存儲平臺。
2. 通信:網絡云
什么是NFV網絡云呢?網絡云由硬件層、虛擬層和虛擬網元三層以及NFV管理和編排系統組成。從硬件維度看,可以把網絡云想象為由一臺臺計算、存儲、網絡等物理設備圍成的“數據湖”,上面高速運行著來自上層網元及相關業務的數據流,給億萬用戶帶去豐富、個性化的數據服務。舉個例子,當我們上網購物的時候,購物網站數據會從電商平臺出發,乘坐通信網絡的“擺渡船”渡過網絡云到達用戶面前。
相比過去打電話、發短信、用彩鈴的“老三樣”,移動互聯網的發展使得人們可以隨時隨地通過刷微博、看視頻、微信溝通和娛樂、瀏覽網頁、地圖導航、網上購物、外賣訂餐等,這些業務的海量數據都構建在大規模網絡云資源池之上。當14億中國人把衣食住行搬上移動互聯網的同時,也給網絡云資源池帶來巨大挑戰。
首先,用戶需求動態變化。傳統業務流量主要是端到端模式,較為穩定;而互聯網流量易受熱點內容牽引,數據流復雜多變:比如雙十一購物狂潮,電商平臺訂單創建峰值達到58.3萬筆/秒,要求通信網絡提供高并發支持;又如優酷春節期間有超過23億人次上網刷劇、抖音拜年短視頻增長超10倍,需要通信網絡能夠靈活擴充帶寬。面對用戶動態多變的需求,通信網絡需要具備快速洞察和響應用戶需求的能力,提供高效、彈性、智能的數據服務。
其次,新技術帶來性能剛需。一方面隨著物聯網技術不斷發展,未來十年將有海量設備接入網絡,“萬物互連”在帶來美好憧憬的同時,“機器生產數據”、“機器使用數據”發展新階段也將帶動網絡連接數不斷增加、數據規??焖贁U大。另一方面,一些新業務,如4K/8K視頻、虛擬現實游戲等,對網絡吞吐量、丟包率、時延等性能指標有更嚴格的要求。
對此,運營商給出了解決之道:運營商抓住數字經濟發展機遇,全力推進“新基建”、融合“新要素”、激發“新動能”,具體包括:夯實“大平臺”數字底座,融合數據要素和技術要素助力“大數據”開發利用,通過通信技術與ABCDE(人工智能、區塊鏈、云、大數據、邊緣計算等新技術)、業務場景融合創新支撐數字化升級。運營商以智慧中臺戰略為指引,開展全域數據治理,以全量數據“進得來、管得住、看得見、用得好”為抓手,實現數據從資源向資產、資本轉換。在技術方面,運營商推進架構轉型,構建全網多中心分布式協同平臺,通過“兩層一中心”實現數據和管理的統一管控,提升數據儲算效能,實現數據自由流動。目前,中國最大的運營商構建了6大區7大資源池,打造了高性能、高可靠、高擴展的超大規模存儲資源池,確保億級用戶暢享高速網絡。
3. 生物醫學:精準醫療、影像云、腦成像
“醫療的背后,是對生命的探索,是對人與自然關系的把握?!薄渡疃柔t療》的譯者后記中這樣寫道。
精準醫學也被稱為“數字醫學”,是一個建立在了解個體基因、環境和生活方式基礎上的新型疾病治療和預防方法。它是以個體化醫療為基礎,隨著基因組測序、生物信息與大數據、云計算等前沿科技的交叉應用而發展起來的新型醫學概念與醫療方式?!爸挥袛底只拍艹蔀檎嬲馁Y源?!北究茖W計算機,博士攻讀醫學專業的高峰更深諳數字驅動現代醫療的意義。
比如,醫療影像云。一位肺炎患者的二維CT影像大概在300張左右,做一次三維CT檢測則會產生數千幅原始小文件。據此計算,患者拍一次10mm普通CT影像,產生的數據量會在10至32MB;一次1mm的高精度CT檢測會有1000多張片子,數據量能達到10GB。
又如,腫瘤大數據。中山六院基于浪潮分布式存儲平臺構建了癌癥數字化生命資源庫。通過整合來自高通量檢測手段的多組學數據和醫療信息系統中的結構化病歷、數字病理、醫學影像,實現現有臨床資源數字化,做到“有數有據”;基于數字化的生物醫學資源構建大數據圖譜、開發醫學人工智能實現數據知識化,提供輔助精準診療手段;通過“互聯網+”醫院將先進的AI輔助診療技術下沉到基層,提高醫療質量。大數據、人工智能技術在精準醫學領域的應用,幫助腫瘤患者獲得個性化治療方案,全程數字化讓這一切成為可能。
再如,腦科學是人類認知的終極疆域,對于提升人類認知水平、腦疾病診治和人工智能技術發展具有十分重要的意義。由清華大學科研團隊研制出新型超寬視場高分辨率實時顯微成像儀器(Real-time Ultra-large-Scale imaging at High-resolution,以下簡稱RUSH)實現了重大突破,該儀器可實現1平方厘米寬視場、400納米高分辨率、30幀/秒高幀率、每幀3.36億像素高分辨率的多維多尺度連續成像能力,將活體動物腦神經觀測數據通量由1000萬像素/秒提升至100億像素/秒(相當于20.16GB/s),每天需要處理1.7PB左右數據。這是世界上全球指標國際第一的光學顯微鏡,視場是同等分辨率下商用顯微鏡視場的120倍,數據通量是全球第二大高通量顯微儀器2p-RAM顯微鏡的500多倍。
4. 傳媒和影視:智能媒體和超高清影視
傳媒,尤其是和AI結合的智能媒體,成為新數據時代的應用場景之一,以廣電、短視頻、直播、在線視頻為代表的行業用戶加速應用數字化新技術以應對挑戰。IDC數據顯示,2021年智能媒體解決方案市場規模約為7億元人民幣,預計該市場五年CAGR達46.3%。
技術進步提高了內容的生產、管理、匹配、加載、互動效率,媒體發展趨勢主要集中在內容形式視頻化、內容生產高速化,以及內容傳播的交互性。內容生產和內容分發正在發生著本質的變化,媒體從業者面臨學習使用工具以適應新環境的挑戰。
在影視領域,以方特動漫3D動畫制作為例,近年來以方特動漫為代表的中國動畫制作不斷擺脫過去模仿的老路,打造出屬于中國原創的熱門IP故事。據方特動漫介紹,《熊出沒》系列發展到現在第七部,在視覺效果層面大體上經歷了從懵懂期、高速發展期和成熟期三個階段,《熊出沒7》標志著《熊出沒》系列電影進入到成熟期,其背后的相關技術都日臻成熟。以《熊出沒7》為例,光角色就包括熊大、熊二、雄鷹、火烈鳥、搖滾獅子等387個,每個角色的塑造都是栩栩如生,像動物毛發單只最高超過上千萬根,比肩自然界里真實動物的毛發數量。
5. 交通:自動駕駛、車路協同
據智研咨詢數據,2020年全球自動駕駛市場規模超過60億美元,2035年全球自動駕駛車輛預計超過5400萬輛。麥肯錫報告則顯示,中國自動駕駛規模將突破萬億美元,有潛力成為世界上最大的自動駕駛汽車市場,并將使中國自動駕駛汽車行業的流動性利潤至少增加600億美元。
車路協同基于云計算、大數據、人工智能、物聯網以及新一代通信技術等新興技術,通過“人-車-路-云”等交通要素的實時信息交互與協同運行。不僅能夠提升道路交通安全性,提高交通運行效率,還可助力自動駕駛技術發展,已成為智能交通的重要組成部分。近年來,國家密集發布了多項政策,推動我國車路協同的發展。同時,各地印發的智能網聯汽車發展規劃及相關政策中,車路協同均被列為視為需突破和大力發展的核心技術。在此背景下,中國車路協同依托智能網聯示范區建設與智慧高速建設,正逐步從測試驗證走向成熟落地。
從功能實現視角,車路協同主要可以實現交通安全類、交通效率類以及信息服務類三大類的功能。在高速場景和城市道路場景中,車路協同具體實現的應用會有所不同。例如,效率提升類的應用在高速場景中主要包括自由流收費、貨車編隊駕駛、大交通流量高速公路的主動交通管控等,而在城市場景中則包括了車速引導、車輛編隊引導、無信號燈協調通行等。
6. 制造:數字孿生驅動智能制造
什么是數字孿生?Gartner將數字孿生定義為一種旨在了解資產狀態、及時應對變化、改善經營和增加價值的實體軟件設計模式。目前,各行各業的企業機構都在采用數字孿生,其中制造領域尤為活躍,據Gartner預測,實施物聯網的企業機構中有75%已經使用數字孿生或者計劃在1年內使用該技術。比如英偉達(NVIDIA)公司在2021年4月新產品發布會上,使用數字孿生技術構建該公司CEO黃仁勛的虛擬人物。此后長達3個多月的時間中,沒有人發現英偉達公司使用了虛擬人物進行視頻演講,這表明該公司的數字孿生技術已達到以假亂真的地步。英偉達公司透露,實現這一創舉的Omniverse平臺已經用于寶馬公司的汽車生產線打造數字工廠,并助力愛立信構建數字孿生城市。2021年11月9日,在GTC 大會上,英偉達CEO 黃仁勛公布了一系列最新技術,從自動駕駛汽車到虛擬化身、再到機器人乃至地球氣候建模(E-2);其中E-2 項目,即 Earth Two 地球二號,通過建立地球的數字孿生來模擬和預測氣候變化。E-2能夠在Omniverse中以數百萬倍的速度運行Modulus創建的AI物理模型。
數字孿生在智能制造中的優勢是顯著的,工業界有一種“工業領域1%的革命”的說法,即全球工業生產效率提高1%,成本降低300億。據Gartner稱:“到2021年,一半的大型工業公司將使用數字孿生,從而使這些組織的有效性提高10%?!?/span>
數字孿生通過設計工具、仿真工具、物聯網等手段,將物理設備的各種屬性映射到虛擬空間中,形成一個可拆卸、可復制、可修改、可刪除的數字圖像,提高了操作者對物理實體的理解。這將使生產更加方便,也將縮短生產周期。當然,數字孿生通過對目標感知數據的實時了解,借助于對經驗模型的預測和分析,通過機器學習可以計算和總結出一些不可測量的指標,也可以大大提高對機械設備和過程的理解、控制和預測。
因此,通過對物理空間和邏輯空間中的對象實現深刻的認識、正確的推理和精確的操作,數字孿生可以提高設計、運行、控制和管理的效率,還能提高教育和培訓的效率,降低成本和潛在的風險。
中國研發的全數字樣機與已經服役的飛機其實就是一種“數字孿生”。早在2000年,中國就創造性地使用了全飛機數字樣機的設計制造技術,全機三維數模5萬多個結構件、40多萬個標準件。
華中科技大學通過數字孿生技術,實現校園的全景式、沉浸式、交互式管理,將物理世界的人、財、物與數字世界的信息充分貫通融合,在數字地圖中不但可以查看校園的房屋、資產、門禁、交通、路燈、水電等常態信息數據,還可以實時查看教學和科研活動過程以及參與活動中的人員、設備、狀態以及預測等信息。包括虛擬仿真應用在內數字孿生及其他核心業務,就運行在浪潮的中高端存儲上。
在中國,隨著數字化投資持續增長,制造業進入高質量發展階段,高端化、智能化、綠色化成為制造業的發展趨勢。
智能制造需要個性化、定制化程度高的數據基礎設施,匯集不同物聯網設備的數據以分析總體運行情況,支持新業務快速部署上線,滿足企業生產管控、供應協同和看板管理等需求。
浪潮敏捷供應鏈獲得哈佛商業評論2021“鼎革獎”。浪潮作為全球領先的算力基礎設施提供商,基于JDM(聯合設計開發,Joint Design Manufacture)模式,構建了敏捷柔性供應鏈體系,以數字化、智能化的手段,打通需求、研發、生產、交付全流程,整機設計、交付能力全球領先,開創了服務器供應鏈與生產制造從傳統的大規模標準化到大規模定制化的全新時代,為云計算、人工智能時代下,B2B企業解決供應鏈轉型挑戰,提供了成功借鑒和示范效應。目前,浪潮服務器年產能提升4倍,生產效率提升30%以上,人力投入減少75%,TCO成本下降31%,交付周期縮短60%,創造了單日10000節點服務器的最高交付部署速度。
無論是數字孿生,還是其他智能制造技術,都將帶來數據量的迅猛增長。尤其是數字孿生,因為需要通過物聯網按照數分鐘,甚至有不少場景需要近乎實時的同步數據,因此非結構化數據的存放需求可能帶來十倍甚至百倍的提升;更需要注意的是,這些原始數據是零散的,相互之間看不出關聯,需要有機的整理、組織,從而對虛擬模型建模,也即完成從非結構化到結構化的轉換,并且再以圖形、視頻、甚至3D等多維立體的方式呈現。這對存儲帶來巨大的需求和挑戰。
二、新興應用
盡管新冠所釋放的顛覆性力量仍在持續重塑著全球商業生態系統,但一個重要趨勢仍未改變:當前全球正穩步邁向數字化、智慧化世界。2021年12月,《“十四五”國家信息化規劃》明確提出,“十四五”時期,信息化進入加快數字化發展、建設數字中國新階段。數據作為新型生產要素,成為讓物理世界和數字世界靈魂互通的橋梁。那么數據新型要素需要怎樣的新存儲呢,未來哪些應用將影響到數據存儲產業的發展走勢呢?
除了《面向2030:影響數據存儲產業的十大應用(上)》里分享的六大商用階段的主流應用,本篇我們還將分享幾個處在萌芽或起步階段應用,包括區塊鏈、圖技術、生成式AI、元宇宙等等。
1. 區塊鏈(未來1-7年)
物理學家張首晟曾提到:“人工智能現在碰到了一個很大的瓶頸,因為如果 AI 要非常大的進步,它必然要需要很大的數據,但是現在的數據提供方都沒有足夠的激勵機制提供極大量的數據”。如何激勵數據提供方(也即用戶和組織)提供數據,尤其是隱私數據(數據越隱私,價值可能越大)呢?
如何在激勵數據提供方分享數據的同時,又能保護隱私呢?答案就是區塊鏈和人工智能的結合。張首晟在文章《區塊鏈技術是互聯網世界新的分合轉折點》中自己回答到:“一旦有了區塊鏈之后,如果創造數據能被價值化、共識化,就會形成一個大的數據市場,使得人工智能也能夠更往前進一步”
區塊鏈解決了數據確權、激勵分享、數據資產交易和流轉等問題。但區塊鏈要發展,區塊鏈IT基礎設施要先行,尤其是其中的重要組成部分 -- 區塊鏈存儲。我們可以把它視為去中心化的云基礎設施的一部分,或者說是去中心化的云存儲。它現在還處在非常早期的階段,但已經逐漸向我們走來。
Gartner在技術成熟度曲線中,將區塊鏈存儲(Distributed Storage in Blockchain)列入科技誕生的促動期 (Technology Trigger),并預計2023~2028年左右,進入到成熟應用的技術階段,將有大量主流用戶開始接納。
以政府領域為例,近一兩年國內各個部委和各地省市,大力推行政府的數字化轉型,也即數字政府和數字治理,有望促進政務數據開放共享、數據交換,將催生對具有數據保護防單點的區塊鏈存儲的需求;另外隨著AR/VR、加密藝術如數字藏品的興起,數據存放在區塊鏈存儲將逐漸成為共識,如何在法規政策的監管合規下,將數據資產留存在國內,也將催生對區塊鏈存儲的需求。
又如在金融領域,IDC區塊鏈高級市場分析師洪婉婷表示:“當前,核心企業、金融機構、供應鏈金融提供商三股勢力,紛紛牽頭推動以自身業務為核心的、基于區塊鏈的供應鏈金融平臺,在為小微企業提供融資便利的同時,也有效控制了自身業務的不確定性,形成資金閉環,以新型信任技術與模式加強了合作紐帶。在疫情常態化的當下,構建區塊鏈信任體系,以此提升產業鏈的韌性,將成為更多企業的發展選擇?!?/span>
2. 圖技術(未來3-6年)
圖技術指圖數據管理和分析技術。這些技術能夠探索企業機構、人或交易等實體之間的關系。分析數據之間的關系可能需要涉及大量異構數據、存儲和分析,而這些都不適合用于關系型數據庫。圖分析由確定跨數據點“關聯性”的模型組成。
本質上,圖技術決定了不同數據集之間的“關聯性”/關系。以社交媒體分析為例,圖技術可以評估不同路徑何時通過意想不到的社區成員來傳播行為,進而加強對社交媒體網絡中影響者和社區的識別。
圖技術的潛在應用范圍十分廣泛,這項技術將需要3至6年的時間才能達到早期多數采用階段。圖技術中將有很大一部分作為現有數據平臺的集成組件出售,這些組件均為自主開發或通過專業廠商的轉售協議集成。憑借其特定圖處理語言和能力、可擴展性以及計算力,圖數據庫是存儲、操作和分析圖模型中大量不同觀點的理想選擇。
3. 生成式AI(未來6-8年)
生成式AI指的是一種從數據中學習對象的特征,并且使用這些特征生成全新的、完全原創且與原始數據相似的工件。
生成式AI領域將在科學發現和技術商業化方面迅速發展。雖然目前這還是一項十分超前的技術,但它已在創造新材料到保護數據隱私等廣泛的應用中取得了成功。但生成式AI的安全問題和負面使用(例如深度偽造)可能會減緩其在一些行業的采用。
生成式AI之所以具有很高的影響力,是因為全球正在不斷增加對生成式AI方法的探索,并且這項技術在許多行業證明了自己,包括生命科學、醫療健康、制造、材料科學、媒體、娛樂、汽車、能源等行業。
4. 元宇宙(未來3-10年)
2021年“元宇宙”概念引發熱議,在資本市場、媒體、互聯網公司共同推動下迅速“出圈”,成為年度熱點。不久前,全球科技巨頭Facebook宣布其業務布局轉向元宇宙,甚至將自己的公司名字更改為Meta,引發了各界對元宇宙的強烈關注;今年3月,被譽為最能體現元宇宙概念的游戲《羅布樂思》獲得了5.2億美元融資,該游戲的開發商Roblox上市首日市值突破400億美元,比一年前估值漲了10倍;字節跳動也以近百億的價格收購了VR創業公司Pico,彰顯其布局元宇宙的決心……國內外各大科技巨頭紛紛開啟了探索元宇宙的步伐。
據IDC預測,2022年元宇宙數字基礎建設參與者將領銜發力。算力、AI、網絡通信、區塊鏈等作為元宇宙不可或缺的基礎設施組成,對元宇宙后期布局起到至關重要的作用。預計在2022年,以運營商、底層硬件公司、互聯網大廠為主的元宇宙基礎設施建設參與者會領銜發力,相關的產品研發、操作平臺創新、內容升級節奏加快。
數據存儲將在元宇宙發展中發揮著關鍵性作用。一方面,元宇宙相關技術的發展和場景落地,對數據體量和維度將有更高的要求,需要收集用戶更多的個人信息。預計,通往較理想元宇宙的狀態,將帶來數據存儲十倍速甚至百倍速的發展;另一方面,數據安全是元宇宙健康有序發展的重要前提。為平衡好數據使用和數據安全,需要前瞻性構建元宇宙相關數據的收集和使用規范。
小結
層出不窮的新應用,對于不同的企業機構而言,不同的應用趨勢會產生不同的影響。企業業務增長的不同時期可能需要不同的技術組合,優先考慮哪些趨勢需根據CIO和IT領導者對其企業機構短期業務目標和戰略業務目標的理解來判定。
隨著數字經濟將持續高速發展,中國將加大戰略性、前瞻性、顛覆性技術的研究力度?!丁笆奈濉眹倚畔⒒巹潯诽岢?,到2025年數字中國建設取得決定性進展,信息化發展水平大幅提升,數字基礎設施全面夯實,數字技術創新能力顯著增強,數據要素價值充分發揮,數字經濟高質量發展,數字智能效能整體提升。預計到2025年數字經濟核心產業增加值占GDP比重將達到10%,關鍵業務環節全面數字化的企業比例將達到60%。浪潮存儲將秉承“云存智用運籌新數據”理念,持續加新存儲技術研發投入與創新,以領先的技術賦能千行百業,釋放數據要素價值加速行業數字化轉型。