【免费公测中】为数据赋予超能力,阿里云重磅推出Serverless数据分析引擎-Data Lake Analytics
摘要:?近日,阿里云重磅推出Serverless數(shù)據(jù)分析引擎-Data Lake Analytics,Data Lake Analytics,幫助更多不具備分析能力的存儲服務(wù),賦予其分析的能力。
近日,阿里云重磅推出Serverless數(shù)據(jù)分析引擎-Data Lake Analytics,Data Lake Analytics,幫助更多不具備分析能力的存儲服務(wù),賦予其分析的能力。
從生活中的購物交易,到工業(yè)上的生產(chǎn)制造,再到社交網(wǎng)絡(luò)媒體信息、企業(yè)化管理決策等等,大數(shù)據(jù)成為當前經(jīng)濟社會最重要的前進方向之一。越來越多的企業(yè)在面臨數(shù)據(jù)以指數(shù)級成倍增長的時候,第一選擇存儲服務(wù)來存儲數(shù)據(jù),那在人人高喊數(shù)據(jù)為王的時代,如果數(shù)據(jù)僅僅被存儲起來,而不加以分析,那數(shù)據(jù)的超能力也將毫無意義。
擁抱分析能力迫在眉睫
很多企業(yè)用戶選擇阿里云對象存儲服務(wù)OSS或者表格存儲(Table Store)來存儲數(shù)據(jù),作為面向海量數(shù)據(jù)、極低成本、高度靈活的存儲平臺,云上客戶存儲了大量的流水數(shù)據(jù)、日志數(shù)據(jù)、監(jiān)控數(shù)據(jù)等,然而這些數(shù)據(jù)今天不具備低成本、靈活高效的分析能力。OSS和Table Store不但存儲了大量的歷史數(shù)據(jù),而且新數(shù)據(jù)每日劇增。
以往客戶需要分析OSS數(shù)據(jù),需要臨時將數(shù)據(jù)導入各種事先購買或者部署好的分析引擎,分析完再將數(shù)據(jù)刪除、釋放分析引擎的資源,鏈路長,耗時耗力極其不便,也不利于節(jié)省成本。
如果客戶使用Hadoop等傳統(tǒng)的MR解決方案,雖然存儲和計算分離,但是考慮到資源復(fù)用,往往需要在購買的ECS或者物理機上既部署存儲節(jié)點又要部署計算節(jié)點,存儲和計算無法做到真正的按需各自擴展。而開源Greenplum等傳統(tǒng)的MPP數(shù)據(jù)庫,更是存儲和計算一體化,存儲和計算分別按需擴展更是無法支撐。
而Serverless化數(shù)據(jù)分析引擎-Data Lake Analytics彌補了以上痛點。無需ETL,就可使用標準 SQL、現(xiàn)有的商業(yè)智能 (BI) 和ETL工具,以極低成本與高效地輕松分析與集成在阿里云OSS、Table Store數(shù)據(jù)源的數(shù)據(jù)。
Data Lake Analytics四大特性為數(shù)據(jù)分析保駕護航
Data Lake Analytics使得更多異構(gòu)數(shù)據(jù)源具備融合分析的能力。不僅支持聯(lián)合OSS和Table Store進行數(shù)據(jù)分析,后續(xù)也會支持對接更多的數(shù)據(jù)源接入,Serverless,意味著客戶使用分析服務(wù)無需購買或者管理服務(wù)器,升級透明,Data Lake Analytics基于ECS、ESS輕松做到彈性伸縮服務(wù),能讓業(yè)務(wù)真正做到按需擴存儲、計算資源,按使用量付費分析,不分析只需要擁有存儲成本,整個方案成本極低。
不僅如此,Data Lake Analytics支持SQL 2003標準、豐富的內(nèi)置函數(shù)支持,可以像使用數(shù)據(jù)庫一樣做訪問OSS文件或者其他數(shù)據(jù)源。支持標準JDBC/ODBC, 應(yīng)用程序輕松集成。在交互式能力上,Data Lake Analytics通過高效智能優(yōu)化器,新一代分析引擎XIHE, 全面融合MPP+DAG技術(shù)使得查詢性能非常出色,具備真正的可交互式分析能力。
打破傳統(tǒng),多場景適用
場景一:數(shù)據(jù)提取平臺
某客戶有大量的數(shù)據(jù)在OSS上,每天開發(fā)者要處理大量的臨時取數(shù)的需求,客戶最終基于OSS + Data Lake Analytics做到廉價可擴展的數(shù)據(jù)提取平臺。整個方案如下:
客戶端通過報表工具生成各種提取數(shù)據(jù)的SQL,報表工具將SQL發(fā)送至Data Lake Analytics, Data Lake Analytics則直接去分析OSS數(shù)據(jù),然后將分析后的結(jié)果返回給報表工具。OSS的10TB的存儲每月費用在1200元左右,Data Lake Analytics則是完全按照查詢使用量來付費(目前處于公測免費階段),從而實現(xiàn)了一個完全自助化、極其廉價的可持續(xù)擴展的數(shù)據(jù)提取平臺。
場景二:DB冷數(shù)據(jù)分析和快速恢復(fù)
為降低rds的成本,客戶不定期的有大量的歷史庫數(shù)據(jù)通過DBS備份至OSS,針對歷史歸檔的業(yè)務(wù)數(shù)據(jù),偶爾可能有少量的分析需求,此時通過Data Lake Analytics即可輕松滿足。此外,客戶若發(fā)現(xiàn)在線庫的業(yè)務(wù)數(shù)據(jù)需要利用OSS歸檔數(shù)據(jù)做訂正,以往做法是先購買一個超大規(guī)格的RDS, 然后將OSS備份恢復(fù)至RDS,將用來做訂正的數(shù)據(jù)查詢出來。有了Data Lake Analytics后,就可以輕松的通過Data Lake Analytics直接查詢到OSS的數(shù)據(jù)用做訂正,非常便捷,成本同時降低了很多。Data Lake Analytics提供端到端的數(shù)據(jù)安全訪問保障,支持OSS的安全角色訪問和表級別的用戶授權(quán),實現(xiàn)用戶數(shù)據(jù)的安全隔離。
場景三:能源電池數(shù)據(jù)分析平臺
客戶有大量電池數(shù)據(jù),需要天級別僅分析一次蓄電池的數(shù)據(jù),來分析電池的使用壽命,以決定是否提前做報廢。客戶通過將電池數(shù)據(jù)批量上傳至OSS,通過Data Lake Analytics每日分析一次,OSS 10TB月均存儲成本約1200元,Data Lake Analytics則按照查詢數(shù)據(jù)量計費(目前公測期間不收費),成本極具優(yōu)勢。
云上目前OSS、Table Store等存儲有大量的業(yè)務(wù)數(shù)據(jù)急需分析能力,而Data Lake Analytics的出現(xiàn)則很好的滿足了這一需求。對于云上中小企業(yè)來說,可以選擇用最廉價的存儲來搭配最普惠靈活的的分析能力。阿里云Data Lake Analytics正是最普惠靈活的分析能力的實踐者,目前公測期間免費試用,歡迎大家前來體驗.
PC端請戳鏈接體驗公測:http://click.aliyun.com/m/1000005393/
原文鏈接
本文為云棲社區(qū)原創(chuàng)內(nèi)容,未經(jīng)允許不得轉(zhuǎn)載。
總結(jié)
以上是生活随笔為你收集整理的【免费公测中】为数据赋予超能力,阿里云重磅推出Serverless数据分析引擎-Data Lake Analytics的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 提升普适性,阿里云官方SDK发布支持Go
- 下一篇: NLP产品级系统设计模式