利用數(shù)據(jù)湖大規(guī)模存儲和分析數(shù)據(jù)
支持智能操作的無限制數(shù)據(jù)湖。
- 存儲和分析千萬億字節(jié)大小的文件和數(shù)萬億個對象
- 輕松地調(diào)試和優(yōu)化大數(shù)據(jù)程序
- 在幾秒鐘內(nèi)開始,即時(shí)縮放,按作業(yè)付費(fèi)
- 簡單地開發(fā)大規(guī)模并行程序
- 企業(yè)級安全性、審核和支持
- 在 YARN 上生成,專為云而設(shè)計(jì)
Azure Data Lake 包括了所有所需的功能,使開發(fā)人員、數(shù)據(jù)專家和分析師可以更輕松地存儲任何大小、形狀和速度的數(shù)據(jù)以及跨平臺和語言進(jìn)行各種類型的處理和分析。它消除了插入和存儲所有數(shù)據(jù)的復(fù)雜性,同時(shí)啟動更快,可與批量、流式、交互式分析一起運(yùn)行。Azure Data Lake 與現(xiàn)有 IT 投資一起工作以進(jìn)行簡化數(shù)據(jù)管理和監(jiān)管的識別、管理和安全防護(hù)工作。同時(shí)與操作存儲區(qū)和數(shù)據(jù)倉庫無縫集成,以便可以擴(kuò)展當(dāng)前數(shù)據(jù)應(yīng)用程序。我們已充分利用與企業(yè)客戶合作以及為 Microsoft 業(yè)務(wù)(如 Office 365、Xbox Live、Azure、Windows、必應(yīng)和 Skype)運(yùn)行一些全球規(guī)模最大的處理和分析的經(jīng)驗(yàn)。Azure Data Lake 使用一種已準(zhǔn)備好滿足你當(dāng)前和未來業(yè)務(wù)需求的服務(wù),解決了許多工作效率和可縮放性的挑戰(zhàn),而正是這些挑戰(zhàn)阻止你最大化自己的數(shù)據(jù)資產(chǎn)價(jià)值。
Data Lake Analytics - 支持智能操作的無限制分析作業(yè)服務(wù)
可在其中實(shí)現(xiàn)以下操作的首個云分析服務(wù):針對千萬億字節(jié)的數(shù)據(jù),使用 U-SQL、R、Python 和 .Net 輕松開發(fā)和運(yùn)行大規(guī)模并行數(shù)據(jù)轉(zhuǎn)換和處理程序。無需管理基礎(chǔ)結(jié)構(gòu),按需處理數(shù)據(jù)、即時(shí)縮放,按作業(yè)付費(fèi)。 了解詳細(xì)信息
HDInsight - 適用于企業(yè)的云 Apache Spark 和 Hadoop® 服務(wù)
HDInsight 是唯一完全托管的云 Hadoop 產(chǎn)品,為 Spark、Hive、Map Reduce、HBase、Storm、Kafka 和 R 服務(wù)器提供優(yōu)化的開放源代碼分析群集,并提供 99.9% 的 SLA 支持。這些大數(shù)據(jù)技術(shù)和 ISV 應(yīng)用程序都可輕松部署為托管群集,并提供企業(yè)級安全性和監(jiān)視功能。
Data Lake Store - 支持大數(shù)據(jù)分析的無限制數(shù)據(jù)湖
針對企業(yè)的安全、可大規(guī)模縮放并以開放 HDFS 標(biāo)準(zhǔn)構(gòu)建的首個云數(shù)據(jù)湖。由于對數(shù)據(jù)大小和運(yùn)行大規(guī)模并行分析的能力沒有限制,現(xiàn)可充分利用所有非結(jié)構(gòu)化、半結(jié)構(gòu)化和結(jié)構(gòu)化數(shù)據(jù)的價(jià)值。
輕松地開發(fā)、調(diào)試和優(yōu)化大數(shù)據(jù)程序
找到合適的工具來設(shè)計(jì)和調(diào)整你的大數(shù)據(jù)查詢是一件困難的事。通過與 Visual Studio、Eclipse 和 IntelliJ 深度集成,Data Lake 使之變得容易,使你也可以使用熟悉的工具運(yùn)行、調(diào)試和調(diào)整自己的代碼。將 U-SQL、Apache Spark、Apache Hive 和 Apache Storm 作業(yè)可視化,使你可以了解自己的代碼大規(guī)模運(yùn)行時(shí)的狀況,從而找出性能瓶頸和成本優(yōu)化,以便你調(diào)整查詢。執(zhí)行環(huán)境在程序運(yùn)行時(shí)對其進(jìn)行主動分析,并提供建議以提高性能并降低成本。數(shù)據(jù)工程師、DBA 和數(shù)據(jù)架構(gòu)師可以使用現(xiàn)有技能(例如 SQL、Apache Hadoop、Apache Spark、R、Python、Java 和 .NET)在一開始就變得高效。
與現(xiàn)有 IT 投資無縫集成
大數(shù)據(jù)最大的挑戰(zhàn)之一就是與現(xiàn)有 IT 投資的集成。Data Lake 是 Cortana Intelligence 的關(guān)鍵部分,這意味著它與 Azure Synapse Analytics、Power BI 和數(shù)據(jù)工廠一起工作,實(shí)現(xiàn)完整的云大數(shù)據(jù)和高級分析平臺,幫助你完成從準(zhǔn)備數(shù)據(jù)到在大規(guī)模數(shù)據(jù)集上執(zhí)行交互式分析的所有操作。通過優(yōu)化關(guān)系源(例如虛擬機(jī)上的 Azure SQL Server、Azure SQL 數(shù)據(jù)庫和 Azure Synapse Analytics)的數(shù)據(jù)虛擬化,Data Lake Analytics 能夠?qū)λ袛?shù)據(jù)進(jìn)行操作。通過將處理移動到源數(shù)據(jù)附近(而不移動數(shù)據(jù))來自動優(yōu)化查詢,從而最大限度地提高性能并減少延遲。最終,因?yàn)?Data Lake 在 Azure 中,所以在物聯(lián)網(wǎng) (IoT) 方案中,你可以連接到任何由應(yīng)用程序生成或設(shè)備插入的數(shù)據(jù)。
存儲和分析千萬億字節(jié)大小的文件和數(shù)萬億個對象
Data Lake 從頭開始針對云縮放和性能需求進(jìn)行構(gòu)建。使用 Azure Data Lake Store,組織可以沒有人為限制地在一處分析其所有數(shù)據(jù)。Data Lake Store 可以存儲數(shù)萬億個文件,其中單個文件的大小可以大于千萬億字節(jié),比其他云存儲大 200 倍。這意味著當(dāng)你增大或縮小存儲的數(shù)據(jù)大小或所啟動的計(jì)算數(shù)量時(shí),不需要重寫代碼。這使你可以僅關(guān)注自己的業(yè)務(wù)邏輯,而無需分心如何處理和存儲大數(shù)據(jù)集。Data Lake 也消除了通常與云中大數(shù)據(jù)相關(guān)聯(lián)的復(fù)雜性,從而確保它能夠滿足你當(dāng)前和未來的業(yè)務(wù)需求。
費(fèi)用可承受且成本效益高
Data Lake 是一種用于運(yùn)行大數(shù)據(jù)工作負(fù)載的經(jīng)濟(jì)高效的解決方案。處理數(shù)據(jù)時(shí),可以選擇按需群集或選擇按作業(yè)支付模型。這兩種方式都無需任何硬件、許可證或服務(wù)特定的支持協(xié)議。系統(tǒng)可隨著業(yè)務(wù)需求的變化縱向擴(kuò)展或縮減,這意味著你永遠(yuǎn)不會為不必要的內(nèi)容付費(fèi)。同時(shí)讓你能夠獨(dú)立縮放存儲器和計(jì)算,相較傳統(tǒng)的大數(shù)據(jù)解決方案,提供了更經(jīng)濟(jì)的靈活性。不僅如此,它還可將租用特定操作團(tuán)隊(duì)(通常與運(yùn)行大數(shù)據(jù)基礎(chǔ)結(jié)構(gòu)相關(guān)聯(lián))的需求降至最低。Data Lake 可以最小化你的成本,并最大化你的數(shù)據(jù)投資回報(bào)率。最近的一項(xiàng)研究表明,HDInsight 在五年間的 TCO 比部署本地 Hadoop 低 63%。
企業(yè)級安全性、審核和支持
Data Lake 完全由 Microsoft 管理和支持,依靠企業(yè)級 SLA 和支持。你可以通過全天候客戶支持聯(lián)系我們,以便解決你所面臨的與整個大數(shù)據(jù)解決方案相關(guān)挑戰(zhàn)。我們的團(tuán)隊(duì)將監(jiān)視你的部署,以保證部署持續(xù)運(yùn)行。Data Lake 可保護(hù)數(shù)據(jù)資產(chǎn),并可將本地安全和管理控制輕松擴(kuò)展到云。數(shù)據(jù)始終加密;動態(tài)數(shù)據(jù)使用 SSL 進(jìn)行加密,靜態(tài)數(shù)據(jù)使用 Azure Key Vault 中由服務(wù)或用戶管理的受 HSM 保護(hù)的密鑰進(jìn)行加密。通過 Azure Active Directory 內(nèi)置了單一登錄 (SSO)、多重身份驗(yàn)證和無縫管理數(shù)百萬身份等功能??上蛴脩艉徒M授予對 Store 中所有數(shù)據(jù)的基于 POSIX 的精確 ACL,從而啟用基于角色的訪問控制。最后,可以通過審核對系統(tǒng)的每個訪問或配置更改,來滿足安全性和法規(guī)合規(guī)性需求。
想起曾經(jīng)的自己,也總因?yàn)檫@些自我詢問疑惑過,后來發(fā)現(xiàn),想得再多,疑惑就更難以解決,反而平添煩惱,浪費(fèi)了很多時(shí)間,還不如不問理由直接去做。
景航網(wǎng)絡(luò)科技