首頁(yè)|必讀|視頻|專(zhuān)訪(fǎng)|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片|報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 人工智能 >> 正文

肯睿Cloudera助力企業(yè)將AI與分析部署到開(kāi)放式數(shù)據(jù)湖倉(cāng)一體架構(gòu),統(tǒng)一企業(yè)數(shù)據(jù)

2024年9月3日 15:13  CCTIME飛象網(wǎng)  作 者:劉隸放

肯睿Cloudera大中華區(qū)技術(shù)總監(jiān) 劉隸放

肯睿Cloudera的客戶(hù)大多運(yùn)行著龐大的數(shù)據(jù)湖,從而為關(guān)鍵大規(guī)模數(shù)據(jù)分析和AI用例(包括企業(yè)數(shù)據(jù)庫(kù))提供助力。根據(jù)IDC發(fā)布的IDC MarketScape:中國(guó)實(shí)時(shí)湖倉(cāng)市場(chǎng)2024年廠(chǎng)商評(píng)估》報(bào)告中的數(shù)據(jù)顯示,未來(lái)12個(gè)月,選擇外部合作來(lái)構(gòu)建數(shù)據(jù)管理服務(wù)的企業(yè)比例將從58%快速增長(zhǎng)至85%。數(shù)據(jù)量的快速增長(zhǎng)、對(duì)數(shù)據(jù)管理需求的升級(jí)以及技術(shù)架構(gòu)復(fù)雜度和獨(dú)立開(kāi)發(fā)成本的上升,都將推動(dòng)企業(yè)開(kāi)始越來(lái)越多地考慮湖倉(cāng)一體的管理解決方案。

肯睿Cloudera在平臺(tái)中提供Apache Iceberg能夠幫助用戶(hù)避免廠(chǎng)商鎖定,實(shí)現(xiàn)開(kāi)放式湖倉(cāng)一體架構(gòu)。借助由Apache Iceberg支持的開(kāi)放式湖倉(cāng)一體架構(gòu),企業(yè)可以更好地利用分析和AI的力量。近日,肯睿Cloudera還宣布了現(xiàn)代化數(shù)據(jù)目錄和Iceberg REST集成這兩項(xiàng)關(guān)鍵增強(qiáng)功能更新,以加強(qiáng)元數(shù)據(jù)管理,進(jìn)一步提高開(kāi)放式數(shù)據(jù)湖倉(cāng)一體架構(gòu)內(nèi)部的開(kāi)放互通性,滿(mǎn)足數(shù)據(jù)全生命周期內(nèi)日益增長(zhǎng)的安全和治理需求。

將AI和分析部署到開(kāi)放式數(shù)據(jù)湖倉(cāng)一體架構(gòu)中有諸多優(yōu)點(diǎn),其主要優(yōu)勢(shì)之一是能夠?qū)⒉煌瑏?lái)源的數(shù)據(jù)集中到一個(gè)單一且連貫的存儲(chǔ)庫(kù)中。開(kāi)放式數(shù)據(jù)湖倉(cāng)一體架構(gòu)融合了數(shù)據(jù)湖的靈活性,以及數(shù)據(jù)倉(cāng)庫(kù)的結(jié)構(gòu)化查詢(xún)功能,可以容納種類(lèi)型、格式和速度的原始數(shù)據(jù)和處理后的數(shù)據(jù)。這種統(tǒng)一的數(shù)據(jù)環(huán)境不僅避免了維護(hù)獨(dú)立數(shù)據(jù)孤島的工作,還便于A(yíng)I和分析應(yīng)用無(wú)縫訪(fǎng)問(wèn)數(shù)據(jù)。

肯睿Cloudera可助力企業(yè)充分利用開(kāi)放式數(shù)據(jù)湖倉(cāng)一體架構(gòu)的以下優(yōu)勢(shì):

數(shù)據(jù)湖和數(shù)據(jù)倉(cāng)庫(kù)的集成:開(kāi)放式數(shù)據(jù)湖倉(cāng)一體架構(gòu)整合了數(shù)據(jù)湖的存儲(chǔ)靈活性,以及數(shù)據(jù)倉(cāng)庫(kù)的查詢(xún)性能和結(jié)構(gòu)化查詢(xún)功能,實(shí)現(xiàn)了兩者的緊密結(jié)合。

開(kāi)放性:開(kāi)放式數(shù)據(jù)湖倉(cāng)一體架構(gòu)中的“開(kāi)放”一詞指的是與各種數(shù)據(jù)處理框架、分析工具和編程語(yǔ)言的互通性和兼容性。這種開(kāi)放性使數(shù)據(jù)科學(xué)家、分析師和開(kāi)發(fā)人員能夠充分利用他們的首選工具和方法來(lái)探索、分析數(shù)據(jù)并從中獲得洞察,以更好地協(xié)作和創(chuàng)新。無(wú)論是基于SQL的傳統(tǒng)查詢(xún)、先進(jìn)的機(jī)器學(xué)習(xí)(ML)算法,還是復(fù)雜的數(shù)據(jù)處理工作流程,開(kāi)放式數(shù)據(jù)湖倉(cāng)一體架構(gòu)都能提供一個(gè)可適應(yīng)各種分析工作負(fù)載的靈活、可擴(kuò)展的平臺(tái)。

可擴(kuò)展性和靈活性:與傳統(tǒng)數(shù)據(jù)湖一樣,開(kāi)放式數(shù)據(jù)湖倉(cāng)一體架構(gòu)也能夠橫向擴(kuò)展,容納來(lái)自不同來(lái)源的大量數(shù)據(jù)。它可以靈活存儲(chǔ)原始數(shù)據(jù)和處理后的數(shù)據(jù),幫助企業(yè)適應(yīng)不斷變化的數(shù)據(jù)要求和分析需求。隨著數(shù)據(jù)量增長(zhǎng)和分析需求的變化,企業(yè)可以連續(xù)橫向擴(kuò)展其基礎(chǔ)設(shè)施,以滿(mǎn)足不斷增加的數(shù)據(jù)攝取、處理和存儲(chǔ)需求。這種可擴(kuò)展性確保了數(shù)據(jù)湖倉(cāng)一體架構(gòu)即使在數(shù)據(jù)復(fù)雜性和使用模式發(fā)生變化時(shí),也能保持響應(yīng)速度和性能。

統(tǒng)一的數(shù)據(jù)平臺(tái):開(kāi)放式數(shù)據(jù)湖倉(cāng)一體架構(gòu)作為數(shù)據(jù)存儲(chǔ)、處理和分析的統(tǒng)一平臺(tái),減少了維護(hù)獨(dú)立數(shù)據(jù)孤島和ETL(提取、轉(zhuǎn)換、加載)流程的需要。將AI和分析部署到開(kāi)放式數(shù)據(jù)湖倉(cāng)一體架構(gòu)中可以促進(jìn)數(shù)據(jù)的民主化和自助式分析,讓整個(gè)企業(yè)的用戶(hù)都能夠自主訪(fǎng)問(wèn)、分析數(shù)據(jù)并從中獲得洞察。通過(guò)提供統(tǒng)一、可訪(fǎng)問(wèn)的數(shù)據(jù)平臺(tái),企業(yè)能夠打破數(shù)據(jù)孤島、實(shí)現(xiàn)數(shù)據(jù)和分析工具訪(fǎng)問(wèn)的民主化,并在各級(jí)培養(yǎng)數(shù)據(jù)驅(qū)動(dòng)決策的習(xí)慣。這種數(shù)據(jù)和分析的民主化可提高企業(yè)的敏捷性和競(jìng)爭(zhēng)力以及員工的協(xié)作能力和數(shù)據(jù)素養(yǎng)data-literate。

支持現(xiàn)代分析工作負(fù)載:開(kāi)放式數(shù)據(jù)湖倉(cāng)一體架構(gòu)支持基于SQL的查詢(xún)和高級(jí)分析框架(如ML、圖形處理等),滿(mǎn)足了各種分析工作負(fù)載的需求,包括即席查詢(xún)(Ad Hoc Query)、復(fù)雜數(shù)據(jù)處理和預(yù)測(cè)建模等工作。

數(shù)據(jù)治理與安全:肯睿Cloudera近日發(fā)布的元數(shù)據(jù)管理解決方案的兩項(xiàng)關(guān)鍵增強(qiáng)功能,滿(mǎn)足了數(shù)據(jù)全生命周期內(nèi)日益增長(zhǎng)的安全和治理需求?项loudera的Iceberg REST Catalog集成允許使用第三方引擎無(wú)縫訪(fǎng)問(wèn)Apache Iceberg表,幫助用戶(hù)在充分利用各種工具的同時(shí),確保統(tǒng)一的安全性和治理。該集成能夠簡(jiǎn)化數(shù)據(jù)訪(fǎng)問(wèn),并維持各個(gè)平臺(tái)上的數(shù)據(jù)權(quán)限和溯源,通過(guò)更大程度地減少獨(dú)立安全層數(shù)量來(lái)降低成本和數(shù)據(jù)泄露的風(fēng)險(xiǎn)

此外,肯睿Cloudera的共享數(shù)據(jù)體驗(yàn)(SDX)現(xiàn)已發(fā)布以云原生容器形式提供的技術(shù)預(yù)覽版,實(shí)現(xiàn)了端到端的統(tǒng)一數(shù)據(jù)安全、治理和元數(shù)據(jù)管理,并且已得到增強(qiáng),具有更出色的彈性、擴(kuò)展性和性能。SDX還提供各種工具的自助式數(shù)據(jù)訪(fǎng)問(wèn)、通過(guò)整合安全功能,更大程度地降低違規(guī)風(fēng)險(xiǎn),并支持覆蓋云和本地?cái)?shù)據(jù)的統(tǒng)一視圖窗口管理。

開(kāi)放式數(shù)據(jù)湖倉(cāng)一體架構(gòu)代表了一種現(xiàn)代化的數(shù)據(jù)管理和分析方法,助力企業(yè)充分挖掘其數(shù)據(jù)資產(chǎn)潛力的同時(shí),實(shí)現(xiàn)開(kāi)放性、可擴(kuò)展性和互通性。

點(diǎn)擊此處了解有關(guān)肯睿Cloudera開(kāi)放式數(shù)據(jù)湖倉(cāng)一體架構(gòu)的更多信息。

編 輯:路金娣
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來(lái)源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來(lái)源。
2.凡注明“來(lái)源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話(huà)為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
中國(guó)電信邵廣祿:面向AI大模型的智算集群及網(wǎng)絡(luò)的實(shí)踐和展望
精彩專(zhuān)題
CES 2024國(guó)際消費(fèi)電子展
2023年信息通信產(chǎn)業(yè)盤(pán)點(diǎn)暨頒獎(jiǎng)禮
飛象網(wǎng)2023年手機(jī)評(píng)選
第24屆中國(guó)國(guó)際光電博覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱(chēng): 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書(shū)面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像