肯睿中國(guó)Cloudera 大中華區(qū)技術(shù)總監(jiān)劉隸放
2023年毫無(wú)疑問(wèn)是生成式AI爆發(fā)式發(fā)展的一年,以ChatGPT為首的生成式AI技術(shù)在全球點(diǎn)燃研發(fā)浪潮,大語(yǔ)言模型迅速席卷全球科技界。進(jìn)入2024年,生成式AI注定仍將成為全球關(guān)注的焦點(diǎn),有望將我們帶入一個(gè)繁榮的新興產(chǎn)業(yè)時(shí)代。然而,AI帶來(lái)的風(fēng)險(xiǎn)不容小覷,生成式AI的可信度、隱私保護(hù)、安全性等問(wèn)題亦引發(fā)空前爭(zhēng)議。
數(shù)據(jù)隱私日作為一項(xiàng)全球倡議,是對(duì)數(shù)據(jù)安全和隱私保護(hù)不斷變化的挑戰(zhàn)的重要提醒。隨著全球范圍內(nèi)數(shù)據(jù)泄露事件的激增,尤其生成式AI在越來(lái)越多的企業(yè)中被廣泛采用,該倡議變得愈發(fā)重要,企業(yè)也在不斷加大數(shù)據(jù)隱私領(lǐng)域的投入。根據(jù)Gartner的預(yù)測(cè),到2024年,大型企業(yè)機(jī)構(gòu)的年均隱私預(yù)算將超過(guò)250萬(wàn)美元。
可信AI的關(guān)鍵在于可信數(shù)據(jù)
鑒于生成式AI取得革命性突破,各行各業(yè)爭(zhēng)相布局,涌入產(chǎn)業(yè)創(chuàng)新快車(chē)道。根據(jù)IDC預(yù)測(cè),到2026年,中國(guó)40%的企業(yè)將掌握生成式AI的使用,共同開(kāi)發(fā)數(shù)字產(chǎn)品和服務(wù)。其中,聊天機(jī)器人、自動(dòng)報(bào)告生成和個(gè)性化電子郵件都是生成式AI推動(dòng)創(chuàng)造力和生產(chǎn)力并改善客戶(hù)體驗(yàn)的典范。然而,值得注意的是,人工智能/機(jī)器學(xué)習(xí)模型的質(zhì)量取決于它們所訓(xùn)練的數(shù)據(jù)。因此,打造可信AI的關(guān)鍵是擁有可信數(shù)據(jù)。
隨著企業(yè)希望在整個(gè)業(yè)務(wù)中部署更多的人工智能和機(jī)器學(xué)習(xí)(ML)技術(shù),對(duì)可靠數(shù)據(jù)平臺(tái)的需求在不斷增加,以幫助其跨所有環(huán)境訪(fǎng)問(wèn)數(shù)據(jù)。AI/ML的技術(shù)發(fā)展甚至讓企業(yè)能夠從非結(jié)構(gòu)化數(shù)據(jù)中提取價(jià)值,這使得所有數(shù)據(jù)的管理、治理和控制變得至關(guān)重要。如果企業(yè)數(shù)據(jù)平臺(tái)內(nèi)擁有可信的數(shù)據(jù),那就為建立AI大模型奠定了基礎(chǔ)。
此外,越來(lái)越多的企業(yè)希望實(shí)現(xiàn)數(shù)據(jù)民主化,即降低數(shù)據(jù)訪(fǎng)問(wèn)門(mén)檻,授權(quán)合適的員工訪(fǎng)問(wèn)合適的數(shù)據(jù),以此提升運(yùn)營(yíng)效率。當(dāng)數(shù)據(jù)的邊界擴(kuò)大,對(duì)于數(shù)據(jù)隱私和安全治理也提出了更高的要求。
為了確保AI生態(tài)朝向正確的軌道健康發(fā)展,需要不斷完善的立法支撐。近年來(lái),我國(guó)陸續(xù)頒布實(shí)施了《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》和《個(gè)人信息保護(hù)法》等法律法規(guī),組成了數(shù)據(jù)安全領(lǐng)域的“三駕馬車(chē)”。在此體系基礎(chǔ)上,數(shù)據(jù)安全和隱私保護(hù)得到了政策和市場(chǎng)需求的雙重推動(dòng),產(chǎn)業(yè)正處于快速增長(zhǎng)階段。
現(xiàn)代化平臺(tái)成為數(shù)據(jù)隱私的“安全保鏢”
基于日益完善的法律法規(guī),企業(yè)也必須不斷發(fā)展自身的數(shù)據(jù)系統(tǒng)以滿(mǎn)足數(shù)字時(shí)代的新需求,重新思考他們所采取的措施,來(lái)確保數(shù)據(jù)的隱私安全。為了應(yīng)對(duì)數(shù)據(jù)安全和隱私風(fēng)險(xiǎn),企業(yè)必須在制定戰(zhàn)略和計(jì)劃時(shí)將數(shù)據(jù)安全和治理放在首位。投資具有內(nèi)置安全和治理功能的現(xiàn)代化數(shù)據(jù)平臺(tái)和工具,可以幫助企業(yè)以安全和符合監(jiān)管要求的方式實(shí)現(xiàn)數(shù)據(jù)民主化,同時(shí)成功訓(xùn)練企業(yè)人工智能/機(jī)器學(xué)習(xí)模型。
總之,數(shù)據(jù)隱私問(wèn)題變得愈發(fā)復(fù)雜,如果不及時(shí)采取現(xiàn)代化措施保護(hù)數(shù)據(jù)安全,可能導(dǎo)致企業(yè)面臨法律、金融和聲譽(yù)等風(fēng)險(xiǎn)。企業(yè)需要將數(shù)據(jù)隱私嵌入到其運(yùn)營(yíng)結(jié)構(gòu)中,將其作為核心功能,并通過(guò)人員、流程和企業(yè)數(shù)據(jù)管理技術(shù)來(lái)提供支持,以確保其客戶(hù)、合作伙伴和最終用戶(hù)的數(shù)據(jù)隱私得到保護(hù)。而且,數(shù)據(jù)隱私保護(hù)必須成為一種主動(dòng)的戰(zhàn)略性功能,主動(dòng)防御而非在數(shù)據(jù)泄露之后進(jìn)行補(bǔ)救。
Cloudera建議采用六步方法來(lái)構(gòu)建安全的數(shù)據(jù)基礎(chǔ)——找到數(shù)據(jù)、加密、管理、溯源、檢索、以及發(fā)送警報(bào)。無(wú)論數(shù)據(jù)位于何處,Cloudera都能幫助客戶(hù)檢索和定位所有數(shù)據(jù),并通過(guò)令牌化或加密來(lái)保護(hù)數(shù)據(jù)。此外,通過(guò)數(shù)據(jù)溯源,能夠輕松進(jìn)行審計(jì)跟蹤和訪(fǎng)問(wèn)控制,確保合適的人訪(fǎng)問(wèn)合適的數(shù)據(jù)。一旦發(fā)現(xiàn)有違規(guī)行為,便會(huì)立即發(fā)送警報(bào),阻止企業(yè)數(shù)據(jù)被不正當(dāng)使用。
Cloudera的數(shù)據(jù)平臺(tái)(CDP)使構(gòu)建、部署和管理機(jī)器學(xué)習(xí)應(yīng)用變得更快、更容易,而且更安全。通過(guò)降低成本和簡(jiǎn)化操作,CDP減少了在整個(gè)企業(yè)中引入新數(shù)據(jù)隱私用例所需的時(shí)間,其安全和治理功使企業(yè)能夠在公有云、本地和私有云中的任何地方控制數(shù)據(jù)。基于這樣的現(xiàn)代化數(shù)據(jù)平臺(tái),企業(yè)將能夠獲取完整、可信的數(shù)據(jù),進(jìn)而利用人工智能加速業(yè)務(wù)創(chuàng)新與安全轉(zhuǎn)型。