肯睿中國Cloudera 大中華區(qū)技術(shù)總監(jiān)劉隸放
2023年毫無疑問是生成式AI爆發(fā)式發(fā)展的一年,以ChatGPT為首的生成式AI技術(shù)在全球點燃研發(fā)浪潮,大語言模型迅速席卷全球科技界。進入2024年,生成式AI注定仍將成為全球關(guān)注的焦點,有望將我們帶入一個繁榮的新興產(chǎn)業(yè)時代。然而,AI帶來的風險不容小覷,生成式AI的可信度、隱私保護、安全性等問題亦引發(fā)空前爭議。
數(shù)據(jù)隱私日作為一項全球倡議,是對數(shù)據(jù)安全和隱私保護不斷變化的挑戰(zhàn)的重要提醒。隨著全球范圍內(nèi)數(shù)據(jù)泄露事件的激增,尤其生成式AI在越來越多的企業(yè)中被廣泛采用,該倡議變得愈發(fā)重要,企業(yè)也在不斷加大數(shù)據(jù)隱私領(lǐng)域的投入。根據(jù)Gartner的預測,到2024年,大型企業(yè)機構(gòu)的年均隱私預算將超過250萬美元。
可信AI的關(guān)鍵在于可信數(shù)據(jù)
鑒于生成式AI取得革命性突破,各行各業(yè)爭相布局,涌入產(chǎn)業(yè)創(chuàng)新快車道。根據(jù)IDC預測,到2026年,中國40%的企業(yè)將掌握生成式AI的使用,共同開發(fā)數(shù)字產(chǎn)品和服務。其中,聊天機器人、自動報告生成和個性化電子郵件都是生成式AI推動創(chuàng)造力和生產(chǎn)力并改善客戶體驗的典范。然而,值得注意的是,人工智能/機器學習模型的質(zhì)量取決于它們所訓練的數(shù)據(jù)。因此,打造可信AI的關(guān)鍵是擁有可信數(shù)據(jù)。
隨著企業(yè)希望在整個業(yè)務中部署更多的人工智能和機器學習(ML)技術(shù),對可靠數(shù)據(jù)平臺的需求在不斷增加,以幫助其跨所有環(huán)境訪問數(shù)據(jù)。AI/ML的技術(shù)發(fā)展甚至讓企業(yè)能夠從非結(jié)構(gòu)化數(shù)據(jù)中提取價值,這使得所有數(shù)據(jù)的管理、治理和控制變得至關(guān)重要。如果企業(yè)數(shù)據(jù)平臺內(nèi)擁有可信的數(shù)據(jù),那就為建立AI大模型奠定了基礎(chǔ)。
此外,越來越多的企業(yè)希望實現(xiàn)數(shù)據(jù)民主化,即降低數(shù)據(jù)訪問門檻,授權(quán)合適的員工訪問合適的數(shù)據(jù),以此提升運營效率。當數(shù)據(jù)的邊界擴大,對于數(shù)據(jù)隱私和安全治理也提出了更高的要求。
為了確保AI生態(tài)朝向正確的軌道健康發(fā)展,需要不斷完善的立法支撐。近年來,我國陸續(xù)頒布實施了《網(wǎng)絡安全法》《數(shù)據(jù)安全法》和《個人信息保護法》等法律法規(guī),組成了數(shù)據(jù)安全領(lǐng)域的“三駕馬車”。在此體系基礎(chǔ)上,數(shù)據(jù)安全和隱私保護得到了政策和市場需求的雙重推動,產(chǎn)業(yè)正處于快速增長階段。
現(xiàn)代化平臺成為數(shù)據(jù)隱私的“安全保鏢”
基于日益完善的法律法規(guī),企業(yè)也必須不斷發(fā)展自身的數(shù)據(jù)系統(tǒng)以滿足數(shù)字時代的新需求,重新思考他們所采取的措施,來確保數(shù)據(jù)的隱私安全。為了應對數(shù)據(jù)安全和隱私風險,企業(yè)必須在制定戰(zhàn)略和計劃時將數(shù)據(jù)安全和治理放在首位。投資具有內(nèi)置安全和治理功能的現(xiàn)代化數(shù)據(jù)平臺和工具,可以幫助企業(yè)以安全和符合監(jiān)管要求的方式實現(xiàn)數(shù)據(jù)民主化,同時成功訓練企業(yè)人工智能/機器學習模型。
總之,數(shù)據(jù)隱私問題變得愈發(fā)復雜,如果不及時采取現(xiàn)代化措施保護數(shù)據(jù)安全,可能導致企業(yè)面臨法律、金融和聲譽等風險。企業(yè)需要將數(shù)據(jù)隱私嵌入到其運營結(jié)構(gòu)中,將其作為核心功能,并通過人員、流程和企業(yè)數(shù)據(jù)管理技術(shù)來提供支持,以確保其客戶、合作伙伴和最終用戶的數(shù)據(jù)隱私得到保護。而且,數(shù)據(jù)隱私保護必須成為一種主動的戰(zhàn)略性功能,主動防御而非在數(shù)據(jù)泄露之后進行補救。
Cloudera建議采用六步方法來構(gòu)建安全的數(shù)據(jù)基礎(chǔ)——找到數(shù)據(jù)、加密、管理、溯源、檢索、以及發(fā)送警報。無論數(shù)據(jù)位于何處,Cloudera都能幫助客戶檢索和定位所有數(shù)據(jù),并通過令牌化或加密來保護數(shù)據(jù)。此外,通過數(shù)據(jù)溯源,能夠輕松進行審計跟蹤和訪問控制,確保合適的人訪問合適的數(shù)據(jù)。一旦發(fā)現(xiàn)有違規(guī)行為,便會立即發(fā)送警報,阻止企業(yè)數(shù)據(jù)被不正當使用。
Cloudera的數(shù)據(jù)平臺(CDP)使構(gòu)建、部署和管理機器學習應用變得更快、更容易,而且更安全。通過降低成本和簡化操作,CDP減少了在整個企業(yè)中引入新數(shù)據(jù)隱私用例所需的時間,其安全和治理功使企業(yè)能夠在公有云、本地和私有云中的任何地方控制數(shù)據(jù)。基于這樣的現(xiàn)代化數(shù)據(jù)平臺,企業(yè)將能夠獲取完整、可信的數(shù)據(jù),進而利用人工智能加速業(yè)務創(chuàng)新與安全轉(zhuǎn)型。