AI大潮下的數據搜集和利用 如何斷定隱私侵犯與合理利用?
0
導讀:日前,大潮斷定《華爾街日報》的數據搜集一篇華為和騰訊正因用戶數據,產生沖突的和利合理重慶外圍(外圍經紀人) 外圍空姐(電話微信180-4582-8235)高端質量,滿意為止文章在業內流傳,并經國內部分媒體的用何隱私發酵(夸張的翻譯及再加工),演繹出了諸多不同的侵犯版本。但有一點可以確認的利用是,此前工信部所屬的大潮斷定國內權威的泰爾實驗室已經檢測確認榮耀Magic并不存在侵犯用戶數據隱私,而諸多第三方的數據搜集測試也顯示,榮耀Magic也不存在侵犯用戶數據隱私。和利合理我們這里需要強調的用何隱私是,為了更好提升用戶的侵犯體驗和提供更多、更好的利用服務,用戶數據的大潮斷定搜集、利用與侵犯用戶數據隱私完全是數據搜集兩個不同的概念。

其實通過此次《華爾街日報》的報道,我們更關心的是AI時代下,相關企業到底該不該搜集和利用用戶的數據信息以及為何要搜集和利用用戶的數據信息。
熟悉AI的業內人士知道,在當下,重慶外圍(外圍經紀人) 外圍空姐(電話微信180-4582-8235)高端質量,滿意為止如果把AI看成一個嗷嗷待哺、擁有無限潛力的嬰兒,某一領域專業海量的深度數據就是喂養這個天才的“奶粉”。奶粉的數量決定了嬰兒是否能長大,而“奶粉”的質量則決定了嬰兒后續的智力發育水平。正是基于此,在進入AI時代,數據搜集及基于數據的分析已經是業內大佬的共識。
眾所周知,亞馬遜的大數據分析系統在電商行業獨領風騷,其會追蹤用戶在電商網站和APP上的一切行為,盡可能多地收集數據。只要看一下亞馬遜的“賬戶”部分,就會發現其強大的賬戶管理,這也是為收集用戶數據服務的。主頁上有不同的部分,例如“愿望清單”、“為你推薦”、“瀏覽歷史”、“與你瀏覽過的相關商品”、“購買此商品的用戶也買了”,亞馬遜保持對用戶行為的追蹤,為用戶提供卓越的個性化購物體驗。而作為亞馬遜最大對手的沃爾瑪,其也通過店內的Wi-Fi搜集了將近1.45億美國客戶(相當于美國成年人的60%)的詳盡數據,包括他們購買的物品、住的地方,以及喜歡的產品等。與此同時,其還通過分析用戶在Walmart.com的點擊行為,消費者在店內和線上購買的物品以及推特上的趨勢,判斷當地的活動和天氣變化將如何影響用戶的購買模式等。根據大數據分析出的結果,沃爾瑪可以靈活調控倉庫中的貨物存儲,動態調整價格,以短信和直郵的形式對用戶進行精準營銷,同時實現自身銷售利潤的最大化。


再如傳統IT企業的IBM,其知名AI系統沃森,從2015 年 4 月進入醫療領域至今,為了讓沃森商業化,IBM先后花了40 多億收購其他公司,而并購的目的是這些公司擁有大量的醫療數據資源,比如記帳記錄,患者病史,X 射線和 M.R.I 圖片等。與沃森類似,谷歌著名的AI系統DeepMind目前也已經進入醫療行業。去年11月,公司獲得了首個付費項目,與NHS公立醫院皇家自由倫敦醫院(Royal Free London)簽下五年的合同,為其處理170萬份病歷。此外,DeepMind還獲得了訪問其它倫敦醫院兩個數據庫的權限,即DeepMind利用AI軟件分析了約100萬份視網膜掃描報告成功找到了退行性眼疾的早期征兆,或通過頭頸部癌癥圖像讓AI軟件學會區分健康和癌組織之間的不同。
從上述沃森、DeepMind的商業化看,均需要首先獲取現實世界的大數據,即使擁有大量數據的可供挖掘的谷歌,運用AI及機器學習技術改進醫院、電網及工廠等系統時,獲取其詳細的數據也非常重要。


最后是目前業內熱炒和效仿的亞馬遜智能音箱Echo和其對手Google Home,在某種意義上,購買 Echo 或 Google Home 表示消費者已經接受了購買互聯網設備的事實:通過內建的麥克風,這些設備的工作方式就是 24 小時不停地監聽周遭環境,以便及時對用戶的呼叫做出反應;同時相應公司會收集用戶數據進行分析以不斷提高自己的服務質量。
由上述我們不難看到,無論是傳統企業還是全球的科技大佬,在AI時代來臨之際,都在千方百計獲得用戶的數據或者信息(搜集和利用用戶的信息是充分發揮AI不可或缺的重要一環,否則AI將成為無水之源,無本之木),更好地服務于用戶。
當然,我們在此并非否認數據安全和用戶數據隱私的重要,只是不能因噎廢食,即為了所謂安全和隱私而忽視,甚至放棄獲取數據,而是如何在獲取數據的同時,利用協議、技術等手段告知和保證用戶的數據和隱私安全,盡量做到獲取和利用數據與安全的平衡。而提到平衡,我們不得不提及蘋果。
業內知道,蘋果在AI 領域的研究進程要晚于競爭對手,根本原因就是他們不想像谷歌和Facebook 那樣“侵犯”用戶的個人數據。為此,蘋果擁有大型的隱私保護項目。該項目使用了在學術領域被稱為差分隱私的概念,并且將這個概念用在了iPhone 上的AI 程序上。差分隱私的工作方式是在好數據中插入噪音或是壞數據,一次來混淆那些試圖侵犯個人隱私的人。例如,為了讓蘋果的軟件將所有含有狗的照片放在同一個相冊里,它需要收集大量狗的圖片。蘋果會收集這些圖片,但是在收集之前,他們會對數據進行加密,然而將這些數據和其他一些無關的數據放在一起,這樣一來,如果有人試圖恢復原始數據,他們也無法得知哪些數據來自哪些用戶。這個技術被認為是最好的隱私保護技術,其防護程度要高于現有的其他數據保護方式。
對此,業內分析認為,蘋果在隱私保護方面的嘗試,盡管可能會拖慢他們的產品開發速度,但是這樣的犧牲卻能夠獲得用戶的信任。蘋果正在使用一些非常艱深的技術來保護用戶的隱私,這使得谷歌和Facebook 將會在未來某一天感到壓力,因為蘋果提供了能和他們的產品匹敵的產品,而且更安全。
與蘋果類似,榮耀在信息獲取層面,不僅嚴格遵循必須通過用戶授權的原則,即Magic Live系統以及APP在獲取或者使用用戶的個人數據:日歷、短信、電話、通訊錄、提醒事項、照片和位置等之前,都必須要得到用戶的許可。其次,在數據處理層面,遵循信息本地化處理原則。就地分析,不上傳云端,也不對第三方開放。此外,在這兩個原則之上,其還設置了兩層防護,即在榮耀Magic搭載的海思麒麟芯片內部,設有TEE安全區,用戶敏感數據基于芯片進行加密。秘鑰的保存和加解密過程都是在芯片內部完成的,Android側無法接觸到秘鑰和加解密過程。Magic Live還增加了防root及入侵檢測功能。一旦發現Android系統異常,例如異常獲取用戶數據的行為等,Magic Live會拒絕執行用戶隱私數據的解密功能,確保安全。
綜上所述,我們認為,此次《華爾街日報》報道的華為與騰訊因用戶數據之爭,從一個側面反映出數據搜集和利用對于AI和用戶的重要價值,同時也提醒業內,保護用戶數據和信息隱私的重要性,且不能因噎廢食,即過分強調一方,忽視,甚至放棄另一方,對于AI的發展及其給用戶帶來的價值都是弊大于利。

其實通過此次《華爾街日報》的報道,我們更關心的是AI時代下,相關企業到底該不該搜集和利用用戶的數據信息以及為何要搜集和利用用戶的數據信息。
熟悉AI的業內人士知道,在當下,重慶外圍(外圍經紀人) 外圍空姐(電話微信180-4582-8235)高端質量,滿意為止如果把AI看成一個嗷嗷待哺、擁有無限潛力的嬰兒,某一領域專業海量的深度數據就是喂養這個天才的“奶粉”。奶粉的數量決定了嬰兒是否能長大,而“奶粉”的質量則決定了嬰兒后續的智力發育水平。正是基于此,在進入AI時代,數據搜集及基于數據的分析已經是業內大佬的共識。
眾所周知,亞馬遜的大數據分析系統在電商行業獨領風騷,其會追蹤用戶在電商網站和APP上的一切行為,盡可能多地收集數據。只要看一下亞馬遜的“賬戶”部分,就會發現其強大的賬戶管理,這也是為收集用戶數據服務的。主頁上有不同的部分,例如“愿望清單”、“為你推薦”、“瀏覽歷史”、“與你瀏覽過的相關商品”、“購買此商品的用戶也買了”,亞馬遜保持對用戶行為的追蹤,為用戶提供卓越的個性化購物體驗。而作為亞馬遜最大對手的沃爾瑪,其也通過店內的Wi-Fi搜集了將近1.45億美國客戶(相當于美國成年人的60%)的詳盡數據,包括他們購買的物品、住的地方,以及喜歡的產品等。與此同時,其還通過分析用戶在Walmart.com的點擊行為,消費者在店內和線上購買的物品以及推特上的趨勢,判斷當地的活動和天氣變化將如何影響用戶的購買模式等。根據大數據分析出的結果,沃爾瑪可以靈活調控倉庫中的貨物存儲,動態調整價格,以短信和直郵的形式對用戶進行精準營銷,同時實現自身銷售利潤的最大化。


再如傳統IT企業的IBM,其知名AI系統沃森,從2015 年 4 月進入醫療領域至今,為了讓沃森商業化,IBM先后花了40 多億收購其他公司,而并購的目的是這些公司擁有大量的醫療數據資源,比如記帳記錄,患者病史,X 射線和 M.R.I 圖片等。與沃森類似,谷歌著名的AI系統DeepMind目前也已經進入醫療行業。去年11月,公司獲得了首個付費項目,與NHS公立醫院皇家自由倫敦醫院(Royal Free London)簽下五年的合同,為其處理170萬份病歷。此外,DeepMind還獲得了訪問其它倫敦醫院兩個數據庫的權限,即DeepMind利用AI軟件分析了約100萬份視網膜掃描報告成功找到了退行性眼疾的早期征兆,或通過頭頸部癌癥圖像讓AI軟件學會區分健康和癌組織之間的不同。
從上述沃森、DeepMind的商業化看,均需要首先獲取現實世界的大數據,即使擁有大量數據的可供挖掘的谷歌,運用AI及機器學習技術改進醫院、電網及工廠等系統時,獲取其詳細的數據也非常重要。


最后是目前業內熱炒和效仿的亞馬遜智能音箱Echo和其對手Google Home,在某種意義上,購買 Echo 或 Google Home 表示消費者已經接受了購買互聯網設備的事實:通過內建的麥克風,這些設備的工作方式就是 24 小時不停地監聽周遭環境,以便及時對用戶的呼叫做出反應;同時相應公司會收集用戶數據進行分析以不斷提高自己的服務質量。
由上述我們不難看到,無論是傳統企業還是全球的科技大佬,在AI時代來臨之際,都在千方百計獲得用戶的數據或者信息(搜集和利用用戶的信息是充分發揮AI不可或缺的重要一環,否則AI將成為無水之源,無本之木),更好地服務于用戶。
當然,我們在此并非否認數據安全和用戶數據隱私的重要,只是不能因噎廢食,即為了所謂安全和隱私而忽視,甚至放棄獲取數據,而是如何在獲取數據的同時,利用協議、技術等手段告知和保證用戶的數據和隱私安全,盡量做到獲取和利用數據與安全的平衡。而提到平衡,我們不得不提及蘋果。
業內知道,蘋果在AI 領域的研究進程要晚于競爭對手,根本原因就是他們不想像谷歌和Facebook 那樣“侵犯”用戶的個人數據。為此,蘋果擁有大型的隱私保護項目。該項目使用了在學術領域被稱為差分隱私的概念,并且將這個概念用在了iPhone 上的AI 程序上。差分隱私的工作方式是在好數據中插入噪音或是壞數據,一次來混淆那些試圖侵犯個人隱私的人。例如,為了讓蘋果的軟件將所有含有狗的照片放在同一個相冊里,它需要收集大量狗的圖片。蘋果會收集這些圖片,但是在收集之前,他們會對數據進行加密,然而將這些數據和其他一些無關的數據放在一起,這樣一來,如果有人試圖恢復原始數據,他們也無法得知哪些數據來自哪些用戶。這個技術被認為是最好的隱私保護技術,其防護程度要高于現有的其他數據保護方式。
對此,業內分析認為,蘋果在隱私保護方面的嘗試,盡管可能會拖慢他們的產品開發速度,但是這樣的犧牲卻能夠獲得用戶的信任。蘋果正在使用一些非常艱深的技術來保護用戶的隱私,這使得谷歌和Facebook 將會在未來某一天感到壓力,因為蘋果提供了能和他們的產品匹敵的產品,而且更安全。
與蘋果類似,榮耀在信息獲取層面,不僅嚴格遵循必須通過用戶授權的原則,即Magic Live系統以及APP在獲取或者使用用戶的個人數據:日歷、短信、電話、通訊錄、提醒事項、照片和位置等之前,都必須要得到用戶的許可。其次,在數據處理層面,遵循信息本地化處理原則。就地分析,不上傳云端,也不對第三方開放。此外,在這兩個原則之上,其還設置了兩層防護,即在榮耀Magic搭載的海思麒麟芯片內部,設有TEE安全區,用戶敏感數據基于芯片進行加密。秘鑰的保存和加解密過程都是在芯片內部完成的,Android側無法接觸到秘鑰和加解密過程。Magic Live還增加了防root及入侵檢測功能。一旦發現Android系統異常,例如異常獲取用戶數據的行為等,Magic Live會拒絕執行用戶隱私數據的解密功能,確保安全。
綜上所述,我們認為,此次《華爾街日報》報道的華為與騰訊因用戶數據之爭,從一個側面反映出數據搜集和利用對于AI和用戶的重要價值,同時也提醒業內,保護用戶數據和信息隱私的重要性,且不能因噎廢食,即過分強調一方,忽視,甚至放棄另一方,對于AI的發展及其給用戶帶來的價值都是弊大于利。