背景介紹
我叫小明,是一個每天喜歡胡思亂想的打工人。
隨著年輕人的創業熱潮的到來,我有一種創業的沖動。經過長時間的探索,我現在萌生出了一個極具創造性的點子,如果以此為依據進行創業的話一定會引起熱潮。
首先,為了確定我的想法是不是獨一無二的,我必須先通過搜索引擎進行查詢。這里有一個我很在意的問題——我在搜索引擎里搜索了我的創意,瀏覽器會將我的創意直接發送給搜索引擎的服務器,如果我的創意確實是獨一無二的,那這樣直白的搜索方式一定會把我的創業完全暴露出來,這對我來說非常致命,我絕對不能讓任何人有竊取我創意的可能。
如何才能保證在不讓搜索引擎知道我具體要查詢什么東西的情況下獲得我想要的數據是我亟待解決的難題。
Uniswap社區將于4月29日開啟“創建新子域名”提案的鏈上投票:4月27日消息,Uniswap社區將于4月29日凌晨1時左右開啟“創建v3deployments.uniswap.eth子域名并填充其文本記錄”提案的鏈上投票,并將于5月4日截止。[2023/4/27 14:30:33]
簡單做法
我的第一個主意是將搜索引擎中所有的數據全部下載下來,將原來的在線查詢轉換成為本地查詢。這就意味著我不用將我的點子發送給服務器端,我就可以充分地保護好自己的隱私了。
不過我還得考慮到另外一個問題,搜索引擎的服務器可是有pb級別的數據量,我下載下來就得花費我幾天的時間,另外我還得專門再去買幾塊大容量的硬盤,這對我來說實在是太過于昂貴。
分?桶
我換了一個想法,既然沒機會直接把搜索引擎的數據庫都給扒下來,我就試著扒下來一部分數據,然后我再本地查詢,這樣對我來說,準備的硬盤也可以少一點。
麥當娜“創造之母”NFT已募集309 ETH,將捐給三家婦女兒童慈善機構:金色財經報道,據社交媒體用戶 @Darthmadonna 透露,美國歌手麥當娜與知名 NFT 藝術家 Beeple 合作推出的 NFT 系列“創造之母”(Mother of Creation )已募集 309 ETH,約合625,592.50 美元。籌集的資金將用于 3 個慈善機構,即兒童之聲基金會、歡樂之城基金會和黑人媽媽救助計劃。創造之母是三個 NFT 的集合,分別是:自然之母、進化之母和技術之母,該系列中最昂貴的 NFT 是自然之母(Nature of Nature),售價達到 170.5 ETH。[2022/10/27 11:46:32]
比如說,我本來想要查詢的數據是“小明是大帥哥”,這樣無疑就向搜索引擎公司暴露我是帥哥的隱私了,那我就可以換一種方式,我就查詢“大帥哥”,這樣我收到的數據雖然有很多都是我不想要的,但是里面卻會包含“小明是大帥哥”的搜索內容。這樣,我就將全部的數據庫下載換成了部分數據庫的下載。獲取部分數據庫內容以后我就可以本地再去查詢了。
MDX現已從火幣“全球觀察區”轉入“創新區”:據火幣全球站官方消息稱,為了提供更好的服務,滿足用戶更精細化的交易需求,MDX (MDEX) 現已從火幣“全球觀察區”轉入“創新區”,同時解除50000USDT的持倉限制。[2021/1/27 21:47:38]
這里用到了數據“分桶”的預處理技術,用于減少次要觀察誤差的影響,是一種將多個連續值分組為較少數量的“桶”的方法。
隱私性保護
分桶的做法雖然很好,但是無疑向數據庫泄露了部分隱私,比如“大帥哥”這個信息,雖然服務器沒有獲知“小明是大帥哥”這個隱私,但是無疑泄露了我對“大帥哥”相關信息比較感興趣,我不想為了保護我的具體隱私讓服務器產生其他的誤解。
我只能換一種方式,傳統的隱私查詢技術給了我一點提示。
▲?背景說明
傳統的隱私查詢技術對于數據保存結構有特殊的要求:首先數據庫得是公開的,即我可以隨時調取查看服務器里的任何數據;其次,在很多個服務器上都得部署完全相同的數據庫;再者,這些部署了數據庫的服務器互相之間不能溝通;最后,假設數據庫擁有n個數據X?、X?…?Xn,那么在數據庫中其存儲形式為一個n維向量。
2020“創業之星”大賽大數據和區塊鏈行業賽復賽即將開啟:據官方消息,火幣Labs將于8月2日-8月3日在杭州舉辦創新南山2020“創業之星”大賽大數據和區塊鏈行業賽復賽暨火幣Labs創業營訓練日活動。自大賽報名開始以來,已收到100+大數據和區塊鏈項目團隊報名參賽。
活動邀請了協同數據創始人胡博、華傲數據副總裁高路、法學博士后前火幣集團高級法律顧問季鳳建、杭州區研創始人火幣Labs孵化顧問陳軍、分布式資本總法律顧問孫銘、火幣大學顧問合伙人《小島區塊鏈》作者方軍、以及火暢空間創始人孫輝等。同時火幣Labs總經理袁瑞娟也將親臨現場,詳解火幣Labs全新創業生態如何為創業者賦能。[2020/8/1]
▲?簡單技術方案
如果我現在需要的是數據Xi,那么其實我應該做的事情很簡單,就是自己生成一個n維向量,只在第i個位置放1,其余的所有位置都放0,很明顯的,這個時候我生成的這個向量和數據庫里的向量內積就可以獲得結果Xi。
聲音 | 以色列“創業教父”尤西?瓦爾迪:量子計算將在未來有飛躍式的發展:據羊城派報道,11月2日,以色列“創業教父”尤西?瓦爾迪出席廣州國際創新節,在談到值得關注的科技發展行業時,瓦爾迪首先提到的是量子計算。他認為,量子計算將在未來有飛躍式的發展。未來量子計算普及后計算方面的成本會大大降低,計算機體量會變小。[2019/11/3]
但是這樣會存在一個問題,我如果直接將我的向量發送給服務器,他們明顯就知道我需要的是什么數據了,那我只能通過另外一種方式來保護我的隱私,將我的向量拆分。如果我把我生成的向量記為r,假設有k個服務器,注意這里k≥2,那么我只用將r拆分成為k個向量即可。更具體的,我可以拆分為:
然后將每個分量ri發送給一個服務器。然后服務器自己本地求內積,將結果發送給我,我收到k個結果后求異或就可以復原出Xi的值了。
通過算法描述,相信大家也能理解為什么服務器一定需要大于兩個,而且這些服務器之間還不能互相溝通。如果服務器之間互相可以溝通的話就可以復原出我的查詢r了。
這個算法有一個很致命的問題,就是我生成的查詢r其實是和服務器的數據大小一樣大的,如果服務器有幾千億的數據,我的r就得有幾千億維,并沒有降低網絡消耗,而且更糟糕是,我得生成很多份分量,而每個分量的大小都和數據庫一樣大,這種方式無疑比直接下載數據更加龐大。
▲?優化技術方案
因為巨大的傳輸量,我們現在可以對服務器的數據保存方式進行改進,原先的保存方式為向量,現在可以改進為矩陣,假設數據庫有25個數據,那么數據將會變成如下形式
我們此時生成的向量就可以從原來的25維縮減到5維,例如我們需要的數據是,在矩陣的第一行,那我們就可以生成查詢,此時服務器內積后會將第一行返回給我們。
同之前的方案,我們不能直接將查詢r發送給服務器,還是需要進行拆分,然后發送給服務器。同樣的流程過后我們就能第一行元素。這樣對每個服務器我們上傳的數據量為一個5維向量,下載量也同樣是一個五維向量,同時,對于每個服務器來說,他們并不知道我們最后拿到的是哪一行。
這個方案的數據總傳輸量為2k√n,這里的n為服務器擁有的總數據量,k為服務器個數,通常,只需要兩個服務器就能達到安全性的要求,故總傳輸量4√n。
在數據量大于16的情況下,這個策略的數據傳輸量已經小于直接傳輸整個數據庫的數據量了。
▲?再進階做法
我按照之前的想法在搜索引擎里查詢了一下我的創意,發現里面并沒有相關內容。我正準備慶幸沒有別人做了和我相同的事情的時候,我的朋友張三麻子和我說我用的搜索引擎查詢的結果可能不會很準,推薦了一個相關的收費網站給我,這個網站可以查詢到全球所有公司以及其具體業務模式。不過他們是按照查詢條數收費的,故不可能像搜索引擎那樣隨便讓我下載資源了。這個時候我的查詢數據需要隱私,同時他們的數據庫內容也需要隱私。
這個時候可以對之前的算法進行進一步升級,將服務器從2個擴展為4個,我同時發起行查詢和列查詢。比如我需要的數據,在矩陣里的第一行第三列,那么我就會進行第一行與第三列的查詢。行列查詢都分別拆分兩個分片,這樣總共有4種組合可能,四個服務器分別選取其中一種組合本地進行計算。這樣服務器便只會發送混淆后的一個元素回來,不會暴露自己的任何額外信息。
討論及總結
以上的算法有一個很關鍵的問題,即我知道我需要的數據是數據庫中的第幾個元素,但是通常情況下,這樣的查詢方式是不現實的。更為普遍的查詢方式為k-v查詢,即我依據某個k去數據庫查詢其對應的v。
例如,我去搜索引擎里搜索“我是大帥哥”,此時k就是“我是大帥哥”,百度返回的搜索結果就是其對應的v。如何將傳統的隱私查詢技術進行升級以配適現實生活中的實際場景仍需要進一步的探索。
數據安全是現在從個人到國家都非常重視的領域,如何將我們的隱私數據安全的使用起來也是我們一直以來努力的方向。
作者簡介
劉毅恒
來自趣鏈科技數據網格實驗室BitXMesh團隊,一個鮮為人知的程序員
CoinShares的《每周數字資產基金流動》報告顯示,隨著埃隆·馬斯克的Twitter賬戶再次對加密貨幣市場造成嚴重破壞,上周出現了這個報告歷史上最多的比特幣產品資金流出.
1900/1/1 0:00:00這幾天有新進場的投資者問在現在這個情勢下,如果想投資數字貨幣投什么?我建議現在才進場并且愿意拿出不影響生活的資金博一把下半場的朋友就投安全系數最高的比特幣和以太坊.
1900/1/1 0:00:00根據周四公布的監管文件披露,摩根士丹利的一個新的比特幣私人基金在14天內從322名投資者那里籌集了2940萬美元.
1900/1/1 0:00:00虛擬時尚平臺RTFKT在一輪融資中籌集了800萬美元。該公司專門從事數字運動鞋和其他虛擬配件。虛擬時尚平臺RTFKT在由安德森·霍洛維茨牽頭的一輪融資中籌集了800萬美元.
1900/1/1 0:00:00據官方消息,去中心化交易平臺StableSwap推出在Solana區塊鏈上交易掛鉤資產的低滑點自動做市商.
1900/1/1 0:00:00據U.Today消息,在5月21日與地方法官SarahNetburn的電話會議上,美國證券交易委員會的高級辯護律師JorgeTenreiro表示,Ripple的律師曾已經告訴過該公司.
1900/1/1 0:00:00