比特幣半年翻三倍後動蕩不止,大數據告訴你何時「上車」 - 冷萃財經

比特幣半年翻三倍後動蕩不止,大數據告訴你何時「上車」

比特幣半年翻三倍後動蕩不止,大數據告訴你何時「上車」
文章摘要:我們不必知道現象背後的因果,我們只想讓數據自己發聲。那麼,在區塊鏈時代,如何讓端對端加密的數據發聲?

比特幣半年翻三倍後動蕩不止,大數據告訴你何時「上車」

我們不必知道現象背後的因果,我們只想讓數據自己發聲。那麼,在區塊鏈時代,如何讓端對端加密的數據發聲?

原創|阿常

在大數據時代,我們不必知道現象背後的原因,我們只要讓數據自己發聲。

維克托·邁爾-舍恩伯格 《大數據時代》

移動互聯網、大數據技術的發展讓我們享受著數據帶來的紅利,購物、打車、理財等等應用或者服務採集用戶的信息,提供精準化、個性化的服務,給人們的生活帶來了極大便利。

而這些便利背後,卻是數據分析方放棄追求數據「結果」,選擇追求一種「聯繫」,尋找數據之間的關聯性,洞察我們的需求進而提供出更具針對性的服務。

而在區塊鏈的網路中,數據呈現出端對端加密的特質,遠比互聯網數據更加嚴密,尋找這些數據背後的「結果」更是難上加難;但是對於從業者而言,找到這些數據之間的關聯,提供「定製化服務」並研判發展趨勢同樣重要。

 市場剛需,加密數據如何利用

大數據分析精髓在於挖掘數據與真實信息的關係。通過海量數據分析甚至某一特殊事件的數據解讀,不再熱衷於追求數據分析的精確度。單純令數據發聲,提供行動指南。

而區塊鏈數據由於其本身的匿名性特徵,很多時候並不能輕易找到關聯關係,但是通過過去某種現象背後數據的全面分析,就能為之後類似事件提供前瞻性建議或者預警。

區塊鏈大數據技術已經廣泛應用在交易所、錢包、安全機構的業務場景中,通過對交易信息特徵的分析,可以得到交易與潛在風險的關聯關係,規避掉黑客盜幣、洗錢等等違法犯罪行為,並能夠幫助用戶挽回受損資產。

Chaindigg創始人葉茂舉例稱,一些黑客在盜取數字貨幣後,有時會設定遠高於市價標準的手續費,令礦工率先確認其交易,以便快速實現資金轉移的目的。那麼在面對一些不合常理的手續費時,交易所可以對這類地址進行區分處理,降低風險。

區塊鏈+大數據,可以說是目前市場的剛需,可誕生於互聯網的大數據技術仍需要做出一些改變,適應區塊鏈數據的特徵。

相比較互聯網中的數據構成,區塊鏈數據更具備規律性。所有信息都是按照區塊組織排列,每個區塊中包含著的交易數據都按照該公鏈所設定的邏輯排列,且大部分區塊在時間中存在先後次序,那麼在挖掘數據、查找數據的過程中能夠精確規定到某一個時間節點;而互聯網大數據則往往由於沒有一致的標準和時序,產生諸多異構性數據,通過統一加工後方才能夠分析。

區塊鏈數據維度比互聯網數據相對簡單。區塊鏈大數據能夠劃分的維度相對較少,一般分為交易發起方、交易接收方、交易時間、交易金額、交易頻次等維度,簡單的特徵將有助於更好地對數據進行歸類分析。

處理區塊鏈大數據,了解數據特徵只是基礎,更重要的是需要保證兩個關鍵因素:準確率、召回率。

 如何保證數據分析精度?

區塊鏈大數據不光要考慮數據的特徵,同時也要考慮數據的準確性,以及在相關維度中信息的關聯——其核心難度在於準確性、召回率的提升。

準確性又可以理解為真實性,即數據真偽。以比特幣網路為例,在可抓取到的幾億條地址當中,存在一些洗錢地址、詐騙地址等,那麼如果能夠在分析數據時發現這些數據,無疑能夠提高安全性,降低風險,只有準確率足夠高時才能夠發揮數據的真正作用。

但僅僅保證高準確性並不足夠,召回率同樣重要。在巨量的準確數據中仍只有一部分數據能夠被分析出來,而某些特徵不清晰的數據則無法被解讀。以比特幣網路為例,某些地址交易記錄頻繁,有時間、數量、交易費等特徵可以分析,這部分數據無疑更方便解讀;但同時也有一些地址,可以分析的特徵維度較少,甚至只有一筆或者沒有交易記錄,這部分「難啃的骨頭」啃不掉,數據召回率同樣無法提高,也就難以利用區塊鏈大數據。

Chaindigg創始人葉茂在接受鏈得得採訪時就指出,準確性、召回率雖然劃分維度不同,但是同樣重要,只有兩者齊備才能夠真正進行區塊鏈大數據分析,單一一項很難起到決定作用。

理論上而言,提高了準確性、召回率,就能夠提高區塊鏈大數據的使用能力,但是區塊鏈大數據仍面臨諸多困難。

相比較互聯網數據,同一公鏈中內容更加規範,但是目前主流數字貨幣基數較多,存在一些公鏈產生的數字貨幣具有較強的特殊性;此外,聯盟鏈中數據則具備更強的商業價值,甚至涉及商業機密,起著指導企業後續規劃等作用,這也給數據分析的普適性提出更高要求。

換而言之,想要進行區塊鏈數據分析,就必須研製出能處理這些差異的普適性技術。以比特幣與以太坊網路為例,後者較前者增加了智能合約的功能,那麼在進行數據採集分析過程中就要考慮到智能合約地址的特徵,提高數據分析的準確率和召回率。

互聯網語境中大數據分析常用的多項技術和策略,例如機器學習、數據標註、模型分析、交叉驗證等等,將其嫁接到區塊鏈語境中同樣事半功倍。

區塊鏈+大數據,或許可以理解為大數據技術在區塊鏈領域的延伸,儘管區塊鏈數據經過了層層加密,但是仍需要從中尋找到向前發展的指引。

冷萃財經原創,作者:Awing,轉載請註明出處:https://www.lccjd.top/2019/07/02/%e6%af%94%e7%89%b9%e5%b8%81%e5%8d%8a%e5%b9%b4%e7%bf%bb%e4%b8%89%e5%80%8d%e5%90%8e%e5%8a%a8%e8%8d%a1%e4%b8%8d%e6%ad%a2%ef%bc%8c%e5%a4%a7%e6%95%b0%e6%8d%ae%e5%91%8a%e8%af%89%e4%bd%a0%e4%bd%95%e6%97%b6/?variant=zh-tw

0

掃一掃,分享到微信

猜你喜歡

文章評論

電子郵件地址不會被公開。 必填項已用*標註

後發表評論

    上一篇

    BTC杜絕恐慌情緒的宣洩,選修正性的蓄勢調整

    下一篇

    專訪BAVALA創始人王進興: 加密貨幣是大勢所趨,Libra或將打通穩定幣市場

    微信公眾號

    微信公眾號