你好,游客 登錄
背景:
閱讀新聞

六合图库财神:深度學習和拓撲數據分析的六大驚人之舉

[日期:2015-10-26] 來源:LinkedIn  作者:Edward Kibardin [字體: ]

六合图库118万众图库 www.xorsm.icu   假如你有一個一千列和一百萬行的數據集。無論你從哪個角度看它——小型,中型或大型的數據——你不可能看到它的全貌。將它放大或縮小。使它能夠在一個屏幕里顯示完全。由于人的本質,如果能夠看到事物的全局的話,我們就會有更好的理解。有沒有辦法把數據都放到一張圖里,讓你可以像觀察地圖一樣觀察數據呢?

  將深度學習與拓撲數據分析結合在一起完全能夠達到此目的,并且還綽綽有余。

  1、它能在幾分鐘內創建一張數據圖,其中每一個點都是一個數據項或一組類似的數據項。

  基于數據項的相關性和學習模式,系統將類似的數據項組合在一起。這將使數據有唯一的表示方式,并且會讓你更清晰地洞察數據??墑踴賈械慕詰閿梢桓齷蚨喔鍪蕕愎鉤?,而點與點之間的鏈接則代表數據項之間高相似性。

  

 

  2、它展示了數據中的模式,這是使用傳統商業智能無法識別的。

  下面是個案例,展示的是算法是如何僅僅通過分析用戶行為來識別兩組不同的人群。典型的特征區分,黃色和藍色點:女性和男性。

  

 

  如果我們分析行為類型,我們會發現,其中一組大部分是發送信息(男性),而另一組則多為接收信息(女性)。

  

 

  3、它能在多層面上識別分段數據

  分段數據表現在多種層面上——從高層次分類到具有相同數據項的分組。

  在一個Netflix數據集的例子中,每個數據項是一部電影。最高層次的一組是音樂,孩子,外交和成人電影。中層次的部分包含不同分段:從印度片和港片到驚悚片和恐怖片。在低層次中是電視連續劇分組,比如“萬能管家”,“辦公室”,“神秘博士”等。

  

 

  4、它能分析任何數據:文本,圖像,傳感器數據,甚至音頻數據。

  任何數據都可以被分段并理解,如果可以將它展現為數字矩陣,其中每一行是一個數據項,列是一個參數。下面這些是最常見的用例:

  

 

  5、如果你引導它,它能學習更復雜的依賴關系。

  選擇一組數據項,將它們分組,算法就會發現所有相關或類似的數據項。重復這個過程數次,那么神經網絡可以學習到它們之間的差異,比如Mac硬件,PC硬件和一般電子文本的差異。

  對20000篇屬于20個不同主題的文章進行了初步分析,得出一個密集的點云圖(左圖)。在使用深度學習迭代幾次之后,算法會將它們進行分類,錯誤率僅僅1.2%(右圖)。

  

 

  6、即使沒有監督它也能夠學習

  深度學習和自編碼器模擬了人類大腦活動,并且能夠在數據集中自動識別高層次的模式。例如,在谷歌大腦計劃中,自編碼器通過“觀看”一千萬條YouTube視頻截取的數字圖像,成功地學習并識別出人和貓臉:

  

  我最近在使用拓撲數據分析和深度學習,并開發出一套工具,它將這些技術轉換成了一個用戶友好型界面,能夠讓人們觀察數據并發現潛在聯系。去這個網站看看,并讓我知道你是否愿意創建你自己數據的地圖。

推薦 打印 | 錄入: | 閱讀:
相關新聞      
本文評論   
評論聲明
  • 尊重網上道德,遵守中華人民共和國的各項有關法律法規
  • 承擔一切因您的行為而直接或間接導致的民事或刑事法律責任
  • 本站管理人員有權保留或刪除其管轄留言中的任意內容
  • 本站有權在網站內轉載或引用您的評論
  • 參與本評論即表明您已經閱讀并接受上述條款