OpenRefine(數(shù)據(jù)清理工具)是一款相當好用的數(shù)據(jù)清理軟件,這款軟件能夠?qū)﹄娔X系統(tǒng)里的數(shù)據(jù)進行整理,同時還可以清理掉那些沒有的數(shù)據(jù),一鍵就可以批量進行清理,輕松就能幫助你釋放空間。而且這款軟件操作非常簡單,為用戶帶來非常大的便利,需要的小伙伴,還在等什么,趕緊來試試吧~
OpenRefine(數(shù)據(jù)清理工具)使用方法
一、下載后打開軟件,軟件會自動讀取電腦數(shù)據(jù)并上傳到服務(wù)器。
二、完成上傳后,軟件會自動打開網(wǎng)頁,用戶在網(wǎng)頁中可以的對自己的電腦進行整理和清理。
OpenRefine(數(shù)據(jù)清理工具)軟件簡介
無論是現(xiàn)今的大數(shù)據(jù)還是企業(yè)內(nèi)部的小數(shù)據(jù),都存在一些普遍的問題,如數(shù)據(jù)格式不對需要轉(zhuǎn)換,一個單元格內(nèi)包含多個含義的內(nèi)容,包含重復項等等,雖然我們也可以使用excel解決,但是excel天生有諸多限制,比如其為直接對數(shù)據(jù)進行操作,容易導致誤操作;數(shù)據(jù)量大會處理緩慢;透視表功能太過簡單;無法進行高級的數(shù)據(jù)分類分析。而OpenRefine很好的解決了以上問題。
數(shù)據(jù)清洗Data Cleaning:是嘗試通過移除空的數(shù)據(jù)行或重復的數(shù)據(jù)行、過濾數(shù)據(jù)行、聚集或轉(zhuǎn)換數(shù)據(jù)值、分開多值單元等,以半自動化的方式修復錯誤數(shù)據(jù)的過程。數(shù)據(jù)清洗是一個反復的過程,不可能在幾天內(nèi)完成,只有不斷的發(fā)現(xiàn)問題,解決問題。對于是否過濾,是否修正一般要求客戶確認。
IDTs:Interactive Data Transformation tools,交互數(shù)據(jù)轉(zhuǎn)換工具,它可以對大數(shù)據(jù)進行快速、廉價的操作,使用單個的集成接口。
OpenRefine就是這樣的IDT工具,可以觀察和操縱數(shù)據(jù)的工具。它類似于傳統(tǒng)Excel的表格處理軟件,但是工作方式更像是數(shù)據(jù)庫,以列和字段的方式工作,而不是以單元格的方式工作。這意味著OpenRefine不僅適合對新的行數(shù)據(jù)進行編碼,而且功能還極為強大。

OpenRefine(數(shù)據(jù)清理工具)軟件特色
● OpenRefine前身是谷歌公司(Google) 開發(fā)的數(shù)據(jù)清洗工具GoogleRefine,
隨后于2012年開放源代碼,改為現(xiàn)在的OpenRefine
● 一款基于計算機瀏覽器的數(shù)據(jù)清洗軟件
● 在數(shù)據(jù)清洗、數(shù)據(jù)探索以及數(shù)據(jù)轉(zhuǎn)換方面非常有效的一個格式化工具
●它是一個開源的網(wǎng)絡(luò)應(yīng)用,可以在計算機中直接運行,這樣可以避開上傳指
定信息到外部服務(wù)器的問題
●它類似于傳統(tǒng)Excel處理軟件,但是工作方式更像是數(shù)據(jù)庫,以列和字段的
方式工作,而不是以單元格的方式工作