ROST中文詞頻統(tǒng)計(jì)工具是一款非常不錯(cuò)的字頻統(tǒng)計(jì)和分析軟件,幫助用戶進(jìn)行中文字頻統(tǒng)計(jì)、中文詞頻統(tǒng)計(jì)、英文單詞拼讀、英文詞組統(tǒng)計(jì)等統(tǒng)計(jì)分析的操作,當(dāng)然可以直接對(duì)文章中的詞語進(jìn)行提取和刪除,支持批量統(tǒng)計(jì);當(dāng)軟件完成統(tǒng)計(jì)后會(huì)生成一個(gè)統(tǒng)計(jì)結(jié)果的網(wǎng)頁文檔,直觀清晰可見。通過ROST中文詞頻統(tǒng)計(jì)工具可以輕松的幫助你萬仇詞組統(tǒng)計(jì)。
ROST中文詞頻統(tǒng)計(jì)工具 特點(diǎn)
1、使用簡(jiǎn)單,無需安裝;
2、批量執(zhí)行,速度快;
3、結(jié)果生成網(wǎng)頁,查看方便。
ROST中文詞頻統(tǒng)計(jì)工具功能
1.統(tǒng)計(jì)一個(gè)文檔中出現(xiàn)過的所有漢字及非漢字頻度;
2.統(tǒng)計(jì)一個(gè)文檔中和另外一個(gè)字表對(duì)比之后超綱的詞及詞頻數(shù),對(duì)字頻統(tǒng)計(jì)結(jié)果進(jìn)行詞頻升序、詞頻降序、字母升序、字母降序排列;
3.字典工具有超級(jí)功能:提取一定長(zhǎng)度的單詞,刪除第一個(gè)字符串中某個(gè)字符串的單詞,刪除最后一個(gè)字符串中某個(gè)字符串的單詞,提取第一個(gè)字符串中某個(gè)字符串的單詞,字符串中每個(gè)單詞的unicode值或ASC值,提取重復(fù)結(jié)束的字符串,對(duì)短語進(jìn)行排序,刪除重復(fù)的字符串,刪除某個(gè)字符串的單詞,將文本拆分成一個(gè)單詞一行,提取包含某個(gè)單詞串的單詞,附加ASC碼表,刪除連續(xù)空格,任意提取單空格短語或多空格短語,刪除單詞中包含的某些字符,剔除包含某些漢字或其他字符的行,提取某個(gè)字符串之前的所有單詞。對(duì)于普通文件,可以拆分操作。這個(gè)字典工具的處理速度目前還沒有優(yōu)化,所以計(jì)劃在下一個(gè)版本中單獨(dú)拿出字典工具進(jìn)行優(yōu)化,以便處理非常大的文檔。
4.這個(gè)軟件的一個(gè)主要特點(diǎn)是批處理。用戶可以批量選擇一系列文本文件,批量生成Fre頻率文件。頻率文件是一種用戶定義的數(shù)據(jù)文件,包含單詞或單詞和頻率,是ROST的專有格式。通過Fre的定義,可以有效提高處理速度。頻率文件fre可以通過計(jì)算集合和交集來處理。設(shè)置獲取所有頻率文件的總和。交集產(chǎn)生包含在所有頻率文件中的單詞。這在實(shí)踐中有什么作用?通過交集提取出一系列文檔,就可以得到某類文檔(如旅游、計(jì)算機(jī))中的共同特征詞。但是,集合可以快速處理大型文檔。鑒于這個(gè)軟件的高速,也可以進(jìn)行1000億字的統(tǒng)計(jì)。
5.自定義過濾詞表,可以使用菜單右鍵查看過濾詞表,添加自己需要的過濾詞。目前使用的過濾詞表為空,用戶可以自行增加。使用菜單保存詞表之后將該文本文件覆蓋軟件目錄下的dict目錄下的compare.txt即可,使用過濾詞可以非常方便的獲得超綱的字有哪些。
6.從剪貼板統(tǒng)計(jì)文字。注意如果先點(diǎn)擊了剪貼板統(tǒng)計(jì)文字,則非中文統(tǒng)計(jì)顯示的是剪貼板里面的非中文,而不是文件里面的非中文
以上便是kk下載小編給大家介紹的ROST中文詞頻統(tǒng)計(jì)工具!