两种办法批量去掉重复数据

Posted on 02 九月 2009 by 柳城 ,阅读 492

这是对大批量数据而言的,数据少的话其实没多大意思。我喜欢大批量的数据。对于大批量的数据,最好用的工具其实还是Linux,如果是稍微少一些的话,直接用Excle就行了。

这里介绍两种办法,去掉重复的数据。说之前来复习一下我喜欢的一句话:柳城博客(Lc.), 努力在数据的海洋里畅游

1,用Excle,适合不算太大量的数据

如果是用Excle,太大的数据打开会有问题的。打开十几M的大小的Excle都够吃力的。如果电脑内存差些,那更加惨。不过,这种情况是适合大部分人的。

两种办法批量去掉重复数据

两种办法批量去掉重复数据

 

2,用Linux,sort与uniq命令

假设数据放在一个文件,取名file.txt。

cat file.txt | sort | uniq >newfile.txt

这样就是去掉重复数据,并输出到一个新的文件newfile.txt

简单吧。

转载请注明 : 来源于 两种办法批量去掉重复数据 | 柳城

赞助商

5条评论 于 “两种办法批量去掉重复数据”

  1. Dream Dream Says:

    我倒是很想知道怎样去掉WP中重复的。哈哈

    [回复]

    Lc.
    Lc. 回复:

    WP中的重复?你是指修订版或草稿之类的?有插件的~ WP Cleaner: http://www.liucheng.name/?p=99

    [回复]

  2. 一路阳光 一路阳光 Says:

    嘿。。。EXCEL那种学会了

    [回复]

  3. 文盛杰SEO博客 文盛杰SEO博客 Says:

    SPSS用起来做统计比较方便

    [回复]

  4. Tiger Tiger Says:

    学习了,刚好找这个命令

    [回复]

Leave a Reply

广告招租

[强] [握手] [可爱] [ok] [呲牙] :) [偷笑] [流泪] [疑问] [亲亲] [擦汗] [得意] [衰] [可怜] [抱拳] [坏笑] more »

无觅相关文章插件,快速提升流量