两种办法批量去掉重复数据 2009年09月2日/8 评论/在: Biocompute, 数据分析 /通过: 柳城这是对大批量数据而言的,数据少的话其实没多大意思。我喜欢大批量的数据。对于大批量的数据,最好用的工具其实还是Linux,如果是稍微少一些的话,直接用Excle就行了。 这里介绍两种办法,去掉重复的数据。说之前来复习一下我喜欢的一句话:柳城博客(Lc.), 努力在数据的海洋里畅游。 1,用Excle,适合不算太大量的数据 如果是用Excle,太大的数据打开会有问题的。打开十几M的大小的Excle都够吃力的。如果电脑内存差些,那更加惨。不过,这种情况是适合大部分人的。 阅读更多 → //liucheng.name/wp-content/uploads/2009/09/Deduplication2.png 292 346 柳城 http://liucheng.name/logo.gif 柳城2009-09-02 20:46:162009-09-02 21:13:04两种办法批量去掉重复数据