Linux
文章
Linux下大文件的排序和去重复
/13 评论/在: 数据分析 /通过: 柳城Linux下我们用 sort 与 uniq 的命令来实现去重复行。
去重复行
简单的用法如下,如一个文件名:happybirthday.txt
cat happybirthday.txt (显示文件内容)
Happy Birthday to You!
Happy Birthday to You!
Happy Birthday Dear Tux!
Happy Birthday to You!
cat happybirthday.txt|sort (排序)
Happy Birthday Dear Tux!
Happy Birthday to You!
Happy Birthday to You!
Happy Birthday to You!
cat happybirthday.txt|sort|uniq (去重复行)
Happy Birthday Dear Tux!
Happy Birthday to You!
BioPerl安装指南:Unix/Linux/Windows下的安装
/17 评论/在: Biocompute /通过: 柳城其实BioPerl的功能很强大。但是用的人却不多。最根本的原因可能是,太多数人都还是新手,相对而言Perl很难懂,不懂Perl的人根本搞不懂BioPerl。而且BioPerl安装也很复杂。又不像Perl一样打包成一个安装包,一键安装。
到现在,我前前后后安装过BioPerl好几次,每次都觉得很复杂,很难懂。我又不是计算机专业出身的,真的是连最基本的计算机算法或原理都是不懂的。我学BioPerl的确感到吃力。所以,接触了BioPerl这么久,都只是用BioPerl从NCBI上拿序列。其它的功能还没真正接触。
接下来可能花些时间慢慢学习。首先先安装好Perl(http://www.perl.org/get.html) 阅读更多 →
Cygwin在Windows上提供一个完整的UNIX shell
/1 评论/在: Biocompute /通过: 柳城windows和linux各有其优越性,可以安装在同一台电脑上,装双系统要重启转换麻烦,安装虚拟机也需要配置很多东西。
cygwin是一个在windows平台上运行的unix模拟环境,是cygnus solutions公司开发的自由软件(该公司开发了很多好东西,著名的还有eCos,不过现已被Redhat收购)。
它对于学习unix/linux操作环境,或者从unix到windows的应用程序移植,或者进行某些特殊的开发工作,尤其是使用gnu工具集在windows上进行嵌入式系统开发,非常有用。随着嵌入式系统开发在国内日渐流行,越来越多的开发者对cygwin产生了兴趣。 阅读更多 →
linux:awk中的NR,FNR
/在: Biocompute /通过: 柳城关键词: NR,FNR
FNR表示当前文件的记录数 NR表示到此为止的记录数
对于单个 文件NR 和FNR 的 输出结果一样的 : 阅读更多 →
linux:crontab命令用法
/在: Biocompute /通过: 柳城crond 是linux用来定期执行程序的命令。当安装完成操作系统之后,默认便会启动此任务调度命令。crond命令每分锺会定期检查是否有要执行的工作,如果有要执行的工作便会自动执行该工作。而linux任务调度的工作主要分为以下两类:
1、系统执行的工作:系统周期性所要执行的工作,如备份系统数据、清理缓存
2、个人执行的工作:某个用户定期要做的工作,例如每隔10分钟检查邮件服务器是否有新信,这些工作可由每个用户自行设置