Linux下大文件的排序和去重复

Linux下我们用 sortuniq 的命令来实现去重复行。

去重复行

简单的用法如下,如一个文件名:happybirthday.txt

cat happybirthday.txt (显示文件内容)

Happy Birthday to You!
Happy Birthday to You!
Happy Birthday Dear Tux!
Happy Birthday to You!

cat happybirthday.txt|sort (排序)

Happy Birthday Dear Tux!
Happy Birthday to You!
Happy Birthday to You!
Happy Birthday to You!

cat happybirthday.txt|sort|uniq (去重复行)

Happy Birthday Dear Tux!
Happy Birthday to You!

阅读更多

弦动我心 向月葵·岁月

弦动我心 向月葵·岁月

 我是一朵
害怕阳光的向月葵
该昂头挺胸迎着朝阳时,
我却弯腰低头四处躲藏。
只有温柔的月亮出来时,
我才努力绽放。 阅读更多

用NCBI提供的Graphics工具来查看,就能知道基因的内含子和外显子的序列了

如何确定基因的内含子和外显子序列及基因结构图

这标题最长。哈哈。好吧,进入正题。

问题如下:

我想在NCBI上找猪KIT(FJ938289)基因的结构图以及其内含子外显子的序列? 阅读更多

插件如何发布到WP官方上去?

插件如何发布到WP官方上去?

本来想写教程的,发布你的插件到WordPress官方。但是google了一下,已经有这些教程了。呵呵,我就懒得再写了。转过来给你们看看呗。

看完就成高手了。

大体上的流程就是:

1,到wordpress官方注册一个帐号 阅读更多

酵母菌的txid=4932

NCBI查找基因序列:酵母菌的细胞色素C与异柠檬酸裂解酶

又是一个NCBI查找基因序列的实例分析。虽然我已经写过很多篇了,不过,这方面的需求还是挺大的。其实只要去google一下,就能找到我以前写的文章,看一看就会了。

一般而言,大多数人的问题是:在NCBI上面总是出来太多结果,无法筛选。

这次的NCBI查找基因序列的例子

菌名:酵母菌 (yeast、Saccharomyces cerevisiae)
基因:细胞色素C (Cytochrome C)、异柠檬酸裂解酶  (isocitrate lyase)

阅读更多

phpMyAdmin管理工具

WP博客搬数据库用到的几个工具

MySQL数据库搬家是一件挺麻烦的事。特别是乱码问题,比较容易碰到。MySQL乱码问题,主要是编码问题,对于WP博客而言,导入时选择utf8就行了。

这里提一下几个工具,都是MySQL常用的工具。

1,SSH下的命令

命令:  mysql -u用户名 -p密码 db_name  <file_bak.sql
解释:把file_bak.sql的数据导入db_name
缺点:不适合中文博客哦。会有乱码。这个命令好像没得选utf-8。

阅读更多

clicki

Clicki统计真好玩!

Clicki的统计系统不知有谁在玩? 挺好玩。效果看侧边栏。不过,更好玩的还在后头呢~

这几天Clicki统计一直不工作,去Clicki网站看了看,原因如下:

Clicki管理员:skyoo61

在国庆期间,数据库出现了很严重的问题,造成部分用户数据丢失,由于某些人的无良行为,给大家带来的不便。所以,在8月份之后注册的朋友请重新注册。在此,Clicki开发团队深表歉意,并且加强对数据库的管理,备份等。再次感谢大家的支持与厚爱。 阅读更多

博客如何快速搬家?

博客第一次搬家,总结一下经验啊,免得以后犯错。这里只是一家之谈,有好的方法请提出来。

上一篇是“把博客搬家到MT合租空间了”,只提出问题,现在先来解答第一个问题,博客如何快速搬家?这里的快速搬家是指整站的文件,而没有包括数据库的。数据库的安排在下一篇。 阅读更多