Perl:FastQ与FastA格式的相互转换
今天再介绍一个Perl的脚本,实现FastQ与FastA格式的相互转换。这个脚本还支持把SCARF格式转化为standard/Sanger FASTQ格式。
FASTQ根据来源的不同,可分为多种。如standard/Sanger FASTQ,Solexa/Illumina FASTQ,FASTQ-like forma等
关于FastQ的格式,详细请看:Fastq格式的详细说明
关于FastA格式,详细请看:Fasta格式的详细说明
今天再介绍一个Perl的脚本,实现FastQ与FastA格式的相互转换。这个脚本还支持把SCARF格式转化为standard/Sanger FASTQ格式。
FASTQ根据来源的不同,可分为多种。如standard/Sanger FASTQ,Solexa/Illumina FASTQ,FASTQ-like forma等
关于FastQ的格式,详细请看:Fastq格式的详细说明
关于FastA格式,详细请看:Fasta格式的详细说明
今天上午收到了《Perl语言编程(第三版)》这本书。Perl最经典的参考书。这本书有1000多页,是我看过的书中最厚的一书(当然除去字典之类的参考书不算^_^),103.20的RMB也是挺贵的。不过相对于1000多页与这本书所提供无价的知识而言,当然不算什么。有得再便宜的话那当然最好不过了。
我已经深深地给这头骆驼吸引了。书里还有用Perl写的诗歌,非常有趣。有机会放上来跟大家分享一下。
对书的质量也挺满意,非常有重量感。从淘宝网上买的。结果却发现是从当当网发货的,真是让人有点气愤。因为我明明上当当网查到,是缺货状态的嘛。不过刚刚我又去查了一下。发现又有货了。当场晕掉,幸好价格是一样的。
来看一下这头骆驼的魁力….. 阅读更多 →
以下内容来自Code Snippets。Perl的File::Basename 模块
File::Basename 模块被用来析取文件路径中的目录,文件名以及后缀。我的这个简单例子演示了如何获取文件后缀。
至于详细用法,用perldoc File::Basename命令查看。
DESCRIPTION
These routines allow you to parse file specifications into
useful pieces using the syntax of different operating sys-
tems. 阅读更多 →
最近比较忙。花了几天时间更新了中文Entrez序列查询工具。不过今天又发现了一个问题,打算这两天搞定。
恩,最近大家生成一个有着一千七百多万个网址的sitemap文件。
一千七百多万个网址,就有一千七百多万个页面。不可思议,的确有点多。
最近也认真研究了sitemap协议。推荐你也去看看sitemaps.org。
您可以提供多个 Sitemap 文件,但每个 Sitemap 文件包含的网址不得超过 50,000 个,并且文件不得超过 10MB(10,485,760 字节)。如果您愿意,可以使用 gzip 压缩 Sitemap 文件,以减少带宽要求;但是解压缩后的 Sitemap 文件不得超过 10MB。如果要列出 50,000 个以上的网址,您需要创建多个 Sitemap 文件。 阅读更多 →
一般默认创建的文件都是ANSI编码的。用记事本打开这个文件,点”另存为”,最下面有个”编码(Encoding)”可以选择,里面有”ANSI,Unicode,UTF-8″等选项。
下面介绍用Perl直接创建一个UTF-8的文件
open( OUT, ">:utf8", "a.txt" ) or die "a.out: $!";
print OUT "\x{feff}";
print OUT "aaaa\n";
close OUT;
有时你要构建本地的Blast,需要用到NCBI已经构建好的Blastdb。可以用FTP下载。这里NCBI还提供一个Perl程序来下载NCBI的blast库。
update_blastdb.pl – Download pre-formatted BLAST databases from NCBI。右键另存为 阅读更多 →