文章

Perl:FastQ与FastA格式的相互转换

今天再介绍一个Perl的脚本,实现FastQ与FastA格式的相互转换。这个脚本还支持把SCARF格式转化为standard/Sanger FASTQ格式。

FASTQ根据来源的不同,可分为多种。如standard/Sanger FASTQ,Solexa/Illumina FASTQ,FASTQ-like forma等

关于FastQ的格式,详细请看:Fastq格式的详细说明

关于FastA格式,详细请看:Fasta格式的详细说明

而至于SCARF格式,因为我没接触过。所以具体也不是太清楚。 阅读更多

Perl 5.10版的新特性与下载

Perl就不多讲了。ActivePerl 5.10是最新的版本。windows版本的点击这里下载。下面是详细列表。

Perl 的5.10版

Perl 基金会公布了 Perl 的5.10版本,该版本是这个广为流行的动态语言五年多来的首次主要升级。最新的版本不仅在已经非常成功的5.8.x的基础上添加了强大的新功能,而且对 Perl 解释器本身也进行了改进。Perl的开发团队,即 Perl Porters,从雄心勃勃的 Perl 6项目,以及其他的主要流行语言中,吸取了特性和灵感,并将它们融入了 Perl 语言实用为上的理念之中。 阅读更多

《Perl语言编程(第三版)》

收到《Perl语言编程(第三版)》

今天上午收到了《Perl语言编程(第三版)》这本书。Perl最经典的参考书。这本书有1000多页,是我看过的书中最厚的一书(当然除去字典之类的参考书不算^_^),103.20的RMB也是挺贵的。不过相对于1000多页与这本书所提供无价的知识而言,当然不算什么。有得再便宜的话那当然最好不过了。

我已经深深地给这头骆驼吸引了。书里还有用Perl写的诗歌,非常有趣。有机会放上来跟大家分享一下。

对书的质量也挺满意,非常有重量感。从淘宝网上买的。结果却发现是从当当网发货的,真是让人有点气愤。因为我明明上当当网查到,是缺货状态的嘛。不过刚刚我又去查了一下。发现又有货了。当场晕掉,幸好价格是一样的。

来看一下这头骆驼的魁力….. 阅读更多

Perl:用Net::FTP来上传下载文件

在Perl中,使用模块Net::FTP来使用FTP服务,一般的使用步骤如下:

  1. 使用Net::FTP的new方法来创建一个新的FTP对象。
  2. 使用login方法登录到FTP服务器。
  3. 使用cwd方法来切换目录。
  4. 使用get方法来获取文件。
  5. 使用put方法来上传文件。
  6. 使用quit方法退出。

阅读更多

Perl:用File::Basename来获取文件名

以下内容来自Code Snippets。Perl的File::Basename 模块

File::Basename 模块被用来析取文件路径中的目录,文件名以及后缀。我的这个简单例子演示了如何获取文件后缀。

至于详细用法,用perldoc File::Basename命令查看。

DESCRIPTION
These routines allow you to parse file specifications into
useful pieces using the syntax of different operating sys-
tems. 阅读更多

有着一千七百多万个url的sitemap文件

1,一千七百多万个URL

最近比较忙。花了几天时间更新了中文Entrez序列查询工具。不过今天又发现了一个问题,打算这两天搞定。

恩,最近大家生成一个有着一千七百多万个网址的sitemap文件。
一千七百多万个网址,就有一千七百多万个页面。不可思议,的确有点多。

2,sitemap协议

最近也认真研究了sitemap协议。推荐你也去看看sitemaps.org

您可以提供多个 Sitemap 文件,但每个 Sitemap 文件包含的网址不得超过 50,000 个,并且文件不得超过 10MB(10,485,760 字节)。如果您愿意,可以使用 gzip 压缩 Sitemap 文件,以减少带宽要求;但是解压缩后的 Sitemap 文件不得超过 10MB。如果要列出 50,000 个以上的网址,您需要创建多个 Sitemap 文件。 阅读更多

用Perl创建UTF-8的文件

一般默认创建的文件都是ANSI编码的。用记事本打开这个文件,点”另存为”,最下面有个”编码(Encoding)”可以选择,里面有”ANSI,Unicode,UTF-8″等选项。

下面介绍用Perl直接创建一个UTF-8的文件


open( OUT, ">:utf8", "a.txt" ) or die "a.out: $!";
print OUT "\x{feff}";
print OUT "aaaa\n";
close OUT;


用Perl下载NCBI的Blast库(Blastdb)

有时你要构建本地的Blast,需要用到NCBI已经构建好的Blastdb。可以用FTP下载。这里NCBI还提供一个Perl程序来下载NCBI的blast库。

update_blastdb.pl – Download pre-formatted BLAST databases from NCBI。右键另存为 阅读更多