2023-10-12 21:00来源:m.sf1369.com作者:宇宇
(pattern)
匹配 pattern 并获取这一匹配。所获取的匹配可以从产生的 Matches 集合得到,在VBScript 中使用 SubMatches 集合,在JScript 中则使用 $0…$9 属性。要匹配圆括号字符,请使用 ‘\(’ 或 ‘\)’。
(?:pattern)
匹 配 pattern 但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储供以后使用。这在使用 “或” 字符 (|) 来组合一个模式的各个部分是很有用。例如, ‘industr(?:y|ies) 就是一个比 ‘industry|industries’ 更简略的表达式。
(?=pattern)
正 向预查,在任何匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如,‘Windows (?=95|98|NT|2000)’ 能匹配 “Windows 2000〃 中的 “Windows” ,但不能匹配 “Windows 3.1〃 中的 “Windows”。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始。
(?!pattern)
负 向预查,在任何不匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如‘Windows (?!95|98|NT|2000)’ 能匹配 “Windows 3.1〃 中的 “Windows”,但不能匹配 “Windows 2000〃 中的 “Windows”。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始
在PERL的模式中,括号内的子模式将存贮在内存中,此功能即取消存贮该括号内的匹配内容,如/(?:a|b|c)(d|e)f\1/中的\1表示已匹配的d或e,而不是a或b或c
有很多命令在命令行可以执行的,但是不能直接放入perl中执行,需要对特殊字符进行转义。$ 前面都加上\试试,不然$3会被当作是perl中的变量。
我建议最好是用perl直接写比较好,实在不会写,你把awk '($3=="*"&&$6>=50)||($3!="*"&&$6>=20)' file1 >file2 这句话写到一个shell脚本里面,执行成功后,然后将这个shell脚本放入perl的system中执行。
输入 perl test.pl 然后就能执行了。其中test.pl是你所要运行的文件的名称用命令指示符则说不是内部或外部的命令。这个说明安装没有自动把perl的文件路径自动添加到环境变量中去。具体方法:右击我的电脑--属性--高级--环境变量--在系统变量部分--双击path--在最后添加你perl的安装路径。例如;C:\Perl\bin 另外一种方法,你也可以安装activeperl 5.10.0 它会自动添加环境变量
grep-P'Regularexpressions'其中-P告诉grep使其支持perl正则表达式'Regularexpressions'此处就是perl正则表达式具体的语法跟perl中的一模一样
使用ADSL超频奇兵软件可以加快网速。 ADSL超频奇兵软件为ADSL加速软件。通过修改PC系统注册表中原来专为低速接入而设置的TCP/IP默认参数,以适应PPPOE方式的ADSL接入。 实测可提高一倍左右的下载速度并解决了ADSL浏览网页停顿、速度减慢的问题。
新增免费主机功能支持PHP,EXE,PERL CGI程序。
使用ADSL超频奇兵软件可以加快网速。
ADSL超频奇兵软件为ADSL加速软件。通过修改PC系统注册表中原来专为低速接入而设置的TCP/IP默认参数,以适应PPPOE方式的ADSL接入。 实测可提高一倍左右的下载速度并解决了ADSL浏览网页停顿、速度减慢的问题。 新增免费主机功能支持PHP,EXE,PERL CGI程序。
CSV文件中的字符可以通过多种方式进行修改。
一种简单的方法是在电子表格软件中打开CSV文件并进行编辑,然后将修改后的内容保存为CSV文件。
另一种方法是使用文本编辑器打开CSV文件并进行修改。在文本编辑器中,可以使用查找和替换功能来快速更改多个字符。
还可以使用脚本编程语言,如Python和Perl,通过读取CSV文件并对其中的内容进行修改来改变CSV字符。
无论使用哪种方法,必须确保在修改CSV文件后保存为正确的格式,以确保其它程序可以正确地读取它。
PCL与PDL的区别在于作用对象以及应用范围不同。PCL(Python Control Library)是Python语言编写的控制库,主要用于控制机器人、无人机等智能装备的行动,它可以实现动态路径规划、运动控制、运动稳定等功能,是智能控制领域的重要工具。PDL(Perl Data Language)则是Perl语言中一种数据处理的扩展工具,它可以方便地处理复杂的数据类型和结构,支持向量、矩阵、统计学、数值计算等多种计算和分析功能,是数据处理领域的常用工具。两者之间无法直接比较,需要根据实际应用需求来选择使用哪一个工具。
1 命名规则
1.1 文件命名
文件名称统一用英文字母(大小写)、数字和下划线的组合,长度一般不超过20个字符,文件命名体现功能的含义,正式发布版本不能加入作者信息。Perl Scripts 文件的扩展名必须是".pl",Perl Module文件的扩展名必须是".pm"。
正确:
lucent_file_parser.pl
不是:
lucent_file.p
1.2 标识符
采用语法模板来定义标识符的名字,命名必须有一定的实际意义,由英文字母组成,中间可以根据语义的连续性,使用下划线连接。
1.2.1 变量
局部变量必须由小写字母和下划线组成,常量名必须由大写字母和下划线组成。由多个单词组成的名字里,使用下划线"_"把多个单词分开。全局变量以’g_’开头,其余部分的命名规则和局部变量相同。每个全局变量必须有注释说明其作用。
正确:
my $next_node;
不是:
my $node;
1.2.2 包和类
包、类的命名采用大小写混合、首字母大写的方法。
正确:
IO::Controller
1.2.3 标识符缩写
标识符缩写时要保留单词的开始字母,不是辅音字母的简写。
正确:
use List::Util qw( max );
DESC:
for my $desc (@orig_strs) {
my $len = length($desc);
next DESC if ($len > $UPPER_LIM);
$max_len = max($max_len, $len);
}
不是:
use List::Util qw( max );
DSCN:
for my $dscn (@rgnl_strgs) {
my $lngh = length $dscn;
next DSCN if $lngh > $UPPR_LMT;
$mx_lngh = max($mx_lngh, $lngh);
}
1.2.4 函数
由小写字母、下划线组成。
正确:
sub max
{
……
}
sub get_msc_name
{
……
}
不是:
sub getMscName
{
……
}
1.3 布尔类型
boolean类型的变量,或返回boolean类型的值的函数,在命名时要反映其属性,必须用is或者has开头。
正确:
sub is_valid;
sub is_metadata_available_for;
sub has_end_tag;
my $has_loading_finished;
my $has_found_bad_record;
# and later...
if (is_valid($next_record) && !$has_loading_finished) {
METADATA:
while (is_metadata_available_for($next_record)) {
push @metadata, get_metadata_for($next_record);
last METADATA if (has_end_tag($next_record));
}
}
else {
$has_found_bad_record = 1;
}
1.4 数组和哈希
数组类型的变量采用复数,hash类型的变量采用单数。要用undef显式释放变量空间。
正确:
my %option;
my %title_of;
my %count_for;
my %is_available;
# and later...
if ($option{'count_all'} && $title_of{$next_book} =~ m/$target/xms) {
$count_for{$next_book}++;
$is_available{$next_book} = 1;
}
my @events;
my @handlers;
my @unknowns;
# and later...
for my $event (@events) {
push @unknowns, grep { ! $_->handle($event) } @handlers;
}
print map { $_->err_msg } @unknowns;
2 注释
所有注释可用英文或中文书写,尽量使用英文注释。保持注释和代码的完全一致,修改程序时,必须修改相应的注释。注释的行数一般应在程序总行数的1/5到1/3。禁止出现错别字。注释应该语义明确,避免出现二义性。
2.1 文件头部注释
每个含有源代码的文件必须在文件开始有关于该文件的介绍性注释。其中列出文件名、创建者、创建日期、功能描述、版本信息、版权声明;如果对文件进行了修改,应该在文件头中说明修改人、修改日期、修改原因,并变更文件的版本信息,最新版本信息放到最前面。
格式为:
#*********************************************************
# FileName: lucent_file_parser.pl
# Creator: Phonix <phonix@gmail.com.cn>
# Create Time: 2006-01-09
# Description: This is the proof-of-concept code for the
# Windows denial-of-serice attack described by
# the Razor team (NTBugtraq, 19-May-00).
# CopyRight: Copyright © Bright Ocean Inter-Telecomm,All rights reserved.
# Revision: V1.0.0
# ModifyList:
# Revision: V1.1.1
# Modifier: Phonix
# ModifyTime: 2006-01-17
# ModifyReason: fix the bug of ……
#
# Revision: V1.1.0
# Modifier: Phonix
# ModifyTime: 2006-01-16
# ModifyReason: add mysql&oracle db support
#*********************************************************
不是简单的:
#========================================
#Created By:Phonix
#Created Time: 2006-01-09
#Modified Time: 2006-01-17
#========================================
2.2 文件中注释
建议在文件中标识出修改部分的起止位置。
正确:
# add mysql&oracle db support begin
……
# add mysql&oracle db support end
2.3 函数注释
在每个函数前必须写描述性注释。说明这个函数的功能、参数和函数的返回值。
格式为:
#*******************************************************************
# Function Name: calc_time($datetime, $delta)
# Description: This function calculate the new datetime.
# Parameters:
# 1. $datetime is the base time, taking the format of 'yyyy-mm-dd hh:mm:ss'
# 2. $delta is the time which should be add to the $datetime. A positive value increase the time
# while the negative vale decrease the time
# Return:
# A new time string is returned, also taking the format of 'yyyy-mm-dd hh:mm:ss'
#*********************************************************************
不是简单的:
##########################################
#function name : get_ldap
#desc : get config info from ldap server
##########################################
2.4 程序块注释
程序块注释用于说明程序中的关键算法、使用某种技巧的代码以及修改、测试、阅读时必须加以注意的代码。
格式为:
#*********************************************************************
#注释内容
#......
#......
#********************************************************************
2.5 语句注释
用于对特定程序语句进行说明,建议采取在语句行末尾说明的方法,同时注释换行后也要对齐。格式为:
my @names = (
'Damian', # Primary key
# the key is
'Matthew', # Disambiguator
'Conway', # General class or category
);
3 代码布局
3.1 括号
建议括号、插入语可以采用两种方式之一,但是在一个程序里选定那种方式之后,那么要至始至终保持一致。
3.1.1 方式一
采用K&R风格。
格式为:
my @names = (
'Damian', # Primary key
'Matthew', # Disambiguator
'Conway', # General class or category
);
for my $name (@names) {
for my $word ( anagrams_of(lc $name) ) {
print "$word\n";
}
}
3.1.2 方式二
括号对{}对必须位于同一列,独占一行,并且和{}之外的语句行对齐
my @names =
(
'Damian', # Primary key
'Matthew', # Disambiguator
'Conway', # General class or category
);
for my $name (@names)
{
for my $word (anagrams_of(lc $name))
{
print "$word\n";
}
}
3.2 关键字
把关键字和其他的内容分开,关键字if, while, for,else…后面必须接一个空格。if和while语句必须使用’{‘和’}’括起语句体,即使只有一行代码。建议不使用单行的if语句。
正确:
for my $result (@results) {
print_sep( );
print $result;
}
while ($min < $max) {
my $try = ($max - $min) / 2;
if ($value[$try] < $target) {
$max = $try;
}
else {
$min = $try;
}
}
if ($condition){
$i++;
}
不是:
for(@results) {
print_sep( );
print;
}
while($min < $max) {
my $try = ($max - $min) / 2;
if($value[$try] < $target) {
$max = $try;
}
else{
$min = $try;
}
}
if($condition) {$i++;}
3.3 子程序和变量
不要把子程序或变量和其后的括号部分分开。
正确:
my @candidates = get_candidates($marker);
CANDIDATE:
for my $i (0..$#candidates) {
next CANDIDATE if open_region($i);
$candidates[$i]
= $incumbent{ $candidates[$i]{region} };
}
不是:
my @candidates = get_candidates ($marker);
CANDIDATE:
for my $i (0..$#candidates) {
next CANDIDATE if open_region ($i);
$candidates [$i]
= $incumbent {$candidates [$i] {region}};
}
3.4 代码缩排
缩进采用四个空格,或一个TAB(1 TAB 设置成四个空格)。
3.5 代码块
不要把两句话放在一行,每行只能写一个语句。
正确:
while (my $record = <$inventory_file>) {
chomp $record;
next RECORD if $record eq $EMPTY_STR;
my @fields = split $FIELD_SEPARATOR, $record;
update_sales(\@fields);
$count++;
}
不是:
while (my $record = <$inventory_file>) {
chomp $record; next RECORD if $record eq $EMPTY_STR;
my @fields = split $FIELD_SEPARATOR, $record; update_sales(\@fields);$count++;
}
3.6 代码长度
每个函数体的语句行不能超过100行(不包括注释,一个分号算一行)。每行长度不要超过78个字符,超过该长度时,必须考虑换行,从低优先级的操作符处分割长表达式, 在赋值符前断开长的语句。
正确:
push (@steps, $steps[-1]
+ $radial_velocity * $elapsed_time
+ $orbital_velocity * ($phase + $phase_shift)
- $DRAG_COEFF * $altitude);
$predicted_val = $average + $predicted_change * $fudge_factor;
不是:
push (@steps, $steps[-1] + $radial_velocity
* $elapsed_time + $orbital_velocity
* ($phase + $phase_shift) - $DRAG_COEFF
* $altitude);
$predicted_val = $average
+ $predicted_change * $fudge_factor;
3.7 操作符
二元运算符(算术运算符, 赋值运算符等)的两边都要接空格,低级操作符(如:+-)两边各有两个空格,高级操作符(如:*%)两边各有一个空格。
在运算符'->'两边不要使用空格,在一元操作符和操作数两边不要使用空格。
可以使用括号来表示运算的先后顺序。
正确:
my $displacement
= $initial_velocity * $time + 0.5 * $acceleration * $time**2;
my $price
= $coupon_paid * $exp_rate + ($face_val + $coupon_paid) * $exp_rate**2;
不是:
my $displacement=$initial_velocity*$time+0.5*$acceleration*$time**2;
my $price=$coupon_paid*$exp_rate+(($face_val+$coupon_val)*$exp_rate**2);
3.8 语句结束符
在每个语句后边要填加分号。
正确:
while (my $line = <>) {
chomp $line;
if ( $line =~ s{\A (\s*) -- (.*)}{$1#$2}xms ) {
push @comments, $2;
}
print $line;
}
3.9 代码排列
数组或Hash的赋值采用垂直排列。
正确:
my @months = qw(
January February March
April May June
July August September
October November December
);
my %expansion_of = (
q{it's} => q{it is},
q{we're} => q{we are},
q{didn't} => q{did not},
q{must've} => q{must have},
q{I'll} => q{I will},
);
不是:
my @months = qw(
January February March April May June July August September
October November December
);
my %expansion_of = (
q{it's} => q{it is}, q{we're} => q{we are}, q{didn't} => q{did not},
q{must've} => q{must have}, q{I'll} => q{I will},
);
3.10 非末端表达式
采用中间变量代替长表达式。
正确:
my $next_step = $steps[-1]
+ $radial_velocity * $elapsed_time
+ $orbital_velocity * ($phase + $phase_shift)
- $DRAG_COEFF * $altitude
;
add_step( \@steps, $next_step, $elapsed_time);
不是:
add_step( \@steps, $steps[-1]
+ $radial_velocity * $elapsed_time
+ $orbital_velocity * ($phase + $phase_shift)
- $DRAG_COEFF * $altitude
, $elapsed_time);
3.11 功能块顺序
在每个Perl Scripts中,每个功能块之间必须有一个空行。主程序为main()函数,功能块出现顺序如下:
use modules;
global variable 定义
main定义
sub routine 定义
4 数值和表达式
4.1 字符串界定符
需要用变量替换的字符串用双引号,否则用单引号。
正确:
my $spam_name = "$title $first_name $surname";
my $pay_rate = "$minimal for maximal work";
my $spam_name = 'Dr Lawrence Mwalle';
my $pay_rate = '$minimal for maximal work';
4.2 常量
使用字符常量,而不要直接用数值。
正确:
use Readonly;
Readonly my $MOLYBDENUM_ATOMIC_NUMBER => 42;
# and later...
print $count * $MOLYBDENUM_ATOMIC_NUMBER;
不是:
print $count * 42;
4.3 字符串
4.3.1 两行
对于两行的字符串,要用“.”进行连接。
正确:
$usage = "Usage: $0 <file> [-full]\n"
. "(Use -full option for full dump)\n";
不是:
$usage = "Usage: $0 <file> [-full]
(Use -full option for full dump)";
4.3.2 多于两行
对于多于两行,要采用如下格式:
正确:
$usage = <<"END_USAGE";
Usage: $0 <file> [-full] [-o] [-beans]
Options:
-full : produce a full dump
-o : dump in octal
-beans : source is Java
END_USAGE
不是:
$usage = "Usage: $0 <file> [-full] [-o] [-beans]\n"
. "Options:\n"
. " -full : produce a full dump\n"
. " -o : dump in octal\n"
. " -beans : source is Java\n"
;
4.4 哈希变量
Hash变量的定义采用双箭头(=>)方式。
正确:
%default_service_record = (
name=> '<unknown>',
rank=> 'Recruit',
serial=> undef,
unit=> ['Training platoon'],
duty=> ['Basic training'],
);
不是:
%default_service_record = (
'name', '<unknown>',
'rank', 'Recruit',
'serial', undef,
'unit', ['Training platoon'],
'duty', ['Basic training'],
);
5 函数
5.1 调用语法
调用时要使用圆括号,不管是否有参数。
正确:
fix();
coerce($input, $INTEGER, $ROUND_ZERO);
不是:
fix;
5.2 函数返回
在函数中要进行显式的return返回。
正确:
sub set_terseness {
my ($terseness) = @_;
my $default_terseness = $terseness;
return; # Explicitly return nothing meaningful
}
不是:
sub set_terseness {
my ($terseness) = @_;
my $default_terseness = $terseness;
}
6 编程惯例
6.1 使用use strict
所有Perl Scripts 文件中必须在开始使用“use strict;”,进行严格的语法检查,便于查找错误。
6.2 避免使用内部变量名称
避免使用Perl内部变量。使用“use English;”装入Perl内部变量的符号名称。使用my来限定变量的作用域。下面是一些Perl内部变量名称的对应关系。
$_ $ARG
@_ @ARG
$! $ERRNO
$? $CHILD_ERROR
$$ $PID
$0 $PROGRAM_NAME
$. $INPUT_LINE_NUMBER
$| $OUTPUT_AUTOFLUSH
$@ $EVEL_ERROR
$& $MATCH
$` $PREMATCH
$' $POSTMATCH
$+ $LAST_PAREN_MATCH
$/ $RS
$\ $ORS
$< $UID
$> $EUID
$( $GID
$) $EGID
$] $PERL_VERSION
$? $CHILD_ERROR
6.3 避免使用goto
避免使用goto语句(只有在从多重循环的内部跳出时才可以使用)。除非能够特别有效的增加程序的效率并且不影响程序良好结构的特殊情况。
6.4 语法检查(辅助工具)
使用-cw选项检查Perl程序的语法。
正确:
perl -cw -Mdiagnostics file.pl # check syntax with warnings on
nt; # Perl 5.004_04, define constants
use Env; # instead of $ENV{'HOME'}; Shortens the usage, but do not
# mix normal variables
# with environment variables.
6.5 use Carp; # For modules: 使用标准模块
尽量使用标准库函数、公共函数和开发库中已有的函数和模块,使用FileHandle模块来处理文件的读写。尽量使用以下的标准Perl模块:
use strict; # helps you to locate syntax errors or uncertainties.
use integer; # if you don't need floating point math,it will speed Perl up.
use constagives you `carp' and `croak'
use English; # gives symbolic names, like $! ==> $ERRNO
use Getopt::Long; # --posix command line option handling
use Cwd; # platform independent cwd()
use File::Basename; # don't invent your own wheel of this.
use File::Find; # don't use system("find . -name ...")...
use File::copy; # don't use system("cp this that");
use File::patch; # instead of system("mkdir");
use File::stat; # readable: $st = stat($file), $st->mode
use DirHandle; # OO form of `readdir'
use Text::Tabs # un/expand tabs in text
use Text::ParseWords; # Parse text into tokens, understands embedded
# quotes. @a = "ewords("[ +]", 0, $_);
# a+b, "a b" + c
use Socket; # socket handling
use Sys::Hostname; # don't invent your own wheel
use Net::Ping # unix ping, check if host is online
use Time::Local # time manipulations
6.6 其他
1、编码、测试、注释,是程序员的三项基本工作,它们是同等重要的。
2、可靠性第一,可读性第二,效率第三。只有在极个别必须强调效率的部分,可以是可靠性第一,效率第二,可读性第三。
3、首先是正确,其次是优美。
4、无法证明你的程序没有错误。因此,在新编写完一段程序后,应该测试通过后再继续编码。
5、改正一个错误的同时,可能会引起新的错误。因此,在修改bug前,首先考虑对其他程序的影响。修改后,应该对程序进行完整的测试,而不是只对修改部分进行测试。
6、避免使用很多个参数的函数。
7、函数应该只有一个出口。
8、循环应该只有一个出口,避免多个出口。
9、尽量避免使用全局变量。
10、在尽可能小的作用域内定义和使用变量。
11、使用括号,表达复杂表达式中的操作符的优先顺序。
12、循环、分支不要超过五个层次。
13、循环、分支等语句后,即使只有一行代码时,也要使用{}将其括起来。
14、禁止else goto和else return。
15、重复使用的、完成相对独立功能的算法、代码,应该抽象为公共模块。