标签归档:正则表达式

用js正则表达式解析URL链接提取Host,Protocol等信息

要求:用javascript正则表达式解析URL链接,并从中提出关键信息

正则表达式:

/^(?:(\w+):\/\/)?(?:(\w+):?(\w+)?@)?([^:\/\?#]+)(?::(\d+))?(\/[^\?#]+)?(?:\?([^#]+))?(?:#(\w+))?/

测试用URL链接:http://username:password@www.bbs0101.com:1234/artical/js/index.php?key1=js&key2=css#anchor

测试代码:

var pattern = /^(?:(\w+):\/\/)?(?:(\w+):?(\w+)?@)?([^:\/\?#]+)(?::(\d+))?(\/[^\?#]+)?(?:\?([^#]+))?(?:#(\w+))?/;
var url = 'http://username:password@www.bbs0101.com:1234/artical/js/index.php?key1=js&key2=css#anchor';
var result = pattern.exec(url);

result返回值:

[
    "http://username:password@www.bbs0101.com:1234/artical/js/index.php?key1=js&key2=css#anchor", 
    "http", 
    "username", 
    "password", 
    "www.bbs0101.com", 
    "1234", 
    "/artical/js/index.php", 
    "key1=js&key2=css", 
    "anchor"
]

常用js正则表达式规则整理

一下仅为正则表达式规则,不包含js正则表达式用法,如果不会使用js正则表达式,请查看教程:

JS正则表达式教程

  • 中文字符:/[u4e00-u9fa5]/
  • 双字节字符(包括汉字):/[^x00-xff]/
  • 正整数: /^[1-9]d*$/
  • 负整数:/^-[1-9]d*$/
  • 整数 :/^-?[1-9]d*$/
  • 非负整数(正整数 + 0):/^[1-9]d*|0$/
  • 非正整数(负整数 + 0):/^-[1-9]d*|0$/
  • 由26个英文字母组成的字符串:/^[A-Za-z]+$/
  • 由26个英文字母的大写组成的字符串 :/^[A-Z]+$/
  • 由26个英文字母的小写组成的字符串 :/^[a-z]+$/  
  • 由数字和26个英文字母组成的字符串 :/^[A-Za-z0-9]+$/
  • 由数字、26个英文字母或者下划线组成的字符串:/^w+$/
  • 数字:/^d*$/ 
  • n位的数字:/^d{n}$/ 
  • 至少n位数字:/^d{n,}$/ 
  • m-n位的数字:/^d{m,n}$/
  • 零和非零开头的数字:/^(0|[1-9]d*)$/
  • 标准邮箱:/^[a-zA-Z0-9_]+@([a-zA-Z0-9-]+.)+[a-zA-A]{2,3}$/

JS正则表达式教程

本文仅介绍js正则表达式使用方法,不包含常用的正则表达式规则,如需查看js常用正则表达式规则,请查看:

常用js正则表达式规则整理

正则表达式中的特殊字符含义:

  • :做为转意,即通常在””后面的字符不按原来意义解释,如/b/匹配字符”b”,当b前面加了反斜杆后/b/,转意为匹配一个单词的边界。
  • ^ :匹配一个输入或一行的开头,/^a/匹配”an A”,而不匹配”An a”
  • $ :匹配一个输入或一行的结尾,/a$/匹配”An a”,而不匹配”an A”
  • * :匹配前面元字符0次或多次,/ba*/将匹配b,ba,baa,baaa
  • + :匹配前面元字符1次或多次,/ba*/将匹配ba,baa,baaa
  • ? :匹配前面元字符0次或1次,/ba*/将匹配b,ba
  • (x) :匹配x保存x在名为$1…$9的变量中
  • x|y :匹配x或y
  • {n} :精确匹配n次
  • {n,m} :匹配n-m次
  • {n,} :匹配n次以上
  • [xyz] :字符集(character set),匹配这个集合中的任一一个字符(或元字符)
  • [^xyz] :不匹配这个集合中的任何一个字符
  • b :匹配一个单词的边界
  • B :匹配一个单词的非边界
  • d :匹配一个字数字符,/d/ = /[0-9]/
  • D :匹配一个非字数字符,/D/ = /[^0-9]/
  • n :匹配一个换行符
  • r :匹配一个回车符
  • s :匹配一个空白字符,包括n,r,f,t,v等
  • S :匹配一个非空白字符,等于/[^nfrtv]/
  • t :匹配一个制表符
  • v :匹配一个重直制表符
  • w :匹配一个可以组成单词的字符(alphanumeric,这是我的意译,含数字),包括下划线,如[w]匹配”$5.98″中的5,等于[a-zA-Z0-9_]
  • W :匹配一个不可以组成单词的字符,如[W]匹配”$5.98″中的$,等于[^a-zA-Z0-9]。

直接量字符:

  • f : 换页符
  • n :换行符
  • r : 回车
  • t : 制表符
  • v : 垂直制表符
  • / : 一个 / 直接量
  • \ : 一个 直接量
  • . : 一个 . 直接量
  • * : 一个 * 直接量
  • + : 一个 + 直接量
  • ? : 一个 ? 直接量
  • | : 一个 | 直接量
  • ( : 一个 ( 直接量
  • ) : 一个 ) 直接量
  • [ : 一个 [ 直接量
  • ] : 一个 ] 直接量
  • { : 一个 { 直接量
  • } : 一个 } 直接量
  • XXX : 由十进制数 XXX 指 定的ASCII码字符
  • Xnn : 由十六进制数 nn 指定的ASCII码字符
  • uxxxx :查找以十六进制数 xxxx 规定的 Unicode 字符。

修饰符:

  • i :执行对大小写不敏感的匹配。
  • g :执行全局匹配(查找所有匹配而非在找到第一个匹配后停止)。
  • m :执行多行匹配

执行方法:

stringObject.search(regexp),例如:

'0101后花园'.search(/0101/); //返回值为匹配到的字符串的位置索引,此例返回值为0

stringObject.match(regexp),例如:

'0101后花园'.match(/0101/g); //返回值为匹配到的字符串数组

regexp.exec(stringObject),例如:

/0101/g.exec('0101后花园'); //返回值为匹配到的字符串数组

stringObject.replace(regexp, ‘replacement’),例如

'0101后虎园'.replace(/0101/g, 'abab'); //返回值为替换之后的字符串,源字符串不更改

regexp.test(stringObject),例如:

/0101/g.test('0101后花园'); //返回值为布尔值true or false,常用于表单验证

stringObject.split(regexp),例如:

'0101后花园'.split(/0101/); //返回值为按regexp分割之后的数组

js正则表达式实现trim函数–去除字符串两端空格

1.js正则表达式去除字符串左端空格的正则表达式为:/(^\s*)/g

function trim_left(str) {
    return str.replace(/(^\s)/g, '');
}

2.js正则表达式去除字符串右端空格的正则表达式为:/(s\*$)/g

function trim_right(str) {
    return str.replace(/(\s*$)/g, '');
}

3.js正则表达式去除字符串两端空格的正则表达式:/(^\s*)|(\s*$)/g

function trim_all(str) {
    retrun str.replace(/(^\s*)|(\s*$)/g, '');
}