javascript 正则提取页面中的变量值

更新日期: 2019-07-07 阅读次数: 10404 字数: 312 分类: Javascript

有的网页为了防止 tampermonkey 这类插件读取页面中的 js 变量,把变量写到了匿名自调用函数 self-invocation 中,例如

<script type="text/javascript">
(function() {
  var a = 1;
  console.log(a);
})();
</script>

而我为了某些不可告人的目的必须读取到变量 a 的值。

一种有效的方式是,使用 ajax 获取当前页面的源代码,然后正则匹配中某个指定变量的值。

正则匹配

var s = 'var name = "hahahaha"';
var s = 'var name = "hahahaha";';

s.match(/var \w+ = (.+);/);
0: "var name = "hahahaha";"
1: ""hahahaha""

var s = 'var name = "hahahaha"; var age = 10;';
s.match(/var \w+ = (.+);/);
0: "var name = "hahahaha"; var age = 10;"
1: ""hahahaha"; var age = 10"

// 避免贪婪匹配
s.match(/var \w+ = (.+?);/);
0: "var name = "hahahaha";"
1: ""hahahaha""

s.match(/var age = (.+?);/);
0: "var age = 10;"
1: "10"

避免贪婪匹配

*  - zero or more
*? - zero or more (non-greedy)
+  - one or more
+? - one or more (non-greedy)
?  - zero or one
?? - zero or one (non-greedy)

漏洞

使用分号 “;” 来判断一个变量的结束,实际上是不严谨的。

举个例子,如果一个变量的内容是一个字符串,字符串中包含分号,那这个一定会出错。

关于作者 🌱

我是来自山东烟台的一名开发者,有敢兴趣的话题,或者软件开发需求,欢迎加微信 zhongwei 聊聊, 查看更多联系方式