javascript 正则提取页面中的变量值

文章目录

    有的网页为了防止 tampermonkey 这类插件读取页面中的 js 变量,把变量写到了匿名自调用函数 self-invocation 中,例如

    <script type="text/javascript">
    (function() {
      var a = 1;
      console.log(a);
    })();
    </script>
    

    而我为了某些不可告人的目的必须读取到变量 a 的值。

    一种有效的方式是,使用 ajax 获取当前页面的源代码,然后正则匹配中某个指定变量的值。

    正则匹配

    var s = 'var name = "hahahaha"';
    var s = 'var name = "hahahaha";';
    
    s.match(/var \w+ = (.+);/);
    0: "var name = "hahahaha";"
    1: ""hahahaha""
    
    var s = 'var name = "hahahaha"; var age = 10;';
    s.match(/var \w+ = (.+);/);
    0: "var name = "hahahaha"; var age = 10;"
    1: ""hahahaha"; var age = 10"
    
    // 避免贪婪匹配
    s.match(/var \w+ = (.+?);/);
    0: "var name = "hahahaha";"
    1: ""hahahaha""
    
    s.match(/var age = (.+?);/);
    0: "var age = 10;"
    1: "10"
    

    避免贪婪匹配

    *  - zero or more
    *? - zero or more (non-greedy)
    +  - one or more
    +? - one or more (non-greedy)
    ?  - zero or one
    ?? - zero or one (non-greedy)
    

    漏洞

    使用分号 “;” 来判断一个变量的结束,实际上是不严谨的。

    举个例子,如果一个变量的内容是一个字符串,字符串中包含分号,那这个一定会出错。

    关于作者 🌱

    我是来自山东烟台的一名开发者,有感兴趣的话题,或者软件开发需求,欢迎加微信 zhongwei 聊聊,或者关注我的个人公众号“大象工具”, 查看更多联系方式