千家信息网

如何分析微软照片应用图像编码器漏洞CVE-2020-17113

发表于:2025-01-20 作者:千家信息网编辑
千家信息网最后更新 2025年01月20日,如何分析微软照片应用图像编码器漏洞CVE-2020-17113,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。笔者将分析同一个库中的漏
千家信息网最后更新 2025年01月20日如何分析微软照片应用图像编码器漏洞CVE-2020-17113

如何分析微软照片应用图像编码器漏洞CVE-2020-17113,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

笔者将分析同一个库中的漏洞(CVE-2020-17113),以期加深对WindowsCodecsRaw 库的理解。

根据MSRC 和漏洞发现者公开的信息,Windows Imaging Component 解码TIFF格式图片时,在解析原始数据 (GetNameWhiteBalances) 的过程中触发该漏洞。(TIFF格式 参见维*基*百科相关内容)。本文将基于对TIFF格式的了解并结合POC格式解析展开分析,供读者参考。

0x00 漏洞验证

1. 在Win10 1903 x64系统上,使用gflags工具为图片app开启页堆,双击图片文件打开(图片默认应用为照片App)。一段时间后,App退出进程。

2. 使用Windbg附加照片App(Windbg 调试UWP方法详见微软文档),敲击g运行程序。一段时间后,进程崩溃。如下图所示:

结合访问违例的指令和内存分配的结果,可以得出如下结论:访问违例的原因是,在大小为0x10字节的内存区域中读取偏移为0x30的数据,因此它是一个越界读的漏洞。

0x01 漏洞分析

首先使用ida pro 加载崩溃dll,定位到崩溃点,分析函数代码。

函数声明如下:

__int64 __fastcall CCanonRawImageRep::GetNamedWhiteBalances(CCanonG12ImageRep *a1, __int64 a2)

结合对传入参数类型的分析,通过自行构造结构体以及虚表定位,给出注释如下:

函数伪代码如下:

CTag * tag = a1->GetTags();vector vec = {0, 1, 2, 3, 4, 5,……};tag_data = tag->GetTagdata();for (int i = 0; i < 10; ++i){if (vec[i] < tag->GetTagCount()){dword *addr = tag_data + 48 * vec[i];dword v26 = *(addr);word v13 = *(word*)(addr+4);expressions;...}...expressions;}

在这段代码中,如果 tag_data 数据块的长度小于 vec 向量前10个成员中最大值的48倍,就有可能产生越界读。在实际调试代码时,可以看到,这个 tag_data 确实只有16个字节。

所以,当照片App加载这个图片时,会产生越界读的访问违例。

0x02 关于POC文件

漏洞触发的原因,不难理解。但问题是,这个文件为什么能产生这样一个错误的IFD_Tag 结构呢?还是要从"照片" App解析POC文件的过程入手。

关于解析过程的调试,过程比较繁复,这里就不做赘述了。下面仅根据文件格式规范,总结一下这个文件表现出的一些有趣现象。

文件内容如下图:

熟悉图片格式的读者可以发现,这个文件是一个嵌入Exif 信息块的tiff格式。

为方便不熟悉tiff格式的读者阅读,简单说一下TIFF格式的结构。TIFF ,即"标签图像文件格式",是一种利用标签字段对图像的尺寸,色彩空间等进行规范的文件信息。同时它具有很好的可扩展性,厂商可以根据自己的需求设计"自定义标签",或者"私有标签",以便于存储个性化的信息,丰富图片内容(详细信息可以查看TIFF FAQ. https://www.awaresystems.be/imaging/tiff/faq.html)。

便于读者理解,笔者将结合poc图片内容说明几种重要的数据结构。

2.1 头部

TIff头部数据结构,如下所示:

  • 前两个字节指定文件字节序,"II"为 小端 "MM" 为大端;

  • 3-4字节是magic值,永远为0x2A,字节序由前两个字节指定;

  • 5-8 字节指定第一个IFD 的偏移,为非负值,不能超过4G(32位地址空间,无符号整数,bigtiff的信息这里暂且不表)。

2.2 IFD

IFD即为图像文件目录,每一个IFD 都记录一页图片内容的属性和数据(也会记录subifd,以及其他信息),格式如下:

如上表所示,每一个IFD结构都由3部分组成:

  • ifd_size:2 字节,指定该IFD中tag的数量

  • tag_array:ifd_size *12个字节,一个由tag组成的列表,指定图片的各种属性值

  • next_ifd:4个字节,指定下一个IFD结构的偏移,如果没有下一个IFD 值为0。

2.3 TAG

tag 结构如下:

tag结构由四部分组成:

  • tag_id:2 字节,指定该 tag 描述的对象的ID;

  • tag_type:2 字节,指定 tag_value 的数据类型;

  • tag_cnt :4 字节 指定 tag_value 值的数量;

  • tag_value(tag_value_offset): 如果 tag_value 值的大小不超过4字节,表示 tag_value,否则该字段指向 tag_value 在文件的偏移。

以上是TIFF格式几种重要数据结构的简单描述,详细信息请自行查阅资料。

2.4 值得注意的几个tag_id

除了TIFF 基本的IFD tag外,有几个需要说一下的TAG_ID:

值得注意的是,上面几个 IFD_Tag 出现时,表示文件中会产生嵌套格式的IFD。

2.5 关于poc文件的IFD结构

如前文中010Editor模板对poc文件的解析结果所示,名义上,因为第一个IFD结构的 next_ifd_offset 不为0,所以这个图片至少有两页。

但是,偏移0x2232开始的内容则表明这段数据是一个无效的IFD结构,所以在解析ifd时会因为数据不符合结构规范,退出解析函数。

在实际调试过程中,笔者通过逆向图像编码库并设置断点,记录了"照片"App对poc文件的解析过程。解析的ifd tag 结构,部分输出如下:

bu windowscodecsraw+023D3A1 "r $t1 = poi(rsi+28) ; .echo tag is:; dd rbp-cc l1; .printf \"offset is %x\", @$t1; .echo \n; gc"

可以看到,偏移0xc6处的tag 值为0x8769,也就是前文提到的Exif IFD,所以"照片" App会继续解析。显然,这个poc文件是经过变异的,调试过程相比于解析正常的TIFF格式要复杂一些,这里不做赘述。

下表为"照片"app 解析poc文件时,解析得出的所有"IFD"结构信息。

笔者并不能根据现有的文件逆向推导poc原文件到底是什么。然而,正是变异导致整个TIFF文件出现了解码器不能识别的错误,tag标签被错误解析,从而导致在处理白平衡时,对象解析出错,进而引发越界读的访问违例。

因为被错误解析而导致访问违例的ifd_tag结构,如下所示:

0x03 小结

得益于良好的可扩展性和强大的适应性,Tiff 广泛适用于各种生产环境。笔者通过本次漏洞分析发现了此前在研究 tiff 格式时忽略的一些信息,同时,也获得了挖掘Tiff格式漏洞的一点新思路。读者如能从本文获得同样的启发,则实现了笔者的分享价值。

关于如何分析微软照片应用图像编码器漏洞CVE-2020-17113问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注行业资讯频道了解更多相关知识。

0