带批注的 x86 反汇编

以下部分以反汇编为例进行说明。

源代码

下面是待分析函数的代码。

HRESULT CUserView::CloseView(void)
{
    if (m_fDestroyed) return S_OK;

    BOOL fViewObjectChanged = FALSE;
    ReleaseAndNull(&m_pdtgt);

    if (m_psv) {
        m_psb->EnableModelessSB(FALSE);
        if(m_pws) m_pws->ViewReleased();

        IShellView* psv;

        HWND hwndCapture = GetCapture();
        if (hwndCapture && hwndCapture == m_hwnd) {
            SendMessage(m_hwnd, WM_CANCELMODE, 0, 0);
        }

        m_fHandsOff = TRUE;
        m_fRecursing = TRUE;
        NotifyClients(m_psv, NOTIFY_CLOSING);
        m_fRecursing = FALSE;

        m_psv->UIActivate(SVUIA_DEACTIVATE);

        psv = m_psv;
        m_psv = NULL;

        ReleaseAndNull(&_pctView);

        if (m_pvo) {
            IAdviseSink *pSink;
            if (SUCCEEDED(m_pvo->GetAdvise(NULL, NULL, &pSink)) && pSink) {
                if (pSink == (IAdviseSink *)this)
                    m_pvo->SetAdvise(0, 0, NULL);
                pSink->Release();
            }

            fViewObjectChanged = TRUE;
            ReleaseAndNull(&m_pvo);
        }

        if (psv) {
            psv->SaveViewState();
            psv->DestroyViewWindow();
            psv->Release();
        }

        m_hwndView = NULL;
        m_fHandsOff = FALSE;

        if (m_pcache) {
            GlobalFree(m_pcache);
            m_pcache = NULL;
        }

        m_psb->EnableModelessSB(TRUE);

        CancelPendingActions();
    }

    ReleaseAndNull(&_psf);

    if (fViewObjectChanged)
        NotifyViewClients(DVASPECT_CONTENT, -1);

    if (m_pszTitle) {
        LocalFree(m_pszTitle);
        m_pszTitle = NULL;
    }

    SetRect(&m_rcBounds, 0, 0, 0, 0);
    return S_OK;
}

汇编代码

本部分包含带批注的反汇编示例。

使用 ebp 寄存器作为帧指针的函数开始如下:

HRESULT CUserView::CloseView(void)
SAMPLE!CUserView__CloseView:
71517134 55               push    ebp
71517135 8bec             mov     ebp,esp

这会设置帧,使函数可以将其参数作为 ebp 的正偏移量进行访问,并将局部变量作为负偏移量进行访问。

这是专用 COM 接口上的一种方法,因此调用约定为 __stdcall。 这意味着参数从右向左推送(本例中没有参数),“this”指针被推送,然后函数被调用。 因此,在进入函数时,堆栈如下所示:

[esp+0] = return address
[esp+4] = this

执行上述两条指令之后,可按以下方式访问参数:

[ebp+0] = previous ebp pushed on stack
[ebp+4] = return address
[ebp+8] = this

对于使用 ebp 作为帧指针的函数,可在 [ebp+8] 访问第一个推送参数;后续参数可在连续更高的 DWORD 地址中访问。

71517137 51               push    ecx
71517138 51               push    ecx

此函数只需要两个局部堆栈变量,因此需要一个 sub esp,8 条指令。 然后,推送的值可用作 [ebp-4] 和 [ebp-8]。

对于使用 ebp 作为帧指针的函数,可通过 ebp 寄存器的负偏移量访问堆栈局部变量。

71517139 56               push    esi

现在,编译器将保存跨函数调用中需要保留的寄存器。 实际上,它是以零碎的形式保存,与实际代码的第一行交错。

7151713a 8b7508           mov     esi,[ebp+0x8]     ; esi = this
7151713d 57               push    edi               ; save another registers

碰巧的是,CloseView 是 ViewState 上的一个方法,该方法位于基础对象中的偏移量 12 处。 因此,this 是一个指向 ViewState 类的指针,尽管在可能与其他基类混淆时,它将被更仔细地指定为 (ViewState*) this

    if (m_fDestroyed)
7151713e 33ff             xor     edi,edi           ; edi = 0

将寄存器与其自身进行异或是将其归零的标准方法。

71517140 39beac000000     cmp     [esi+0xac],edi    ; this->m_fDestroyed == 0?
71517146 7407             jz      NotDestroyed (7151714f)  ; jump if equal

cmp 指令比较两个值(通过相减)。 如果 jz 指令检查的结果为零,表明两个比较值相等。

cmp 指令比较两个值:后续 j 指令会根据比较结果跳转。

    return S_OK;
71517148 33c0             xor     eax,eax           ; eax = 0 = S_OK
7151714a e972010000       jmp     ReturnNoEBX (715172c1) ; return, do not pop EBX

编译器将 EBX 寄存器延迟保存到函数的后面部分,因此,如果程序要在此测试中“提前退出”,则退出路径必须是不恢复 EBX 的路径。

    BOOL fViewObjectChanged = FALSE;
    ReleaseAndNull(&m_pdtgt);

这两行代码的执行是交错的,请注意。

NotDestroyed:
7151714f 8d86c0000000     lea     eax,[esi+0xc0]    ; eax = &m_pdtgt

lea 指令计算内存访问的效果地址,并将其存储在目标中。 实际内存地址未取消引用。

lea 指令采用变量的地址。

71517155 53               push    ebx

应在 EBX 寄存器损坏之前将其保存起来。

71517156 8b1d10195071     mov ebx,[_imp__ReleaseAndNull]

由于经常调用 ReleaseAndNull,因此最好在 EBX 中缓存其地址。

7151715c 50               push    eax               ; parameter to ReleaseAndNull
7151715d 897dfc           mov     [ebp-0x4],edi     ; fViewObjectChanged = FALSE
71517160 ffd3             call    ebx               ; call ReleaseAndNull
    if (m_psv) {
71517162 397e74           cmp     [esi+0x74],edi    ; this->m_psv == 0?
71517165 0f8411010000     je      No_Psv (7151727c) ; jump if zero

请记住,在回退一段时间后将 EDI 寄存器归零,EDI 是跨函数调用保留的寄存器(因此对 ReleaseAndNull 的调用没有更改它)。 因此,它的值仍为零,您可以用它来快速测试是否为零。

        m_psb->EnableModelessSB(FALSE);
7151716b 8b4638           mov     eax,[esi+0x38]    ; eax = this->m_psb
7151716e 57               push    edi               ; FALSE
7151716f 50               push    eax               ; "this" for callee
71517170 8b08             mov     ecx,[eax]         ; ecx = m_psb->lpVtbl
71517172 ff5124           call    [ecx+0x24]        ; __stdcall EnableModelessSB

上述模式是 COM 方法调用的指示符号。

COM 方法调用非常受欢迎,因此最好学会识别它们。 特别是,应该能够直接从其 Vtable 偏移量中识别出三个 IUnknown 方法:QueryInterface=0、AddRef=4 和 Release=8。

        if(m_pws) m_pws->ViewReleased();
71517175 8b8614010000     mov     eax,[esi+0x114]   ; eax = this->m_pws
7151717b 3bc7             cmp     eax,edi           ; eax == 0?
7151717d 7406             jz      NoWS (71517185) ; if so, then jump
7151717f 8b08             mov     ecx,[eax]         ; ecx = m_pws->lpVtbl
71517181 50               push    eax               ; "this" for callee
71517182 ff510c           call    [ecx+0xc]         ; __stdcall ViewReleased
NoWS:
        HWND hwndCapture = GetCapture();
71517185 ff15e01a5071    call [_imp__GetCapture]    ; call GetCapture

通过全局的间接调用是在 Microsoft Win32 中实现函数导入的方式。 加载程序修复了全局,以指向目标的实际地址。 这是在调查崩溃的机器时确定方位的便捷方法。 查找对导入函数和目标中的调用。 您通常会拥有一些导入的函数的名称,可用它来确定您在源代码中的位置。

        if (hwndCapture && hwndCapture == m_hwnd) {
            SendMessage(m_hwnd, WM_CANCELMODE, 0, 0);
        }
7151718b 3bc7             cmp     eax,edi           ; hwndCapture == 0?
7151718d 7412             jz      No_Capture (715171a1) ; jump if zero

函数返回值放置在 EAX 寄存器中。

7151718f 8b4e44           mov     ecx,[esi+0x44]    ; ecx = this->m_hwnd
71517192 3bc1             cmp     eax,ecx           ; hwndCapture = ecx?
71517194 750b             jnz     No_Capture (715171a1) ; jump if not

71517196 57               push    edi               ; 0
71517197 57               push    edi               ; 0
71517198 6a1f             push    0x1f              ; WM_CANCELMODE
7151719a 51               push    ecx               ; hwndCapture
7151719b ff1518195071     call    [_imp__SendMessageW] ; SendMessage
No_Capture:
        m_fHandsOff = TRUE;
        m_fRecursing = TRUE;
715171a1 66818e0c0100000180 or    word ptr [esi+0x10c],0x8001 ; set both flags at once

        NotifyClients(m_psv, NOTIFY_CLOSING);
715171aa 8b4e20           mov     ecx,[esi+0x20]    ; ecx = (CNotifySource*)this.vtbl
715171ad 6a04             push    0x4               ; NOTIFY_CLOSING
715171af 8d4620           lea     eax,[esi+0x20]    ; eax = (CNotifySource*)this
715171b2 ff7674           push    [esi+0x74]        ; m_psv
715171b5 50               push    eax               ; "this" for callee
715171b6 ff510c           call    [ecx+0xc]         ; __stdcall NotifyClients

请注意,当在与自己的的基类不同的基类上调用方法时,必须更改“this”指针。

        m_fRecursing = FALSE;
715171b9 80a60d0100007f   and     byte ptr [esi+0x10d],0x7f
        m_psv->UIActivate(SVUIA_DEACTIVATE);
715171c0 8b4674           mov     eax,[esi+0x74]    ; eax = m_psv
715171c3 57               push    edi               ; SVUIA_DEACTIVATE = 0
715171c4 50               push    eax               ; "this" for callee
715171c5 8b08             mov     ecx,[eax]         ; ecx = vtbl
715171c7 ff511c           call    [ecx+0x1c]        ; __stdcall UIActivate
        psv = m_psv;
        m_psv = NULL;
715171ca 8b4674           mov     eax,[esi+0x74]    ; eax = m_psv
715171cd 897e74           mov     [esi+0x74],edi    ; m_psv = NULL
715171d0 8945f8           mov     [ebp-0x8],eax     ; psv = eax

第一个局部变量是 psv

        ReleaseAndNull(&_pctView);
715171d3 8d466c           lea     eax,[esi+0x6c]    ; eax = &_pctView
715171d6 50               push    eax               ; parameter
715171d7 ffd3             call    ebx               ; call ReleaseAndNull
        if (m_pvo) {
715171d9 8b86a8000000     mov     eax,[esi+0xa8]    ; eax = m_pvo
715171df 8dbea8000000     lea     edi,[esi+0xa8]    ; edi = &m_pvo
715171e5 85c0             test    eax,eax           ; eax == 0?
715171e7 7448             jz      No_Pvo (71517231) ; jump if zero

请注意,编译器推测性地准备了 m_pvo 成员的地址,因为您将在一段时间内经常使用它。 因此,使用方便的地址将导致代码更小。

            if (SUCCEEDED(m_pvo->GetAdvise(NULL, NULL, &pSink)) && pSink) {
715171e9 8b08             mov     ecx,[eax]         ; ecx = m_pvo->lpVtbl
715171eb 8d5508           lea     edx,[ebp+0x8]     ; edx = &pSink
715171ee 52               push    edx               ; parameter
715171ef 6a00             push    0x0               ; NULL
715171f1 6a00             push    0x0               ; NULL
715171f3 50               push    eax               ; "this" for callee
715171f4 ff5120           call    [ecx+0x20]        ; __stdcall GetAdvise
715171f7 85c0             test    eax,eax           ; test bits of eax
715171f9 7c2c             jl      No_Advise (71517227) ; jump if less than zero
715171fb 33c9             xor     ecx,ecx           ; ecx = 0
715171fd 394d08           cmp     [ebp+0x8],ecx     ; _pSink == ecx?
71517200 7425             jz      No_Advise (71517227)

请注意,编译器认为传入的“this”参数不是必需的(因为它很久以前就将其藏在 ESI 寄存器中)。 因此,它将内存作为局部变量 pSink 重复使用。

如果函数使用 EBP 帧,则传入的参数将到达 EBP 的正偏移量,而局部变量放置在负偏移量处。 但是,在这种情况下,编译器可以自由重复使用该内存用于任何目的。

如果仔细观察,您会发现编译器可以更好地优化此代码。 它可能会延迟 lea edi、[esi+0xa8] 指令到两个 push 0x0 指令之后,将其替换为 push edi。 这会保存 2 个字节。

                if (pSink == (IAdviseSink *)this)

接下来的几行是为了弥补 C++ 中 (IAdviseSink *) NULL 必须为 NULL 这一事实。 因此,如果“this”确实为“(ViewState*)NULL”,则转换的结果应为 NULL ,而不是 IAdviseSink 和 IBrowserService 之间的距离。

71517202 8d46ec           lea     eax,[esi-0x14]    ; eax = -(IAdviseSink*)this
71517205 8d5614           lea     edx,[esi+0x14]    ; edx = (IAdviseSink*)this
71517208 f7d8             neg     eax               ; eax = -eax (sets carry if != 0)
7151720a 1bc0             sbb     eax,eax           ; eax = eax - eax - carry
7151720c 23c2             and     eax,edx           ; eax = NULL or edx

尽管 Pentum 有条件移动指令,但基本 i386 体系结构没有,因此编译器使用特定技术来模拟条件移动指令,而无需进行任何跳转。

条件评估的一般模式如下:

        neg     r
        sbb     r, r
        and     r, (val1 - val2)
        add     r, val2

如果 r 为非零,则 neg r 会设置进位标志,因为 neg 通过从零减去来否定值。 如果减去非零值,则从零减去时将产生借位(设置进位)。 它还会损害 r 寄存器中的值,但这是可以接受的,因为无论如何都要覆盖它。

接下来,sbb r、r 指令从自身中减去一个值,结果总是为零。 但是,它也会减去进位(借位)位,因此最终结果是将 r 设置为零或 -1,具体取决于进位是清除还是设置。

因此,如果 r 的原始值为零,则 sbb r、rr 设置为零,如果原始值为非零,则设置为 -1。

第三个指令执行掩码。 由于 r 寄存器为零或 -1,因此“this”用于保留 r 零或将 r 从 -1 更改为 (val1 - val1),因为将任何值与 -1 进行“与”运算都会都保留原始值。

因此,如果 r 的原始值为零,则“and r, (val1 - val1)”的结果是将 r 设置为零;如果 r 的原始值为非零,则设置为“(val1 - val2)”。

最后,将 val2 添加到 r,导致 val2(val1 - val2) + val2 = val1

因此,此系列指令的最终结果是,如果它最初为零,则将 r设置为 val2;如果它是非零,则设置为 val1。 这是 r = r ? val1 : val2 的程序集等效项。

在此特定实例中,可以看到 val2 = 0val1 = (IAdviseSink*)this。 (请注意,编译器已执行最终 add eax, 0 指令,因为它不起作用。)

7151720e 394508           cmp     [ebp+0x8],eax ; pSink == (IAdviseSink*)this?
71517211 750b             jnz     No_SetAdvise (7151721e) ; jump if not equal

在本章节的前面部分,将 EDI 设置为 m_pvo 成员的地址。 现在您将使用它。 前面还清除了 ECX 寄存器。

                    m_pvo->SetAdvise(0, 0, NULL);
71517213 8b07             mov     eax,[edi]         ; eax = m_pvo
71517215 51               push    ecx               ; NULL
71517216 51               push    ecx               ; 0
71517217 51               push    ecx               ; 0
71517218 8b10             mov     edx,[eax]         ; edx = m_pvo->lpVtbl
7151721a 50               push    eax               ; "this" for callee
7151721b ff521c           call    [edx+0x1c]        ; __stdcall SetAdvise
No_SetAdvise:
                pSink->Release();
7151721e 8b4508           mov     eax,[ebp+0x8]     ; eax = pSink
71517221 50               push    eax               ; "this" for callee
71517222 8b08             mov     ecx,[eax]         ; ecx = pSink->lpVtbl
71517224 ff5108           call    [ecx+0x8]         ; __stdcall Release
No_Advise:

所有这些 COM 方法调用都应非常熟悉。

接下来两个语句的计算是交错的。 不要忘记 EBX 包含 ReleaseAndNull 的地址。

            fViewObjectChanged = TRUE;
            ReleaseAndNull(&m_pvo);
71517227 57               push    edi               ; &m_pvo
71517228 c745fc01000000   mov     dword ptr [ebp-0x4],0x1 ; fViewObjectChanged = TRUE
7151722f ffd3             call    ebx               ; call ReleaseAndNull
No_Pvo:
        if (psv) {
71517231 8b7df8           mov     edi,[ebp-0x8]     ; edi = psv
71517234 85ff             test    edi,edi           ; edi == 0?
71517236 7412             jz      No_Psv2 (7151724a) ; jump if zero
            psv->SaveViewState();
71517238 8b07             mov     eax,[edi]         ; eax = psv->lpVtbl
7151723a 57               push    edi               ; "this" for callee
7151723b ff5034           call    [eax+0x34]        ; __stdcall SaveViewState

以下是更多的 COM 方法调用。

            psv->DestroyViewWindow();
7151723e 8b07             mov     eax,[edi]         ; eax = psv->lpVtbl
71517240 57               push    edi               ; "this" for callee
71517241 ff5028           call    [eax+0x28]        ; __stdcall DestroyViewWindow
            psv->Release();
71517244 8b07             mov     eax,[edi]         ; eax = psv->lpVtbl
71517246 57               push    edi               ; "this" for callee
71517247 ff5008           call    [eax+0x8]         ; __stdcall Release
No_Psv2:
        m_hwndView = NULL;
7151724a 83667c00         and     dword ptr [esi+0x7c],0x0 ; m_hwndView = 0

将内存位置与零进行“与”运算等于将其设置为零,因为任何“与”零都是零。 编译器使用此形式时因为,即使它速度较慢,但它比等效的 mov 指令要短得多。 (此代码已针对大小而不是速度进行优化。)

        m_fHandsOff = FALSE;
7151724e 83a60c010000fe   and     dword ptr [esi+0x10c],0xfe
        if (m_pcache) {
71517255 8b4670           mov     eax,[esi+0x70]    ; eax = m_pcache
71517258 85c0             test    eax,eax           ; eax == 0?
7151725a 740b             jz      No_Cache (71517267) ; jump if zero
            GlobalFree(m_pcache);
7151725c 50               push    eax               ; m_pcache
7151725d ff15b4135071     call    [_imp__GlobalFree]    ; call GlobalFree
            m_pcache = NULL;
71517263 83667000         and     dword ptr [esi+0x70],0x0 ; m_pcache = 0
No_Cache:
        m_psb->EnableModelessSB(TRUE);
71517267 8b4638           mov     eax,[esi+0x38]    ; eax = this->m_psb
7151726a 6a01             push    0x1               ; TRUE
7151726c 50               push    eax               ; "this" for callee
7151726d 8b08             mov     ecx,[eax]         ; ecx = m_psb->lpVtbl
7151726f ff5124           call    [ecx+0x24]        ; __stdcall EnableModelessSB
        CancelPendingActions();

若要调用 CancelPendingActions,必须从 (ViewState*)this 移动到 (CUserView*)this。 另请注意,CancelPendingActions 使用 __thiscall 调用约定,而不是 __stdcall。 根据 __thiscall,“this”指针在 ECX 寄存器中传递,而不是在堆栈上传递。

71517272 8d4eec           lea     ecx,[esi-0x14]    ; ecx = (CUserView*)this
71517275 e832fbffff       call CUserView::CancelPendingActions (71516dac) ; __thiscall
    ReleaseAndNull(&_psf);
7151727a 33ff             xor     edi,edi           ; edi = 0 (for later)
No_Psv:
7151727c 8d4678           lea     eax,[esi+0x78]    ; eax = &_psf
7151727f 50               push    eax               ; parameter
71517280 ffd3             call    ebx               ; call ReleaseAndNull
    if (fViewObjectChanged)
71517282 397dfc           cmp     [ebp-0x4],edi     ; fViewObjectChanged == 0?
71517285 740d             jz      NoNotifyViewClients (71517294) ; jump if zero
       NotifyViewClients(DVASPECT_CONTENT, -1);
71517287 8b46ec           mov     eax,[esi-0x14]    ; eax = ((CUserView*)this)->lpVtbl
7151728a 8d4eec           lea     ecx,[esi-0x14]    ; ecx = (CUserView*)this
7151728d 6aff             push    0xff              ; -1
7151728f 6a01             push    0x1               ; DVASPECT_CONTENT = 1
71517291 ff5024           call    [eax+0x24]        ; __thiscall NotifyViewClients
NoNotifyViewClients:
    if (m_pszTitle)
71517294 8b8680000000     mov     eax,[esi+0x80]    ; eax = m_pszTitle
7151729a 8d9e80000000     lea     ebx,[esi+0x80]    ; ebx = &m_pszTitle (for later)
715172a0 3bc7             cmp     eax,edi           ; eax == 0?
715172a2 7409             jz      No_Title (715172ad) ; jump if zero
        LocalFree(m_pszTitle);
715172a4 50               push    eax               ; m_pszTitle
715172a5 ff1538125071     call   [_imp__LocalFree]
        m_pszTitle = NULL;

请记住,EDI 仍然为零,EBX 仍为 &m_pszTitle,因为这些寄存器由函数调用保留。

715172ab 893b             mov     [ebx],edi         ; m_pszTitle = 0
No_Title:
    SetRect(&m_rcBounds, 0, 0, 0, 0);
715172ad 57               push    edi               ; 0
715172ae 57               push    edi               ; 0
715172af 57               push    edi               ; 0
715172b0 81c6fc000000     add     esi,0xfc          ; esi = &this->m_rcBounds
715172b6 57               push    edi               ; 0
715172b7 56               push    esi               ; &m_rcBounds
715172b8 ff15e41a5071     call   [_imp__SetRect]

请注意,您不再需要“this”的值,因此编译器使用 添加 指令来就地修改它,而不是使用另一个寄存器来保存地址。 这实际上是 Pentium u/v 管道带来的性能优势,因为 V 管道可以进行算术运算,但不能进行地址计算。

    return S_OK;
715172be 33c0             xor     eax,eax           ; eax = S_OK

最后,还原需要保留的寄存器、清理堆栈并返回到调用方,删除传入的参数。

715172c0 5b               pop     ebx               ; restore
ReturnNoEBX:
715172c1 5f               pop     edi               ; restore
715172c2 5e               pop     esi               ; restore
715172c3 c9               leave                     ; restores EBP and ESP simultaneously
715172c4 c20400           ret     0x4               ; return and clear parameters