IDAPython获取函数参数个数 - scz

admin 2022-11-03 PM 2106℃ 0条

目录:

☆ 背景介绍
☆ idaapi.decompile
☆ FLARE IDA Decompiler Library (FIDL)

1) 安装FIDL
2) 用FIDL获取函数参数个数
3) FIDL对idaapi.decompile的封装

☆ 后记
☆ 参考资源
☆ 背景介绍

起因是在IDA中快速识别静态链接的OpenSSL库函数SSL_read、SSL_write,有很多搞法。参看

《IoT设备逆向工程中的函数识别》
http://scz.617.cn:8/misc/201905081756.txt
就此次原始需求而言,上文中各方案显得重型。bluerust用了一种轻型方案,基于特征字符串交叉引用定位多个函数,根据函数特征过滤出最终结果,这是逆向工程常见动作。函数特征包含但不限于对指定地址的交叉引用计数,call指令计数、block计数、参数个数等等。我卡在IDAPython获取函数参数个数这个问题上。

☆ idaapi.decompile

uid(5162883301)、uid(3907374211)指出可以借助idaapi.decompile获取函数参数个数,uid(7483708707)在后台直接给我下列完整实现。

IDASDK77\include\typeinf.hpp

dos2unix CC_Map.txt

awk -F' ' '{printf("%8s : \"%s\",\n",tolower($3),$1);}' CC_Map.txt

CC_Map = \
{

0x00 : "CM_CC_INVALID",
0x10 : "CM_CC_UNKNOWN",
0x20 : "CM_CC_VOIDARG",
0x30 : "CM_CC_CDECL",
0x40 : "CM_CC_ELLIPSIS",
0x50 : "CM_CC_STDCALL",
0x60 : "CM_CC_PASCAL",
0x70 : "CM_CC_FASTCALL",
0x80 : "CM_CC_THISCALL",
0x90 : "CM_CC_MANUAL",
0xa0 : "CM_CC_SPOILED",
0xb0 : "CM_CC_GOLANG",
0xc0 : "CM_CC_RESERVE3",
0xd0 : "CM_CC_SPECIALE",
0xe0 : "CM_CC_SPECIALP",
0xf0 : "CM_CC_SPECIAL"

}

from uid(7483708707)

generate_func_info( idc.here() )

def generate_func_info ( ea ) :

func                = idaapi.get_func( ea )
cfunc               = idaapi.decompile( func )
#
# 这两步有替代方案
#
func_type           = idaapi.tinfo_t()
cfunc.get_func_type( func_type )
#
# IDASDK77\include\typeinf.hpp
#
nargs               = func_type.get_nargs()
arg_list            = []
for i in range( nargs ) :
    arg_list.append( str( func_type.get_nth_arg(i) ) )
rettype             = str( func_type.get_rettype() )
fi                  = idaapi.func_type_data_t()
func_type.get_func_details( fi )
func_info           = {}
func_info['args']   = arg_list
func_info['ret']    = rettype
func_info['cc']     = CC_Map[fi.cc]
func_info['name']   = idc.get_func_name( ea )
return func_info

end of generate_func_info

generate_func_info_1( idc.here() )

def generate_func_info_1 ( ea ) :

func                = idaapi.get_func( ea )
cfunc               = idaapi.decompile( func )
nargs               = cfunc.type.get_nargs()
arg_list            = []
for i in range( nargs ) :
    arg_list.append( str( cfunc.type.get_nth_arg(i) ) )
rettype             = str( cfunc.type.get_rettype() )
fi                  = idaapi.func_type_data_t()
cfunc.type.get_func_details( fi )
func_info           = {}
func_info['args']   = arg_list
func_info['ret']    = rettype
func_info['cc']     = CC_Map[fi.cc]
func_info['name']   = idc.get_func_name( ea )
return func_info

end of generate_func_info_1

bluerust指出,对idc.get_type(idc.here())的返回值进行字符串解析也能得到一些信息,形如

'__int64 __fastcall(__int64, void *, int)'
显然idaapi.decompile更优雅,此处有其详解

IDAPython CTREE
https://gist.github.com/icecr4ck/9dea9d1de052f0b2b417abf0046cc0f6
generate_func_info_2与generate_func_info本质相同,取函数参数的办法略有不同,用到了cfunc.argidx,uid(3907374211)也提到这个点。

generate_func_info_2( idc.here() )

def generate_func_info_2 ( ea ) :

func                = idaapi.get_func( ea )
cfunc               = idaapi.decompile( func )
lvars               = cfunc.get_lvars()
arg_list            = []
for i in cfunc.argidx :
    tinfo   = lvars[i].type()
    arg_list.append( tinfo )
rettype             = cfunc.type.get_rettype()
fi                  = idaapi.func_type_data_t()
cfunc.type.get_func_details( fi )
func_info           = {}
func_info['args']   = arg_list
func_info['ret']    = rettype
func_info['cc']     = CC_Map[fi.cc]
func_info['name']   = idc.get_func_name( ea )
return func_info

end of generate_func_info_2

☆ FLARE IDA Decompiler Library (FIDL)

uid(5162883301)、bluerust分别提及FIDL的实现,我没用过这个IDA插件,简单测试之。

1) 安装FIDL

参看

《Portable Python》
http://scz.617.cn:8/python/202011191444.txt

《Portable IDA+IDAPython》
http://scz.617.cn:8/python/202011182246.txt

https://fidl.readthedocs.io/en/latest/installation.html
测试环境是"Portable Python + Portable IDA",FIDL严重依赖IDA,不想安装到"Portable Python"中,只想在"Portable IDA"环境中使用FIDL。

git clone https://github.com/mandiant/FIDL.git FIDL
cd /d X:\work\FIDL
X:\temp\Python39\python.exe -m pip install .
"X:\temp\Python39"源自"X:\Green\Python\portable\Python39",此外还复制了一份"X:\temp\Python39_"。安装完FIDL,用BC进行目录比较,找出实际改动:

X:\temp\Python39\
share\

doc\
  networkx-2.8.8\

Lib\

site-packages\
  FIDL\
  FIDL-1.3.dist-info\
  networkx\
  networkx-2.8.8.dist-info\
  six-1.16.0.dist-info\
  six.py

share目录下是文档,不需要;将"X:\temp\Python39\Lib\site-packages\"下的几项复制到"X:\Green\IDA\Lib\site-packages\"即可。此外,FIDL依赖bz2模块,需要复制_bz2.pyd到IDA目录。

X:\temp\Python39_bz2.pyd
X:\Green\IDA_bz2.pyd

2) 用FIDL获取函数参数个数

在IDA的Python提示符中测试如下命令

import FIDL.decompiler_utils as fdu
c = fdu.controlFlowinator( ea=idc.here(), fast=False )
dir(c)
c.args
len(c.args)
dir(c.args[0])
type(c.args[0].ti)
c.args[0]
c.args[0].name
c.args[0].type_name
c.args[0].size
3) FIDL对idaapi.decompile的封装

参看

https://github.com/mandiant/FIDL/blob/master/FIDL/decompiler_utils.py
就此次原始需求而言,主要查看这些类与函数

class controlFlowinator
def my_decompile
def get_function_vars
def get_return_type
由于uid(7483708707)珠玉在前,很容易看懂FIDL如何封装idaapi.decompile的,但说实话,无基础时直接看FIDL实现,这些封装没那么浅显易懂。

☆ 后记

非常感谢uid(7483708707)提供具体实现,bluerust看过其实现后大加赞赏,同时感谢uid(5162883301)、uid(3907374211)提供靠谱思路。此番微博请教技术问题,得到的全部是有效回复,实属罕见,真地是曲指可数的几次之一。

bluerust作为湾区人形蜘蛛Top 10,爬到了[2],与IDAPython有交集的逆向工程人员,不妨遍历之。事后与bluerust复盘时,有一段对话

scz: 哦,我想起来了,我应该直接召唤hume的!
brt: 我本来想说,这事情,天下没有比hume更强的
brt: 说来惭愧,从没遍历过IDA SDK文档
scz: hume干过
scz: 超级老司机
brt: 还是我勤奋不足!
scz: 是你精力发散
brt: 那可不,朝廷美女事事关心

☆ 参考资源

(略,见TXT)

标签: none

非特殊说明,本博所有文章均为博主原创。

评论啦~