python 里面一个常见的陷阱就是函数的默认参数问题。如下:
def func(mylist = []): mylist.append(1) return mylist
以下的执行结果如下:
print func() print func() print func() print func(['a']) print func()
结果如下:
[1] [1, 1] [1, 1, 1] ['a', 1] [1, 1, 1, 1]
如此结果, 前面三个可以看出 如果没有指定参数的话, 每次调用函数时候, 调用的mylist 是同一个对象。这是因为函数的默认参数,是在代码编译成PyCodeObject的时候, 就已经创建了对象指针,并且存在该函数的func_default内。 以后在代码运行,调用函数的时候,如果没有指定参数的话, 每次调用的话, 该参数变量都是代码编译阶段的变量指针所指定的对象。
print func.func_default
此时结果就是:
([1, 1, 1, 1], )
默认参数分为两种情况:
默认参数值是不可变对象
此时函数的 func_default 一直指向该不变对象, 如果函数内部修改了该变量, 那么该默认参数会指向一个新的不可变对象.
不过func_default 不变。 而每次调用函数都是读取func_default, 因此每次执行都一样。
In [30]: def func2(var = 1): ....: var += 1 ....: return var ....: In [31]: func2() Out[31]: 2 In [32]: func2() Out[32]: 2 In [34]: func2.func_defaults Out[34]: (1,)
默认参数是可变对象,比如 list, dict, class等
这种情况下,如果在函数内修改了指针所指的对象(并未创建新的对象), 那么 func_default 就会改变。这正是开始的mylist发生变化的原因。看下面的例子,:
In [35]: def func(mylist = []): ....: mylist = [] #这里 创建了新的对象, mylist.append(1) return mylist In [44]: func() Out[44]: [1] In [45]: func.func_defaults Out[45]: ([],)
由于创建了对象, mylist 只是作为一个 新建对象的别名存在, 后面在修改已经与 func_default 无关了。
默认参数的一个应用
先看下面的一个经典的例子:
def outer(): res = [] for i in range(4): def inner(j): return j * i res.append(inner) return res print [m(2) for m in outer()]
#简略版本:
def multipliers(): return [lambda x : i * x for i in range(4)] print [m(2) for m in multipliers()]
结果是 [6, 6, 6, 6] , 而不是 [0, 2, 4, 6], 原因就是闭包的延迟绑定。另外函数绑定的是变量而不是绑定数值。当循环结束了,i的值已经是3, 此时结果都是6. 一个解决方法便是,使用默认参数绑定数值。如下改动:
def outer(): res = [] for i in range(4): def inner(j, i = i): return j * i res.append(inner) return res print [m(2) for m in outer()]
#简略版本:
def multipliers(): return [lambda x, i = i : i * x for i in range(4)] print [m(2) for m in multipliers()]
这样的话, 利用默认参数在代码编译的时候,便把参数写到函数的func_default中, 就可以绑定0,1,2,3了。结果自然就是
[0, 2, 4, 6]
这就是默认参数的一个应用。
上述还有一个生成器修改的方式
def multipliers(): return (lambda x, i = i : i * x for i in range(4)) #修改成生成器 print [m(2) for m in multipliers()]