什么是闭包

我们可以将闭包理解为一个函数引用了它所在词法作用域的变量之后形成的一种数据结构. 词法作用域,就是定义一个函数时,对它可见的作用域,又叫做环境,是由多个作用域组成的栈.举个例子:

def user_required(user):
    def decorator(fn):
        def wrapper(*args, **kwargs):
            if current_user == user:
                return fn(*args, **kwargs)
            else:
                return no_permission_response
        return wrapper
    return decorator

这个函数是一个装饰器,对函数fn进行装饰后,就只有特定类型的user可以调用fn,否则返回no_pemission_response.

这里,wrapper的词法作用域就是由decorator形成的部分作用域,user_required的部分作用域以及外面的全局作用域组成,总之就是wrapper能访问的部分,也可以称之为wrapper所处的环境.

当一个函数引用了它所处环境的变量的时候,比如这里wrapper引用了环境里的fn和user,这个函数就形成了一个闭包,这个时候函数就不再是一个与外界环境无关的函数,而是会因为外界环境改变而改变的函数,引用的环境变量称为自由变量.

闭包与作用域

注意形成闭包的时候闭包保存的是当前的环境,而不是自由变量在此刻的值,因此不管自由变量是值语义还是引用语义,闭包在执行的时候都会从保存的环境中获取它们当前的值.举个经常被提起的例子:

def gen_fns():
    return [lambda: x for x in xrange(5)]
print [fn() for fn in gen_fns()]

结果为[4, 4, 4, 4, 4]

出现这种情况的原因就是Python的列表生成式只会产生一个作用域,产生的5个闭包保存了同样的环境,所有的x都是同一个x,gen_fns返回时x的值是迭代结束时的值4,闭包被调用时去查找环境中的x,自然就得到了4. 要让结果为[0, 1, 2, 3, 4],我们可以让闭包形成时处在不同的环境中,注意Python只有类定义和函数定义(包括lambda)能形成作用域,因此我们可以这样处理:

def gen_fns():
    return [(lambda x: lambda: x)(x) for x in xrange(5)]
print [fn() for fn in gen_fns()]

这里lambda x: lambda: x中外层的lambda形成了一个作用域,并且该作用域里的x不是自由变量,而是被外层lambda捕获而成为仅属于该作用域的变量,因此这里产生的5个闭包都保存了一样的环境,不一样的x,而每个x的值都为形成闭包时的值.

注意闭包和值语义引用语义没有关系,事实上,仅仅是对变量本身进行操作(比如赋值和加减法),值语义和引用语义根本没有差别,只有对变量进行间接操作(其实也只有引用语义才存在间接操作)(比如调用变量的set_xxx方法)时,才有可能区别值语义和引用语义.

闭包的作用

通常一个函数的返回结果仅与输入有关,也就是说函数本身是不保存任何状态的,而闭包则是保存了环境(词法作用域)的函数,其输出不仅与输入有关,也会受环境的影响,不同的环境产生的闭包是不一样的,相同的环境不同的状态闭包调用的结果也不一样,通过闭包,我们可以获取和改变闭包保存的环境,这样闭包就成为了环境之间交互的通道. (待续)