Python的列表+和+=操作的区别

今天我们主要探讨的是:python - If x is list, why does x += “ha” work, while x = x + “ha” throw an exception?

问题

众所周知,在 python 中,+运算符可以使用在列表上,+运算符只需要第二个操作数是可迭代的,那么 + 显然可以运算在 “ha” 上。

代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
In [1]: x = []

In [2]: x += "ha"

In [3]: x
Out[3]: ['h', 'a']

In [4]: x = x + "ha"
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-4-caa641c05918> in <module>
----> 1 x = x + "ha"

TypeError: can only concatenate list (not "str") to list

解答

当我们在列表 list 上使用+=的时候,其实相当于调用函数 extend(),而不是使用的+

  • 你可以在一个可迭代(iterable)对象上调用 extend()
  • 但是,当您使用+时,另一个操作数必须是列表(list)。

为什么 python 会如此诡异,也许是出于性能方面的考虑。 调用+时,将会创建一个新的对象,并复制里面的所有内容。但是当调用extend()函数时,将可以使用现有的空间。

这样就会产生另一个副作用:如果你写 X += Y,在其他对列表的引用(reference)中,会看到变化;但如果你使用 X = X + Y,就不会。

下面的代码说明了这一点:

1
2
3
4
5
6
7
8
9
10
In [7]: x = ['a','b']

In [8]: y = ['c', 'd']

In [9]: z = x

In [10]: x += y

In [11]: z
Out[11]: ['a', 'b', 'c', 'd']

使用 += 不会新创建对象,对列表的引用都能感知到列表的变化。

1
2
3
4
5
6
7
8
9
10
In [12]: x = ['a','b']

In [13]: y = ['c', 'd']

In [14]: z = x

In [15]: x = x + y

In [16]: z
Out[16]: ['a', 'b']

使用+ 要求两边都是列表,并且新建了对象,旧的引用关系不会指向新的列表。

python += 的源代码:

1
2
3
4
5
6
7
8
9
10
11
12
static PyObject *
list_inplace_concat(PyListObject *self, PyObject *other)
{
PyObject *result;

result = listextend(self, other);
if (result == NULL)
return result;
Py_DECREF(result);
Py_INCREF(self);
return (PyObject *)self;
}

python+的源代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
static PyObject *
list_concat(PyListObject *a, PyObject *bb)
{
Py_ssize_t size;
Py_ssize_t i;
PyObject **src, **dest;
PyListObject *np;
if (!PyList_Check(bb)) {
PyErr_Format(PyExc_TypeError,
"can only concatenate list (not \"%.200s\") to list",
bb->ob_type->tp_name);
return NULL;
}

// etc ...
知识就是财富
如果您觉得文章对您有帮助, 欢迎请我喝杯水!