Python迭代器怎么用?

文章导读
Previous Quiz Next Python 迭代器 Python 中的 iterator(迭代器)是一个对象,它能够逐个元素遍历集合(如 list 或 tuple)。它通过实现两个方法 __iter__() 和 __next__() 来遵循 iterator pro
📋 目录
  1. Python 迭代器
  2. 迭代器中的错误处理
  3. 自定义迭代器
  4. 异步迭代器
A A

Python - 迭代器



Previous
Quiz
Next

Python 迭代器

Python 中的 iterator(迭代器)是一个对象,它能够逐个元素遍历集合(如 list 或 tuple)。它通过实现两个方法 __iter__()__next__() 来遵循 iterator protocol(迭代器协议)。

__iter__() 方法返回 iterator 对象本身,而 __next__() 方法返回序列中的下一个元素,当没有更多元素可用时,会抛出 StopIteration 异常。

迭代器提供了一种内存高效的数据迭代方式,尤其适用于大型数据集。它们可以通过 iter() 函数从 iterable 对象创建,或者使用自定义 class 和 generator 实现。

Iterable 与 Iterator 的区别

在深入了解 iterator 的工作原理之前,我们应该了解 Iterable 和 Iterator 的区别。

  • Iterable(可迭代对象): 能够逐个返回其成员的对象(例如,lists、tuples)。
  • Iterator(迭代器): 表示数据流的对象,逐个返回元素。

我们通常使用 for 循环来遍历 iterable,如下所示 −

for element in sequence:
   print (element)

Python 的内置方法 iter() 实现了 __iter__() 方法。它接收一个 iterable 并返回 iterator 对象。

Python Iterator 示例

以下代码从 sequence 类型(如 list、string 和 tuple)获取 iterator 对象。iter() 函数还会从 dictionary 返回 keyiterator。

print (iter("aa"))
print (iter([1,2,3]))
print (iter((1,2,3)))
print (iter({}))

它将产生以下 output

<str_iterator object at 0x7fd0416b42e0>
<list_iterator object at 0x7fd0416b42e0>
<tuple_iterator object at 0x7fd0416b42e0>
<dict_keyiterator object at 0x7fd041707560>

但是,int 不是 iterable,因此会产生 TypeError。

iterator = iter(100)
print (iterator)

它将产生以下 output

Traceback (most recent call last):
   File "C:\Users\user\example.py", line 5, in <module>
      print (iter(100))
            ^^^^^^^^^
TypeError: 'int' object is not iterable

迭代器中的错误处理

Iterator 对象有一个名为 __next__() 的方法。每次调用它时,都会返回 iterator 流中的下一个元素。调用 next() 函数等同于调用 iterator 对象的 __next__() 方法。

当没有更多项可返回时,该方法会抛出 StopIteration 异常。

示例

在以下示例中,我们创建的 iterator 对象只有 3 个元素,但我们迭代了超过 3 次 −

it = iter([1,2,3])
print (next(it))
print (it.__next__())
print (it.__next__())
print (next(it))

它将产生以下 output

1
2
3
Traceback (most recent call last):
   File "C:\Users\user\example.py", line 5, in <module>
      print (next(it))
            ^^^^^^^^
StopIteration

可以使用 try 和 except 块在消耗 iterator 的代码中捕获此异常,尽管更常见的是使用 for 循环等结构隐式处理它,这些结构会内部管理 StopIteration 异常。

it = iter([1,2,3, 4, 5])
print (next(it))
while True:
   try:
      no = next(it)
      print (no)
   except StopIteration:
      break

它将产生以下 output

1
2
3
4
5

自定义迭代器

Python 中的自定义迭代器是一个用户定义的 class,它实现了迭代器协议,该协议由两个方法 __iter__()__next__() 组成。这使得 class 可以像迭代器一样工作,能够逐个遍历其元素。

要在 Python 中定义自定义迭代器 class,该 class 必须定义这些方法。

示例

在以下示例中,Oddnumbers 是一个实现了 __iter__() 和 __next__() 方法的 class。每次调用 __next__() 时,数字会增加 2,从而流式输出 1 到 10 范围内的奇数。

class Oddnumbers:

   def __init__(self, end_range):
      self.start = -1
      self.end = end_range

   def __iter__(self):
      return self

   def __next__(self):
      if self.start &lt self.end-1:
         self.start += 2
         return self.start
      else:
         raise StopIteration

countiter = Oddnumbers(10)
while True:
   try:
      no = next(countiter)
      print (no)
   except StopIteration:
      break

它将产生以下 output

1
3
5
7
9

示例

让我们用以下代码创建一个生成前 n 个 Fibonacci 数的另一个 iterator −

class Fibonacci:
   def __init__(self, max_count):
      self.max_count = max_count
      self.count = 0
      self.a, self.b = 0, 1

   def __iter__(self):
      return self

   def __next__(self):
      if self.count >= self.max_count:
         raise StopIteration
        
      fib_value = self.a
      self.a, self.b = self.b, self.a + self.b
      self.count += 1
      return fib_value

# 使用 Fibonacci iterator
fib_iterator = Fibonacci(10)

for number in fib_iterator:
   print(number)

它将产生以下 output

0
1
1
2
3
5
8
13
21
34

异步迭代器

Python 中的异步迭代器允许我们迭代异步序列,从而在循环中处理 async 操作。

它们遵循异步迭代器协议,该协议由方法 __aiter__()__anext__() 组成(从 Python 3.10 版本开始添加)。这些方法与 async for 循环结合使用,以迭代异步数据源。

aiter() 函数返回一个异步迭代器对象。它是经典迭代器的异步对应物。任何异步迭代器都必须支持 __aiter__()__anext__() 方法。这些方法由两个内置函数内部调用。

异步函数称为协程,并使用 asyncio.run() 方法执行。main() 协程包含一个 while 循环,依次获取奇数,如果数字超过 9 则引发 StopAsyncIteration。

与经典迭代器类似,异步迭代器提供对象流。当流耗尽时,会引发 StopAsyncIteration 异常。

示例

在下面给出的示例中,声明了一个异步迭代器 class Oddnumbers。它实现了 __aiter__() 和 __anext__() 方法。每次迭代时,返回下一个奇数,程序会等待一秒钟,以便异步执行其他进程。

import asyncio

class Oddnumbers():
   def __init__(self):
      self.start = -1

   def __aiter__(self):
      return self
      
   async def __anext__(self):
      if self.start >= 9:
         raise StopAsyncIteration
      self.start += 2
      await asyncio.sleep(1)
      return self.start
      
async def main():
   it = Oddnumbers()
   while True:
      try:
         awaitable = anext(it)
         result = await awaitable
         print(result)
      except StopAsyncIteration:
         break
         
asyncio.run(main())

输出

它将产生以下 output

1
3
5
7
9