欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

玩转Python迭代器:揭秘iter和next的力量,轻松掌握迭代器长度的计算

最编程 2024-01-13 20:49:14
...

一、迭代器的特性

1、迭代器是一个可以记住遍历位置的对象。

2、迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不能后退。

3、迭代器是Python中的容器类的数据类型,可以同时存储多个数据,取迭代器中的数据只能一个一个地取,而且取出来的数据在迭代器中就不存在了

因此在训练数据时,dateloader加载迭代器应该放在epoch循环内,否则在第一个epoch内迭代器数据会被取完,下一个epoch将没有数据可用。

如以下程序中,get_dataset_loader必须放在 for epoch_i in range(1, epoch) 循环内。

for epoch_i in range(1, epoch):     # train & valid
        train_data_loader,valid_data_loader,_ = get_dataset_loader(dataset,batch_size)
        for step, (fields, target) in enumerate(train_data_loader):
            fields = Tensor(fields, ms.int32)
            target = Tensor(target, ms.float32)
            output = net(*[fields, target])

4、迭代器有两个基本的方法:iter() 和 next()。

5、所有的序列都可以转换成迭代器,包括字符串、列表、元组、字典对象等。

二、创建迭代器

所有的序列都可以转换成迭代器:

# 字符串转换成迭代器
iter1 = iter('abcd')
for index,date in enumerate(iter1):
    print(index,date) 

# 列表转换成迭代器
iter2 = iter([1, 2, 3, 4])
print(iter2)  

# 字典转换成迭代器
iter3 = iter({'name': 'aaa'})
print(iter3)   

print内容:

0 a
1 b
2 c
3 d
<str_iterator object at 0x7f0cb48d2e50>
<list_iterator object at 0x7f0cb403de90>
<dict_keyiterator object at 0x7f0cb4885a10>

iter1可以用enumerate()方法进行迭代,说明iter1已经是一个迭代器了。

直接输出迭代器得到的是迭代器数据存储的物理地址。

三、用next()方法获取迭代器元素

1、next()是Python的内置函数,可以返回迭代器的下一个元素。如果给定了默认值,则在迭代器数据耗尽时返回此默认值,否则会引发StopIteration异常。如:

iter4 = iter([10, 5, 2])
print(next(iter4, 0))
print(next(iter4, 0))
print(next(iter4, 0))  
print(next(iter4, 'end')) 

print内容:

10
5
2
end

若不加默认值,则会引发StopIteration异常。如:

iter4 = iter([10, 5, 2])
print(next(iter4))
print(next(iter4))
print(next(iter4))  
print(next(iter4)) 

print内容:

10
5
2
Traceback (most recent call last):

  File "/home/lmn/test.py", line 28, in <module>
    print(next(iter4))

StopIteration

2、调用一次next()方法只能输出一个元素,如:

iter4=iter([10,5,2,4,23])
print(next(iter4))

print内容:

10

3、想要获取迭代器中的全部元素可以采用循环,如:

iter4=iter([10,5,2,4,23])
while True:
    try:
        x = next(iter4)    # 获取下一个元素
        print(x)
    except StopIteration:
        # 遇到StopIteration就退出循环
        break

print内容:

10
5
2
4
23

四、迭代器是可循环可迭代对象

迭代器是可循环可迭代对象,因此可以用for循环获取迭代器的全部元素,如:

iter4=iter([10,5,2,4,23])
for i in iter4:
    print(i)

print内容:

10
5
2
4
23

五、获取迭代器长度(即元素总数)的方法

1、需要特别注意的是python内置的len()方法并不支持迭代器,因此无法用len()获取迭代器的长度。如:

iter5=iter([1,2,3,4,5,6])
print(len(iter5))

报错:type ‘list_iterator’ 没有 len() 方法

Traceback (most recent call last):

  File "/home/lmn/test.py", line 36, in <module>
    print(len(iter5))

TypeError: object of type 'list_iterator' has no len()

2、获取迭代器长度的方法:more_itertools.ilen(iter)

import more_itertools
iter5=iter([1,2,3,4,5,6])
print(more_itertools.ilen(iter5))

print内容:

6