欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

[Python] .tsp 文件读取

最编程 2024-05-06 08:01:23
...

最近做课程作业,需求解TSP问题(旅行商问题),数据集格式均是.tsp格式的,下面就用pandas来进行数据的加载,并转换成列表形式。

具体步骤

1、查看源数据

在pycharm中可以打开tsp文件,可以发现,所有数据集格式都一致,从第七行开始是具体数据,第一列是标号,第二列是城市的x坐标,第三列是城市y坐标。

2、加载文件

使用pandas的read_csv接口可以成功加载很多格式的文件。 接口有很多参数,具体可以参见pandas.read_csv参数整理

df = pd.read_csv('./TSP问题测试数据集/att48.tsp', sep=" ", skiprows=6, header=None)

这里选用了三个参数: sep为空格,即不同列数据以空格形式分隔; skiprows=6,跳过前7行,注:skiprows以0作为第一行; header = None 即纯数据,不包含表格。

3、读取城市序号

进行完上面的操作后,df就成为了一个DateFrame对象,索引时需注意,第一个为列标,第二个为行标(和二维数组的索引顺序相反)

由于最后一行以EOF结束,因此我们需读取len(df)-1行内容。

city = np.array(df[0][0:len(df)-2])

这里用到的是numpy的array,通过tolist,可以将其转换成列表。

city_name = city.tolist()

4、读取城市坐标

读取城市坐标和上面就比较类似了,分别用两个array进行读取,之后再用zip一一配对。

city_x = np.array(df[1][0:len(df)-2])
city_y = np.array(df[2][0:len(df)-2])
city_location = list(zip(city_x, city_y))

注:直接用zip打印出的是对象的地址信息,需在外套一层list转换。

完整代码

import pandas as pd
import numpy as np

# 载入数据
df = pd.read_csv('./TSP问题测试数据集/att48.tsp', sep=" ", skiprows=6, header=None)
city = np.array(df[0][0:len(df)-2])  # 最后一行为EOF,不读入
city_name = city.tolist()
# print(city_name)
city_x = np.array(df[1][0:len(df)-2])
city_y = np.array(df[2][0:len(df)-2])
city_location = list(zip(city_x, city_y))
# print(city_location)

推荐阅读