电影推荐算法

最编程 2024-04-04 07:10:31

...

模型训练

下载数据集，解压到项目目录下的./ml-1m文件夹下。数据集分用户数据users.dat、电影数据movies.dat和评分数据ratings.dat。

数据集分析

user.dat：分别有用户ID、性别、年龄、职业ID和邮编等字段。

数据集网站地址为http://files.grouplens.org/datasets/movielens/ml-1m-README.txt对数据的描述：

使用UserID、Gender、Age、Occupation、Zip-code分别表示用户ID、性别、年龄、职业和邮政编码，M表示男性，F表示女性。年龄范围表示：

网络异常，图片无法展示

UserID、Gender、Age和Occupation都是类别字段，其中邮编字段不使用。rating.dat数据分别有用户ID、电影ID、评分和时间戳等字段。数据集网站的描述：UserID范围为1_{6040；MovieID范围为1}3952；Rating表示评分，最高5星；Timestamp为时间戳，每个用户至少20个评分。查看ratings.dat的前5个数据，结果如图4-7所示，相关代码如下：

网络异常，图片无法展示

评分字段Rating是监督学习的目标，时间戳字段不使用。movies.dat数据集分别有电影ID、电影名和电影风格等字段。数据集网站的描述：

使用MovieID、Title和Genres，其中MovieID和Genres是类别字段，Title是文本。Title与IMDB提供的标题相同（包括发行年份），Genres是管道分隔，并且选自以下流派：

数据预处理

通过研究数据集中的字段类型，发现有一些是类别字段，将其转成独热编码，但是UserID、MovieID的字段会变稀疏，输入数据的维度急剧膨胀，所以在预处理数据时将这些字段转成数字。操作如下：

UserID、Occupation和MovieID不变。

Gender字段：需要将F和M转换成0和1。

Age字段：转成7个连续数字0~6。

Genres字段：是分类字段，要转成数字。将Genres中的类别转成字符串到数字的字典，由于部分电影是多个Genres的组合，将每个电影的Genres字段转成数字列表。

Title字段：处理方式与Genres一样，首先，创建文本到数字的字典；其次，将Title中的描述转成数字列表，删除Title中的年份。

统一Genres和Title字段长度，这样在神经网络中方便处理。空白部分用PAD对应的数字填充。实现数据预处理相关代码如下：

网络异常，图片无法展示

上一篇：基于 Python 和 Tensorflow 的电影推荐算法

下一篇：卡拉 OK 中的歌唱评价和声音分析

电影推荐算法

模型训练

数据集分析

m1 MacBook Air 3 个月使用总结及原生运行于苹果芯片架构的软件推荐

为什么有些人强烈推荐 Macbook，而有些人却说千万不要买 Macbook？

推荐的笔记本电脑配置_2020 年笔记本电脑推荐 (Apple)

对于首次购买或使用 MacBook Pro 的用户，有哪些必备外设和应用程序值得推荐？

为什么我花了 1 万多美元购买 MacBook Pro，重点推荐我用于开发写作的工具 - 2. Unix 环境本身。

硬核数据处理笔记本电脑推荐（2023 年版）

网卡天线_[小兵推荐] BCM94360Z4 m.2 NGFF 四天线黑色苹果笔记本无线网卡

苹果笔记本回收哪个平台价格高？2022笔记本回收平台推荐

Win10+Black Apple 单硬盘双系统双系统超简单安装易学 "推荐"。

2018 新款 macbook Pro 安装双系统教程新Macbook安装任意源软件教程 mac软件下载资源推荐 windows10最新版ISO镜像下载 Win10 ISO下载教程

电影推荐算法

模型训练

数据集分析

m1 MacBook Air 3 个月使用总结及原生运行于苹果芯片架构的软件推荐

为什么有些人强烈推荐 Macbook，而有些人却说千万不要买 Macbook？

推荐的笔记本电脑配置_2020 年笔记本电脑推荐 (Apple)

对于首次购买或使用 MacBook Pro 的用户，有哪些必备外设和应用程序值得推荐？

为什么我花了 1 万多美元购买 MacBook Pro，重点推荐我用于开发写作的工具 - 2. Unix 环境本身。

硬核数据处理笔记本电脑推荐（2023 年版）

网卡天线_[小兵推荐] BCM94360Z4 m.2 NGFF 四天线 黑色 苹果笔记本无线网卡

苹果笔记本回收哪个平台价格高？2022笔记本回收平台推荐

Win10+Black Apple 单硬盘双系统 双系统 超简单安装 易学 "推荐"。

2018 新款 macbook Pro 安装双系统教程 新Macbook安装任意源软件教程 mac软件下载资源推荐 windows10最新版ISO镜像下载 Win10 ISO下载教程

网卡天线_[小兵推荐] BCM94360Z4 m.2 NGFF 四天线黑色苹果笔记本无线网卡

Win10+Black Apple 单硬盘双系统双系统超简单安装易学 "推荐"。

2018 新款 macbook Pro 安装双系统教程新Macbook安装任意源软件教程 mac软件下载资源推荐 windows10最新版ISO镜像下载 Win10 ISO下载教程