图像字幕生成的深度神经网络模型开题报告

 2023-03-25 18:08:39

1. 研究目的与意义(文献综述包含参考文献)

字幕生成长期以来一直被认为是计算机视觉和自然语言处理中的一个难题。

之前,由于计算能力的不足以及大规模图像字幕数据集的缺少,这就导致了国外很少有人做这方面的研究,其所得到的结果也让人不尽满意,在国内更是鲜有人涉及这个方向。

不过,随着近几年年计算机运算能力的提高、深度学习( DeepLearning )的发展以及众多大规模图像字幕数据集的出现,这才使得这项任务重新回归到人们的视野并逐渐成为了计算机视觉与自然语言处理领域中的一个研究热点。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容、问题解决措施及方案

本课题使用深度学习自动生成图像字幕。

一、构建深度学习神经网络模型首先我们需要清楚构建一个深度学习模型的基本步骤(如下图): (插图1见附件)1.数据处理:从本地文件或网络地址读取数据,并做预处理操作,如校验数据的正确性等。

在数据处理方面,我们所要处理的数据主要为图像和文本序列数据。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版