发布网友 发布时间:2022-04-23 01:45
共1个回答
热心网友 时间:2023-10-10 13:24
摘要识别空中物体,视觉和图像识别,就是摄像头和读码两种,再就是读芯片了;关键看设备空中什么物体,固定的还是移动的?不同物体还是某种特定物体?固定的图像识别一般就可以了;移动的需要开发算法进行行为识别了。咨询记录 · 回答于2021-11-18毕业设计想做一个简单的识别物体的设备识别空中物体,视觉和图像识别,就是摄像头和读码两种,再就是读芯片了;关键看设备空中什么物体,固定的还是移动的?不同物体还是某种特定物体?固定的图像识别一般就可以了;移动的需要开发算法进行行为识别了。识别固定物体,我的想法是通过摄像头模组传输图像信息,然后设备对图像信息进行识别输出。然后我想问的是我需要准备什么材料来制作这个设备这种摄像头模组可行吗,然后我还需要准备什么智能终端或者扫描仪,图像识别现在一个简单软件就可以实现,采用云端或者本地系统部署识别引擎,单片机原件可以不,可以的话要用哪些需要与识别系统引擎兼容能否给我一套具体的方案参考一下稍等一会背景技术:随着ai技术的沉淀和5g的来临,目前ai已经在很多领域得到广泛的应用,比如在线教育和远程医疗等场景,目前,基于深度神经网络技术的图像定位和识别已经比较成熟,其准确率可以达到99%以上,比如基于人脸识别的安检系统已经达到实用水平,以及刷脸支付开始流行,因此基于图像定位和识别的ai技术可以确保的稳健和高效,但是目前市场上的点读设备都是结合绘本定制的,灵活性很差。技术实现要素:本发明要解决的技术问题是,针对以上问题提供基于拍照识物的智能点读方案。为解决上述技术问题,本发明提供的技术方案为:基于拍照识物的智能点读方案,包括信号采集器、信号处理器、语音合成单元、人机交互端口,其特征在于:所述的信号采集器是进行图片采集,且信号采集器基于若干类型的设备设计软件,所述的信号处理器是完成图像信号的分析处理,包括图片定位、分割、识别,以及文本句子的生成,所述的信号采集器、信号处理器组成图片内容编辑和生成前端系统,所述的语音合成单元是将文本内容转换为语音信号,所述的人机交互端口包括用户触发界面或者开关以及音频信号的输出,且人机交互端口内设有基于位置触发的内容拼读。作为改进,所述的信号采集器基于若干类型的设备设计软件,例如手持移动设备(比如智能手机,平板电脑,摄像机,录像笔等)或者其他可穿戴设备(比如智能眼镜)对目标区域进行拍照。作为改进,所述的采集图像的场景可以包括对真实的物体进行图片采集,对书籍、文案内容进行图片采集,以及虚拟现实中的图片采集等。作为改进,所述的信号处理器是完成图像信号的分析处理,对所述采集到的图片进行分析,包括对图片中物体或者文字的定位、分割和识别等,作为改进,所采用的技术实现算法包括但不限于通过训练的深度神经网络模型,比如rcnn,faster-rcnn等对图像内容进行end-to-end的分析。作为改进,所述文本句子的生成通过已经得到图片中物体的标签和文字内容,依此为关键信息生成句子级别的文本描述,常用的模型有attention-basedmodel,gan和reinforcementlearning等。作为改进,所述的基于位置触发的内容拼读对图片中的物体和文字内容都完成了区域定位和识别理解,当用户对相应位置点击触发时,即可按照预设的语言(比如英文)进行智能拼读。该步骤基于语音合成技术(text-to-speech,tts)进行实现,还可以订制不同类型的声色。