[发明专利]识别装置及方法有效
申请号: | 201910490584.8 | 申请日: | 2019-06-06 |
公开(公告)号: | CN110580905B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 安田康二;长健太 | 申请(专利权)人: | 株式会社东芝;东芝数字解决方案株式会社 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/08 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 徐殿军 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 装置 方法 | ||
1.一种识别装置,其特征在于,
具备:
保存机构,保存基于第1数据集而制作的第1识别模型、基于第2数据集而制作的第2识别模型、该第1数据集、该第2数据集、表示第1条件的第1标签及第2标签、表示第2条件的第3标签及第4标签,其中该第1数据集包含在上述第1条件下收集到的第1识别对象数据及根据该第1识别对象数据应识别出的第1正解数据,该第2数据集包含在上述第2条件下收集到的第2识别对象数据及根据该第2识别对象数据应识别出的第2正解数据;
取得机构,取得包含第3识别对象数据及根据该第3识别对象数据应识别出的第3正解数据的第3数据集;
识别处理机构,使用保存在上述保存机构中的上述第1识别模型和上述第2识别模型中的每一个,执行对于上述第3数据集中包含的上述第3识别对象数据的识别处理;
计算机构,通过将使用上述第1识别模型执行上述识别处理的结果与上述第3正解数据进行比较,计算上述第1识别模型的第1识别精度,通过将使用上述第2识别模型执行上述识别处理的结果与上述第3正解数据进行比较,计算上述第2识别模型的第2识别精度;
获取机构,使用计算出的上述第1识别精度作为上述第1标签及上述第2标签中的每一个的精度,使用计算出的上述第2识别精度作为上述第3标签及上述第4标签中的每一个的精度,当上述第1标签与上述第3标签相同时,基于上述第1识别精度及上述第2识别精度获取代表值;
提取机构,以获取的上述代表值作为上述第1标签及上述第3标签中的每一个的精度,以上述第1识别精度作为上述第2标签的精度,以上述第2识别精度作为上述第4标签的精度,基于这些精度提取上述第1标签至上述第4标签中的特定标签;以及
模型制作机构,基于上述取得机构取得的上述第3数据集、以及上述第1数据集和上述第2数据集中与提取出的上述特定标签对应的数据集,制作第3识别模型。
2.如权利要求1所述的识别装置,其特征在于,
上述第1数据集中包含的上述第1识别对象数据包含第1声音数据;
上述第1数据集中包含的上述第1正解数据包含根据上述第1声音数据写出的第1文本;
上述第3数据集中包含的上述第3识别对象数据包含第2声音数据;
上述第3数据集中包含的上述第3正解数据包含根据上述第2声音数据写出的第2文本;
上述识别处理包括根据声音数据识别声音并将该声音变换为文本的处理。
3.如权利要求2所述的识别装置,其特征在于,
还具备输入第3声音数据的输入机构;
上述识别处理机构使用制作出的上述第3识别模型,将上述第3声音数据变换为第3文本。
4.如权利要求2所述的识别装置,其特征在于,
还具备显示上述提取出的特定标签的显示处理机构;
上述模型制作机构基于取得的上述第3数据集及与由用户指定的上述特定标签对应的数据集,制作上述第3识别模型。
5.如权利要求4所述的识别装置,其特征在于,
上述显示处理机构还显示与提取出的上述特定标签相关联的标签。
6.如权利要求2所述的识别装置,其特征在于,
还具备显示处理机构;上述识别处理机构使用制作出的上述第3识别模型,执行对于上述第3数据集中包含的第2声音数据的识别处理;
上述计算机构通过将使用制作出的上述第3识别模型的对于上述第2声音数据的识别处理结果与上述第2文本进行比较,计算上述第3识别模型的识别精度;
上述显示处理机构显示计算出的上述第3识别模型的识别精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝;东芝数字解决方案株式会社,未经株式会社东芝;东芝数字解决方案株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910490584.8/1.html,转载请声明来源钻瓜专利网。