下载此文档

CN111276142A-一种语音唤醒方法及电子设备.docx


文档分类:IT计算机 | 页数:约18页 举报非法文档有奖
1/18
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/18 下载此文档
文档列表 文档介绍
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 111276142 A
(43)
(21)申请号 202010063473 .1 (22)申请日 2处理器执行时实现如权利要求1至5中 任一项所述的语音唤醒方法中的步骤。
一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机 程序,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的语音唤醒方法 中的步骤。
一种语音唤醒方法及电子设备
技术领域
[0001] 本发明涉及语音处理技术领域,尤其涉及一种语音唤醒方法及电子设备。
背景技术
[0002] 语音唤醒技术的应用领域较为广泛,例如手机、可穿戴设备、智能音箱、智能家居、
车载等。几乎很多带有语音功能的设备,都会需要语音唤醒技术作为人机互动的一个开始 或入口,不同的产品会有不同的唤醒词,用户可通过特定的唤醒词唤醒电子设备。
[0003] 目前,在语音唤醒的过程中,为了避免误唤醒,往往会对唤醒语音的匹配精度要求 较高,即通常会将唤醒阈值固定设为的较高的唤醒阈值,可见,这种唤醒方式不够灵活。
发明内容
[0004] 本发明实施例提供一种语音唤醒方法及电子设备,以解决现有语音唤醒方式不够
灵活的问题。
[0005] 为解决上述技术问题,本发明是这样实现的:
[0006] 第一方面,本发明实施例提供了一种语音唤醒方法,应用于包括摄像头的电子设
备,其特征在于,所述方法包括:
[0007] 获取所述摄像头采集的第一图像;
[0008] 在识别到所述第一图像中包括人脸图像的情况下,获取所述人脸图像对应的对象
的位置信息;
[0009] 根据所述位置信息,调整所述电子设备的唤醒阈值;
[0010] 基于调整后的唤醒阈值,控制所述电子设备响应用户的语音唤醒指令。
[0011] 可选的,所述获取所述人脸图像对应的对象的位置信息,包括:
[0012] 获取所述人脸图像在所述第一图像中的坐标位置信息;
[0013] 所述根据所述位置信息,调整所述电子设备的唤醒阈值,包括:
[0014] 基于所述坐标位置信息,获取所述人脸图像对应的对象相对于所述电子设备中心
的偏移距离;
[0015] 根据目标距离,调整所述电子设备的唤醒阈值,其中,所述目标距离为所述偏移距
离。
[0016] 可选的,所述获取所述人脸图像对应的对象的位置信息,包括:
[0017] 获取所述人脸图像对应的对象相对于所述电子设备的直线距离;
[0018] 所述根据所述位置信息,调整所述电子设备的唤醒阈值,包括:
[0019] 根据目标距离,调整所述电子设备的唤醒阈值,其中,所述目标距离为所述直线距
离。
[002。] 可选的,所述根据目标距离,调整所述电子设备的唤醒阈值,包括:
[0021] 在所述目标距离小于或等于第一距离阈值的情况下,调整所述电子设备的唤醒阈
值为第一唤醒阈值,其中,所述目标距离为所述偏移距离或所述直线距离;
[0022] 在所述目标距离大于所述第一距离阈值且小于或等于第二距离阈值的情况下,调 整所述电子设备的唤醒阈值为第二唤醒阈值,其中,所述第二距离阈值大于所述第一距离 阈值,所述第二唤醒阈值高于所述第一唤醒阈值;
[0023] 在所述目标距离大于所述第二距离阈值的情况下,调整所述电子设备的唤醒阈值
为第三唤醒阈值,其中,所述第三唤醒阈值高于所述第二唤醒阈值。
[0024] 可选的,所述在识别到所述第一图像中包括人脸图像的情况下,获取所述人脸图 像对应的对象的位置信息,包括:
[0025] 识别所述第一图像中的对象,确定所述第一图像的类别,所述类别包括人物类或
者非人物类;
[0026] 在确定所述第一图像的类别为人物类的情况下,返回所述第一图像中的人物对象
的人脸位置信息。
[0027] 第二方面,本发明实施例提供一种电子设备,包括摄像头,所述电子设备还包括:
[0028] 第一获取模块,用于获取所述摄像头采集的第一图像;
[0029] 第二获取模块,用于在识别到所述第一图像中包括人脸图像的情况下,获取所述
人脸图像对应的对象的位置信息;
[0030] 调整模块,用于根据所述位置信息,调整所述电子设备的唤醒阈值;
[0031] 唤醒模块,用于基于调整后的唤醒阈值,控制所述电子设备响应用户的语音唤醒
指令。
[0032] 可选的,所述第二获取模块具体用于获取所述人脸图像在所述第一图像中的坐标 位置信息;
[0033] 所述调整模块包括:
[0034] 计算单元,用于基于所述坐标位置信息,获取所述人脸图像对应的对象相对于所
述电子设备中心的偏移距

CN111276142A-一种语音唤醒方法及电子设备 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数18
  • 收藏数0 收藏
  • 顶次数0
  • 上传人sssmppp
  • 文件大小97 KB
  • 时间2022-06-14