基于上下文的状态估计制造技术

技术编号：36701709 阅读：11 留言：0更新日期：2023-03-01 09:18

可以确定对不同输入或条件具有鲁棒性的对象的状态信息。对于困倦，面部界标可以从捕获的图像数据中确定并用于确定一组眨眼参数。可以使用这些参数，例如与时间网络一起使用，以估计对象的状态(例如，困倦)。为了提高鲁棒性，眼睛状态确定网络可以从图像数据中确定眼睛状态，而不依赖于中间界标，所述中间坐标可以用于(例如与另一个时间网络)估计对象的状态。这些值的加权组合可用于确定对象的整体状态。为了提高准确性，可以利用个人行为模式和上下文信息来考虑由于对象变化或当前上下文而不是状态变化导致的数据变化。而不是状态变化导致的数据变化。而不是状态变化导致的数据变化。

全部详细技术资料下载

【技术实现步骤摘要】
基于上下文的状态估计

技术介绍

[0001]一直存在提高各种环境中的安全性的愿望。例如，这可以包括准确确定可能正在操作设备(例如车辆或机器)的人的困倦，如果不以足够的注意力或意识进行操作，可能会导致损坏或伤害。虽然存在试图确定诸如困倦或警觉等状态的系统，但这些系统并非在所有情况下都准确，或者对于用户、用户状态或环境条件之间的变化具有足够的鲁棒性。
附图说明
[0002]将参照附图描述根据本公开的各个实施例，在附图中：
[0003]图1A和1B示出了根据至少一个实施例的车辆的多个组件的示例；
[0004]图2A、2B、2C、2D、2E和2F示出了根据至少一个实施例的可以使用的特征数据；
[0005]图3示出了根据至少一个实施例的可以使用的困倦估计系统；
[0006]图4示出了根据至少一个实施例的用于估计对象状态的示例过程；
[0007]图5A和5B示出了根据至少一个实施例的用于解释不是由于对象状态改变而引起的变化或行为的过程；
[0008]图6示出了根据至少一个实施例的用于确定人的状态的系统的组件；
[0009]图7A示出了根据至少一个实施例的推理和/或训练逻辑；
[0010]图7B示出了根据至少一个实施例的推理和/或训练逻辑；
[0011]图8示出了根据至少一个实施例的示例数据中心系统；
[0012]图9示出了根据至少一个实施例的计算机系统；
[0013]图10示出了根据至少一个实施例的计算机系统；
[0014]图11示出了根据一个...

【技术保护点】

【技术特征摘要】
1.一种计算机实现的方法，包括：接收图像数据，所述图像数据包括一段时间内人脸的表示；从所述图像数据的至少一部分确定所述人的一组眨眼参数；确定生成所述图像数据的时间的上下文数据，所述上下文数据与一个或更多个环境条件有关；以及将所述一组眨眼参数和所述上下文数据传递到至少第一时间网络以生成所述人的至少第一困倦预测，其中所述上下文数据用于解释由于所述一个或更多个环境条件所导致的所述一组眨眼参数中的变化。2.如权利要求1所述的计算机实现的方法，其中，所述一个或更多个环境条件与道路配置、亮度、天气、一天中的时间、位置、速度或周围对象的数量中的至少一项有关。3.如权利要求1所述的计算机实现的方法，还包括：使用来自一个或更多个相机、传感器、全球定位系统GPS信号或网络数据源的数据确定所述一个或更多个环境条件。4.如权利要求1所述的计算机实现的方法，还包括：至少部分地基于所述一个或更多个环境条件确定眨眼场景；以及使用对应于所述眨眼场景的一个或更多个眨眼阈值来确定所述第一困倦预测。5.如权利要求1所述的计算机实现的方法，还包括：使用所述图像确定所述人的身份；识别所述人的眨眼简档，所述人的眨眼简档包括所述人特有的一个或更多个眨眼行为；以及进一步基于所述一个或更多个眨眼行为的数据生成至少所述第一困倦预测。6.如权利要求1所述的计算机实现的方法，还包括：识别所述图像数据中的一组面部界标；从所述图像数据中确定表示所述人的眼睛是完全或部分睁开还是完全或部分闭合的眼睛状态信息；从所述图像数据中确定所述人的头部姿势信息；至少部分地基于所述一组面部界标、所述头部姿势信息和所述眼睛状态信息来确定所述一组眨眼参数；从所述眼睛状态信息中确定最近一段时间的眨眼频率信息；将所述一组眨眼参数传递给所述第一时间网络以生成所述人的所述第一困倦预测；将所述眨眼频率信息传递给第二时间网络以生成所述人的第二困倦预测；以及至少部分地基于所述第一困倦预测和所述第二困倦预测来针对所述人提供总体困倦确定。7.如权利要求6所述的计算机实现的方法，其中，所述第一时间网络和所述第二时间网络是长短期记忆LSTM网络，并且其中，由所述LSTM网络生成的所述第一困倦预测和所述第二困倦预测对应于卡罗林斯卡瞌睡量表KSS值。8.如权利要求6所述的计算机实现的方法，其中，所述一组眨眼参数的至少一个子集是使用从所述一组面部界标计算的纵横比信息来确定的。9.如权利要求1所述的计算机实现的方法，其中，所述上下文数据作为从所述上下文数
据确定的一个或更多个特征向量作为输入提供给所述第一时间网络。10.一种系统，包括：相机，其用于捕获图像数据，所述图像数据包括一段时间内人脸的表示；一个或更多个处理器；以及存储器，其包括指令，所述指令在由所述一个或更多个处理器执行时，使所述系统：从所述图像数据的至少一部分确定所述人的一组眨眼参数；确定捕获所述图像数据的时间的上下文数据，所述上下文数据与一个或更多个环境条件有关；以及使用所述一组眨眼参数和所述上下文数据用至少第一时间网络来生成所述人的至少第一困倦预测，其中所述上下文数据用于考虑由于一个或更多个环境条件所导致的所述一组眨眼参数中的变化。11.如权利要求10所述的系统，其中，如果所述指令由所述一个或更多个处理器执行，则进一步使所述系统：使用来自一个或更多个相机、传感器、全球定位系统GPS信号或网络数据源的数据确定所述一个或更多个环境条件，其中所述一个或更多个环境条件与道路配置、亮度、天气、一天中的时间、位置、速度或周围对象的数量中的至少一项有关。12.如权利要求10所述的系统，其中，如果所述指令由所述一个或更多个处理器执行，则进一步使所述系统：至少部分地基于所述一个或更多个环境条件确定眨眼场景；以及使用对应于所述眨眼场景的一个或更多个眨眼阈值来确定所述第一困...

【专利技术属性】
技术研发人员：任育卓，N，
申请(专利权)人：辉达公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人