联系方式
电话:021-66137268
地址:上海市宝山区南陈路333号
        上海大学翔英大楼T821室
邮箱:ypguan@shu.edu.cn
邮编:200444




 
 

多人及带伪装的远程身份识别

基于人头刚体不变性及其个体类特征间的差异性,自适应地从复杂场景中提取人头,并采用流体跟踪链自动跟踪与定位人头;同时,采用多类自适应分类器,度量不同视角下的人头相似性,采用奇异值特征分解,映像重构个体不同视角下的人头特征,克服人体运动因遮挡、交叉等引起的身份错位以及表情、光照、佩戴物等影响,实现基于有限人头视角下的宽泛、大角度人体身份认证。此外,通过将颜色、纹理、轮廓等多种特征相结合,有效提取人脸在正常情况及带伪装情况下的关键差异,克服了不同姿态、不同背景环境等干扰,实现准确、鲁棒的伪装人员检测。
多人带伪装

       

非穿戴智能指势人机交互

以人手直接作为计算机输入设备,从而充分发挥人类的日常技能,在摆脱常规输入设备(键盘、鼠标、操作杆、触摸屏等)束缚的同时,满足不同用户在人机交互时的活动自由性与灵活性。在教育、影视、娱乐、制造、商业、军事、医学等领域均具有广阔的应用前景。
人机交互

 

远程视频流体身份识别

基于人头刚体不变性及其个体类特征间的差异性,自适应地从复杂场景中提取人头,并采用流体跟踪链自动跟踪与定位人头;同时,采用多类自适应分类器,度量不同视角下的人头相似性,采用奇异值特征分解,映像重构个体不同视角下的人头特征,克服人体运动因遮挡、交叉等引起的身份错位以及表情、光照、佩戴物等影响,实现基于有限人头视角下的宽泛、大角度人体身份认证。
远程视频流体身份识别

语音识别

基于中文语音特征,针对已知固定语音词汇范围,实现非特定人的中文孤立词语音自动识别。采用Window操作系统平台,基于HTK工具箱,利用C#语言编写语音识别算法以及人机交互界面,界面代码通过flash控件进行显示,默认语音从PC音频端输入,通过音频信号识别出说话人的语音词汇,同时PC针对性地调用flash文件作出反馈,更新交互界面,与说话人进行人机互动。
语音识别

   

竞技体育训练辅助系统

运用计算机视觉分析与摄像机自标定方法,对羽毛球、乒乓球等球类竞技体育项目的比赛录像进行分析。准确获取场景中各元素真实空间三维坐标,用于计算球类轨迹、速度、加速度等实际运动模型参数。为球类竞技体育的训练提供一种客观、可靠的数据采集与分析方法,有效克服了人工经验及主观因素的约束。
竞技体育