会议记录

2022年4月24日星期日

会议记录
会议方式:线下会议室
参会人员:章翔,颜焕,汪彦彤,王萌,李江安,翁一冰,陆宇,樊文东,赵鹏,黎歆雨,王晨巍,陶斯颖,朱亚男,吴纯,庄国航,杨秋,汪睿琦,陈四贵
会议内容:
庄国航(PPT汇报)汇报了对于多模态情感识别数据集的调研情况,包括对情感信息的调研,数据集的调研和自己对相关问题的思考。包括了对情感信息(外部信号和生理信号)的调研,情感刺激方式和情感评估方法的说明等。对于当前主流的数据集的刺激方式,标签类型,采集模态和描述等进行了说明。汇报了group场景下的数据集HAPPEI和AMIGOS,对其基本情况进行了介绍。此外,还对驾驶场景下的几篇相关论文和数据集进行了调研汇报。对于当前数据集的一些缺陷进行了说明,对调研目的进行了说明,同时对一些场景进行了思考和研究,汇报了自己的想法。
**赵鹏、章翔(PPT汇报)**:对于此前的MoVi-Fi论文进行了复现,发现效果达不到论文所描述的性能,此外向作者寻求源代码被拒绝。对于另外一篇类似的发表于SenSys21的论文MoRe-Fi进行了汇报。改论文也是实现在运动场景下的呼吸恢复,采用了编码器解码器结构同时对IQ分量进行编码,最终解码器输出的结果会议Ground-Truth标签进行拟合学习,该片论文所描述的方案符合直觉,认为可以复现。
**王萌(PPT汇报)**:调研了车内场景下的一些相关工作。包含车内的情绪数据集,车内动作识别(当前没有看到基于UWB的工作)。对于当前的车内相关应用以及需求做了调研以及汇报,包括个性化驾驶行为学习,人车接管等场景以及需求。
颜焕(PPT汇报):汇报论文“A Golden Decade of Deep Learning: Computing Systems & Applications”,该论文是ACM Fellow,AAAS Fellow Jeffrey Dean所写,主要介绍了深度学习的历史,以及后续的趋势。包括稀疏激活模型,自动机器学习和多任务学习等。后续人工智能的发展很有可能是三者的集合。
**王晨巍(PPT汇报)**:调研驾驶中的人机交互对驾驶员认知、行为的影响。包含了非智能车和智能车驾驶两种情况。调研了包含“路怒情绪”对低龄驾驶员行为决策的影响, 不同自动化程度对驾驶员接管中情景感知能力和驾驶信任度舒适度的影响和自动驾驶系统中数字语音助手对驾驶员接管中警惕性和情境感知力的影响在内的三种情况。
**翁一冰(PPT汇报)**:汇报论文“Multi-Task Temporal Shift Attention Networks for
On-Device Contactless Vitals Measurement”,该篇论文主要实现远程的面部生命体征恢复,发表于ECCV2018。是第一个使用深层循环网络基于视频的心脏和呼吸率的端到端系统,主要利用帧之间的差异实现,但是汇报人对具体实现和损失函数的意义并不清楚,所运行的方法对未经过预处理的视频效果也不好,需要仔细理解论文。
**樊文东(PPT汇报)**:汇报论文“Former-DFER: Dynamic Facial Expression Recognition Transformer”,一种适用于野外场景的动态面部表情识别transformer。该框架用于解决wild场景下的遮挡,非正面姿势和头部运动等问题,在DFEW和AFEW上进行了实验,目前复现效果不好。
**王碧(PPT汇报)**:调研了本领域的顶级会议ICDAR的相关情况以及所举办的比赛,对于比赛任务和检索到的文献进行了汇报。
**陆宇(PPT汇报)**:调研了台湾省的车牌等信息,查找台湾车牌数据集没有找到,生成了人造数据集效果很差。
汪彦彤(口头汇报):调试代码,没有成功。
**


2022年4月17日星期日

会议记录
会议方式:线下会议室
参会人员:章翔,颜焕,汪彦彤,李江安,翁一冰,陆宇,樊文东,赵鹏,黎歆雨,王晨巍,陶斯颖,朱亚男,吴纯,庄国航,杨秋,汪睿琦,陈四贵
会议内容:
庄国航(PPT汇报)(思维导图)汇报了对于多模态情感识别数据集的调研情况,包括对情感信息的调研,数据集的调研和自己对相关问题的思考。当前的情感信息大致分为外部信号和内部的生理信号,生理信号更不容易作假。当前的数据集所采用的情感刺激方式都有图像,视频,音乐,游戏,交互等,庄按时间顺序对所调研的数据集进行了描述。庄自己考虑的调研思路为为什么构建,标签是什么,采集方法是什么,描述。老师对于调研方式提出了指导,比如先要弄清楚调研的意义,这些数据集之间的关联,它们为什么提出这个数据集,相比于之前的数据集有何优势等。对于所调研的数据集提供了十分详细的思维导图,并且依据调研结果提出了自己的思考。比如对于当前数据集的改进,在当前的场景中引入交互,老师对于创新型提出意见。相关汇报内容下周会思考后继续进行汇报。
章翔(PPT汇报)汇报了论文“SiWa: See into Walls via Deep UWB Radar”,改论文利用IR-UWB实现建筑结构透视与诊断,具体为识别墙体内的钢筋PVC管的位置并进行分类
主要创新点为,基于深度学习技术实现上述目的,避免了传统手段需要对电导率等参数进行判断之后才能精确的实现材料定位和识别,可以实现自适应的识别。论文对不同RF信号的性能,合成孔径雷达的缺陷进行了分析,提出了基于IR-UWB的解决方案。利用编解码器实现精确的成像,利用正交极化特征输入深度网络来实现材料区分。对于上周汇报的文章提出了质疑观点。此后的基于UWB的确定项目为基于UWB的手部关键点成像,实现办公场景下的手势交互。
颜焕(口头汇报):调研音频驱动的视频生成相关研究,扩展会议论文。当前的相关方法无法满足需求,且相关论文没有开放训练源代码,相关代码十分复杂而且需要大算力集群,因此难以实现自己训练。
黎歆雨(口头汇报):调研人机交互对人情绪影响的模型,主要从社交网络入手,目前正在调研微博方面,接下来继续调研该方面是否有其他模型,继续拓展。
王晨巍(口头汇报):调研非智能汽车人机交互对驾驶员的影响,主要从驾驶员情绪模型和行为决策模型考虑,但目前大多数研究都从人机环境的闭环考虑环境刺激作为输入,对驾驶员的情绪和决策影响,接下来继续调研并考虑智能车环境。
翁一冰(口头汇报):调整基于视频分析呼吸心率的代码并跑出结果,下一步调研具体实现方式以及目前该方向的实现程度。
吴纯(PPT汇报):对于大论文的相关进展进行了汇报,包括摘要和论文的结构,对于Zigbee和WiFi的相互之间异构通信的实验结果进行了汇报,当前所采用的机器学习方法取得了比较好的效果。
樊文东(口头汇报):完成论文工作,复现基于Transformer的微表情相关论文代码。
王碧(PPT汇报)调研了相关文本识别的论文,找到了部分代码,当前在处理文本识别的数据库和模型评估的代码。
陆宇(PPT汇报)调研的车牌检测的相关论文,复现了相关代码。调研了台湾省的车牌等信息,可能不包含地理位置信息。
汪彦彤(口头汇报):Micro-expression模块代码调试,spotting部分在matlab上已完成,recognition部分模型需要修改。


2022年4月10日星期日

会议记录
会议方式:线下会议室
参会人员:章翔,颜焕,汪彦彤,李江安,翁一冰,陆宇,樊文东,王萌,赵鹏,黎歆雨,王晨巍,陶斯颖,朱亚男,吴纯
会议内容:
章翔、赵鹏(PPT汇报)对于购买的UWB器件进行了汇报,当前完成了数据获取和处理的相关代码,对于获取的数据格式进行了简单介绍,UWB可以直接获取目标的距离信息,因此相对于WiFi等手段具有天然的优势。展示了多人呼吸和单人呼吸场景下的相关实验和数据说明。对于论文“MoVi-Fi: motion-robust vital signs waveform recovery via deep interpreted RF sensing”进行了汇报,其利用深度学习的自监督学习的方法分离的UWB信号,能够分离出动作和呼吸心率等。但其采用的方法不可解释,也没有实际理论可以进行证明,若为真说明其解决了神经网络特征不可解释的难题。同时怀疑真正起作用的只是将片段进行连接的编解码器模块。
颜焕、陶斯颖(PPT汇报)对于音频驱动的头部视频生成的相关工作进展进行了汇报,介绍了当前相关的研究背景,应用以及所采用的不同方法的对比。介绍了四种音频驱动的头部视频生成研究现状,分别为姿势可控的说话人脸、姿势可控的说话人脸、特定说话者->任意说话者模型和学习一致语音风格。对于当前所复现的程序进行了现场演示,老师要求提供输入任意文字和目标图片,可以生成对应的视频和语言的demo,后续将在这方面进行工作调研,并努力实现。
黎歆雨、王晨巍(口头汇报):调研人机交互中协助型人机交互对人的心理认知和对机器的影响,调研人机交互中人机博弈对人和机器的影响。
王萌(PPT汇报)汇报基于UWB的驾驶员和乘客情绪监测的调研。分别对于乘客的影响,相关工作进行了调研,下一步准备对隐私保护机制进行调研。调研情况表情,交通安全已经是当前致死的主要原因之一。对于现有的车辆监测框架进行了总结,当前主要监测驾驶员和车辆状态,忽略了乘客这一主体。而乘客的存在对于不同年龄的司机而言也是有很大影响的。对于基于视觉,音频和心率车辆运动的相关监测内容进行了综述和优缺点的总结,同时调研了基于UWB的车内多人生命体征监测工作。老师要求后续先对于当前已有的工作和可以进行的工作进行调研。
吴纯(PPT汇报)对于大论文的相关进展进行了汇报,包括摘要和论文的结构,对于Zigbee和WiFi的相互之间异构通信的实验结果进行了汇报,当前所采用的机器学习方法取得了比较好的效果。
樊文东(口头汇报):完成论文工作,对之前的工作采用基于深度学习的方法进行了改进,后续需要找会议进行发表。
王碧(PPT汇报):调研了相关文本识别的论文,找到了部分代码,当前在处理文本识别的数据库和模型评估的代码。
陆宇(PPT汇报)调研的车牌检测的相关论文,复现了相关代码。
汪彦彤,翁一冰(口头汇报):社交流媒体分析系统添加micro-expression 模块,对社交流媒体分析系统的ui进行功能添加,下一步增加生理识别模块。


2022年3月20日星期日

会议记录
会议方式:线下会议室
参会人员:章翔,颜焕,汪彦彤,李江安,翁一冰,陆宇,樊文东,王萌,赵鹏,黎歆雨,王晨巍,陶斯颖,朱亚男,吴纯
会议内容:
章翔(PPT汇报) 完成定型稿版本MM论文,Intro部分增加了motivation的部分补充以及新的实验效果,对于实验部分进行了补充,增加了特征分布图,泛化性以及鲁棒性实验。在月底之前完成论文修改。
颜焕(PPT汇报) 准备投稿之前在widar3上进行的实验论文,汇报论文“GANimation: One-Shot Anatomically Consistent Facial Animation”,GAN使得面部表情编辑获得了不错的效果,StarGAN能够控制特定域生成器的结果,但是在面部表情编辑上只能针对于离散表情。在论文中提出了一种基于动作单元(AU)标注的GAN条件约束方案,该方案以连续流形描述定义人类表情的解剖面部运动:

  • 可以控制AU的激活程度并且可以结合多个AU
  • 一种弱监督策略来训练模型,该策略只需要用标注的激活的AUs图像
  • 开发一种新的自我学习注意机制,使得模型对背景,照明条件和遮挡鲁棒
  • 面部表情编辑应用:电影产业,摄影技术,时尚和电子商务等
    后续调研相关的sota应用以及论文

黎歆雨、王晨巍(口头汇报):完成技术总结报告,处理财务等。
王萌(口头汇报):完成《信息对抗技术》邀稿文字部分,目前还需要对一些图进行润色,老师要求下周完成这件事。
汪彦彤、翁一冰、陶斯颖(思维导图汇报)汇报了微表情识别调研的相关成果。 完成了所需系统的界面部分,目前可以调用接口完成面部检测,身体关键点检测等任务。对微表情的调研主要介绍了从微表情的产生,与宏观表情的区别,到种类以及特征等相关工作,目前正在获取论文作者提供的数据集,下一步工作为拿到数据集之后再进行,而且需要调研微表情产生的原因机制。
李江安、吴纯、樊文东(口头汇报):进一步改进实验,准备写论文,完成了网页展示的相关内容设计,但还需要进一步完善。
赵鹏(口头汇报):调研了呼吸和心跳分离的一些方法,主要在看VMD算法运用,简单的滤波后FT的方法比较老,效果精度不够好,为UWB做准备
陆宇、王碧(PPT汇报)汇报了目标检测的相关工作,描述了VOC数据集,并在网上找到了台北地区的网络摄像头,准备下一部基于该摄像头采集数据进行一些前期实验。
朱亚男(口头汇报):大论文第四张Learning-Free方法可能行不通,需要重新找想法。


2022年3月13日星期日

会议记录
会议方式:线下会议室
参会人员:章翔,颜焕,汪彦彤,李江安,翁一冰,陆宇,樊文东,王萌,赵鹏,黎歆雨,王晨巍,陶斯颖,朱亚男,吴纯
会议内容:
章翔(PPT汇报):PPT下载 修改即将投稿的mm论文,调研相关研究路线,拟订未来研究计划。汇报了论文SCAN: Learning to Classify Images Without Labels(ECCV2020),描述了无监督语义分类的相关工作,在不需要训练集标签的情况下可以实现高精度的语义分类效果。无监督的进行图像的语义分类是重要且有挑战性的工作,当前的方案大多基于端到端的方式进行。本文提出一种两阶段方法处理这个问题,首先利用一个自监督表示学习方案来获取有语义意义的特征;之后利用这种特征作为先验学习一个可学习的聚类方法,取得了sota的性能。无监督的进行图像的语义分类是重要且有挑战性的工作,当前的方案大多基于端到端的方式进行。本文提出一种两阶段方法处理这个问题,首先利用一个自监督表示学习方案来获取有语义意义的特征;之后利用这种特征作为先验学习一个可学习的聚类方法,取得了sota的性能。噪声,语义模糊发生在超类的概率比跨超类更大。
颜焕(PPT汇报):PPT下载修改即将投稿的mm论文,调研相关研究路线,拟订未来研究计划。准备ICME论文的camera-ready,在实验,相关工作等方面扩充当前的会议论文到期刊。
黎歆雨、王晨巍(word汇报):WORD下载 进行项目实验,目前正在写技术总结报告,20日之前需要完成。
王萌(口头汇报):写《信息对抗技术》邀稿,对相关工作部分进行了调研,目前已完成,老师要求下周完成这件事。
汪彦彤、翁一冰、陶斯颖(PPT汇报):PPT下载 汇报了调研的相关成果,包括人格画像,场景识别等工作。针对社交流媒体采集得到的数据来绘制性格画像,该画像能对后续工作提供帮助。但是会议讨论认为应当先从更直接的方面入手采集信息,比如微动作,生命体征信号等。其中调研的场景识别工作可以移交给131项目组。
李江安、吴纯、樊文东(PPT汇报):完成毕业大论文,进行工作交接,进一步改进实验,利用SVM,KNN,LSTM等机器学习方法进行了部分实验,目前还需要进行下一步实验,并整理数据发表该项目论文。
赵鹏(PPT汇报):PPT下载 调研了UWB平台的相关工作,以及罗俊老师组的相关论文,汇报了UWB的特点,平台组成以及UWB的工作方式等。针对相关问题比如价格,PCB能否进行自我设计和开发进行了回答。老师要求能进行手持的穿墙人体关键点成像,赵鹏觉得应该可以做到。
陆宇(PPT汇报):PPT下载 汇报了目标检测的相关工作,描述了VOC数据集,并在网上找到了台北地区的网络摄像头,准备下一部基于该摄像头采集数据进行一些前期实验。
王碧(PPT汇报):PPT下载 汇报了文本检测的相关工作,论文为An End-to-End Trainable Neural Network for Image-Based Sequence Recognition and Its Application to Scene Text Recognition(TPAMI),该论文主要利用CNN和LSTM组成,已经进行了部分相关实验,对于数据集的效果良好但是实际差强人意。老师要求先解决切分的问题,即从照片中先找出文字区域,再解决文本识别问题。


2022年3月6日星期日

会议记录
会议方式: 线下会议室
参会人员: 章翔,颜焕,汪彦彤,李江安,翁一冰,陆宇,樊文东,王萌,赵鹏,黎歆雨,王晨巍,陶斯颖,朱亚男,吴纯
会议内容:
章翔、颜焕 (口头汇报): 修改即将投稿的mm论文,调研相关研究路线,拟订未来研究计划。
黎歆雨、王晨巍 (口头汇报): 进行项目实验,分析对比几类模型结果,目前决策树效果最好,准确度可以达到要求
王萌(PPT汇报): PPT下载 调研了现有的WiFi感知分辨率的相关文章,学习了雷达技术基础-距离分辨率。提出问题雷达距离分辨率公式对基于相位的距离测量是否适用?由于WiFi是双基体,不存在发射端与接收端之间的严格时间同步,单对双基体天线间实际上不具有绝对测距能力。利用多对天线的测量差可以获得入射方向角。方向角的测量本质上与距离分辨率有关,所以行内常用 c/B 代表 WiFi 的“距离”分辨率。调研了心理学中的模糊度允许问题,经过长时间的进化发展,我们已经有能力利用自上而下的知识改造感知——这更具即时性。无须从圆点图中推断出人脸的存在,它就在那里。推断已经根植于感知之中。
汪彦彤、翁一冰、陶斯颖(PPT汇报): PPT下载 调研了MM相关论文,汇报了论文“Pairwise Emotional Relationship Recognition in Drama Videos:Dataset and Benchmark”,提出一个新任务:成对情绪关系识别(PERR) Pairwise Emotional Relationship Recognition
与现有的区别:
- FER是面部表情识别任务,将面部表情进行分类,一般针对个体;
- GER是群体情绪识别,预测一组人的整体情绪状态。比如观看视频的观众;
- 社会关系检测 Social Relation Detection是指各种社会关系,如同事、夫妻等
- PERR是在一个给定的视频剪辑中,识别两个互动角色之间的情绪关系的类别,如亲密、敌意等
在PaddleHub上,调用API实现了表情,年龄性别等的识别。
李江安、吴纯、樊文东(口头汇报): 完成毕业大论文,进行工作交接,进一步改进实验,复习机器学习的知识,准备发论文以及项目演示需求
赵鹏(口头汇报): 调研了wifi成像,了解了一些技术细节。主要就是加入了人体关键点标定,完成更加精确的人体姿态识别。除了rfcapture是纯用信号处理生成热度图之外,其余均是信号处理加深度学习的方法。应用面介绍的都不多,主要就是在vr上,没有体现出这项技术的优势。
陆宇(PPT汇报): PPT下载 汇报了目标检测的相关工作
王碧(PPT汇报): PPT下载 汇报了被WiFi呼吸检测的相关工作并复现了实验。


2022年1月16日星期日

会议记录
会议方式: 线下会议室
参会人员: 章翔,颜焕,汪彦彤,李江安,翁一冰,陆宇,樊文东,王萌,赵鹏,黎歆雨,王晨巍,陶斯颖,朱亚男,吴纯
会议内容:
章  翔: PPT下载 IJCAI论文已提交,汇报了TAC论文与ACM MM论文的时间表以及安排。总结了论文修改意见,要考虑任务间的不同点进行交互,采用修改当前的标签噪声处理方法,基于网络结构设计噪声处理方法等,列出了时间表。
黎歆雨、王晨巍: 修改贝叶斯和神经网络模型,对之前的真实数据做了测试,生成了随机数据进行尝试,更换两种决策树模型对之前的数据进行测试,效果比较好。
王  萌: 主要准备考试,并对之前汪院所需的调研PPT进行了准备,调研了华米公司的健康产品信息,以及当前国际主流公司的健康产品。
汪彦彤、翁一冰、陶斯颖: PPT下载 对数据训练-测试集数据分布进行了相关性分析,对应每个A值点,误差结果为z = power((pre-ground),2);%计算误差 预测-真实值的平方,与Dir代码中保持一致。数据为同一Arousal值,对应的train样本量 与 dev误差之间的相关性,结果:直接计算后,pearson相关系数为正数。对数据采用了标签平滑方法进行了处理,获取了结果进行了分析。陶斯颖协助汪彦彤进行修改baseline代码,调研了一些使用深度神经网络对CSI信号进行压缩和重建。
颜  焕: PPT下载 汇报论文“Transferable Curriculum for Weakly-Supervised Domain Adaptation”关注问题为源域的样本噪声和跨域中的分布迁移。介绍了课程学习的思想,主张让模型先从容易的样本开始学习,并逐渐进阶到复杂的样本和知识。给不同难度的训练样本分配不同的权重。初始阶段,给简单样本的权重最高,随着训练过程的持续,较难样本的权重将会逐渐被调高。这样一个对样本进行权重动态分配的过程被论文称之为课程(Curriculum),课程初始阶段简易样本居多,课程末尾阶段样本难度增加。当测试数据与训练数据分布不同时,课程学习并不有效,小损失值的样本仅代表无噪声,并不与测试数据相关(域偏移)

  • 由此本文解决了两个依赖的子问题:
    • 在给定的可迁移课程中学习
    • 构建理想的可迁移课程
  • 本文的缺点为:
    • 当源域类不平衡时,不同类别的损失值的大小存在差异,构建的课程在选择可迁移性和容易性样本时存在偏差。
    • 总的思想是在每一轮迭代时假定损失值小的作为容易样本,但是每一轮迭代时样本损失值必然存在波动。
    • 超参数计算需要交叉验证,计算最优解困难。

陆  宇: PPT下载 汇报了被遮挡物体检测的相关工作。
吴纯、李江安、樊文东: 使用matlab仿真了leach路由协议和无线传感器网络中的kmeans聚类算法,看了一篇最新的使用粒子群优化算法对leach路由协议的改进论文。
朱亚男: 准备笔试。
赵  鹏: 准备数值分析考试。


2022年1月9日星期日

会议记录
会议方式: 线下会议室
参会人员: 章翔,颜焕,汪彦彤,李江安,翁一冰,王碧,陆宇,樊文东,王萌,赵鹏,黎歆雨,王晨巍,陶斯颖
会议内容:
章  翔: PPT下载 主要汇报了IJCAI论文的完成情况,基本完成了初稿,会议上讨论了部分关键性的部分写作。确定了下一步的论文拓展计划,利用分支之间的关系添加不确定性压制模块,实验发现:粗细分支准确率相乘结果低于测试准确率,如CA:80%,FA:90%,FRA:80%,说明两者不是独立分布的,下一步将利用该发现进行一些工作。
黎歆雨、王晨巍: PPT下载 王晨巍论文汇报 对于6 个属性的10类分类数据集,每个属性属性值为0-100的整数(10990条数据)进行的混合型朴素贝叶斯分类,取得了90.57%和85.33%的准确率。对于17 个属性的2分类数据集,包括离散型和连续型数据(1000条数据)进行的混合型朴素贝叶斯分类,取得了89.18%和86.72%的准确率。对于波士顿房屋价格与影响因素,包括连续型和离散性数据ANN拟合非线性曲线取得了94.6%的预测准确率。下一步将随机生成数据增加数据量到两千或更高,确定打分规则后,重新打分尝试,根据最后给出的数据形式:属性值,由若干属性值得出的总项分数,重要性和脆弱性总分,调研新的模型尝试。王晨巍汇报了“WiMate: Location-independent MaterialIdentification Based on Commercial WiFi Devices”论文,对系统目标,理论基础和实验流程等进行了报告。当前存在的问题为不知道对方的具体需求是什么,只能采用生成的数据.
王萌、赵鹏: PPT下载 对CSI相位误差校正进行了汇报,发现近距离胸部运动检测时,不同天线对得到的CSI商的复平面曲线差异较大,运动引起的相位差不一致。进行了原因分析,认为原因为近距离运动分析时,不同区域电磁波强度不一致,越靠近低次菲涅尔区,动态分量的振幅越大。因此动态分量振幅不能视为常量。商模型对于解决当前的问题存在不足之处,解决思路为更换相位校正模型和在商模型基础上进行建模。探索在动态分量振幅变化的情况下,如何去除相位噪声的同时提取相位差。在近距离情况下CSI-Ratio仍然可以去除振幅噪声和相位噪声,但是需要对分母变量进行放松。赵鹏调研了相关跨域的论文“Domain-Adversarial Training of Neural Networks(DANN)”,该论文基于对抗网络利用梯度反转层实现跨域学习。
汪彦彤、翁一冰: PPT下载 翁一冰对于数据集中样本的VA空间进行了调研,绘制了样本在VA空间的各种分布图,单样本和全数据集均进行了统计研究。结论为数据确实服从长尾分布,可以利用此前调研论文的方法进行一些工作,翁一冰调研了回归问题中的不均衡问题的最新解决方法“Delving into Deep Imbalanced Regression”,该方案发现年龄数据集与分类数据集之间关于样本量和预测误差之间的差别,并利用标签平滑分布的方法解决该问题。
颜  焕: PPT下载 完成基于WiFi的人体行为识别实验,下星期可将论文进行投稿,调研了跨域噪声相关论文,阅读相关多模态融合文献。下周将关于WiFi论文修改好投出去,总结跨域噪声方向论文,拟定下一步研究计划,后续在WiFE论文录用之后将继续调研多模态情绪识别研究,完善WiFE。
王  碧: PPT下载 汇报了场景文本检测的相关调研工作,当前的项目背景为利用摄像头数据来定位摄像头位置,由于ip地址的定位精度低,因此需要其余手段辅助定位。王碧汇报了当前野外文本检测识别的相关工作,当前的工作主要是基于此前的Mask-RCNN,Faster-RCNN等工作的各种拓展,主要汇报了ECCV的两篇相关论文,以及解决方法。
陆  羽: PPT下载 汇报了目标检测相关的调研工作,当前最先进的模型为YoLo的各种型号,该模型识别速度较快。当前项目存在的问题为不知道具体所要检测的目标的具体类型,因此需要获取部分实际数据集进行前期调研。
陶斯颖: PPT下载 汇报了课题中面部表情这块研究的相关调研工作,包括VGGFace,该模型为基于VGG16的人脸识别模型,以及ResNetFace,SENetFace等模型,此前工作未finetune该模型存在错误。
李江安、樊文东: PPT下载 仿真了AODV网络和DSDV网络的路由过程,发现配置不支持把多个网络并在一起仿真,一次只能选择一种网络。把不同路由协议的节点放在一个ned文件中,连接起来,仿真的时候会报错。调研了论文“A Novel Cluster Head Selection Method based on K-Means Algorithm for Energy Efficient Wireless Sensor Network” 为了使无线传感器网络的能量效率最大化,论文提出了一种基于K-means算法的高效聚类头选择方法。它是基于寻找簇头的概念,使簇头与成员节点之间的欧氏距离之和最小化。 后续将基于该论文改进发表论文。


2021年12月26日星期日

章  翔: PPT下载 对于睡眠监测调研以及研究状况ppt进行了工作分配,内容与王萌组所做项目相吻合,因此主要由王萌和赵鹏进行整合。生理信号调研王萌论文已经进行过调研,实验室研究项目分别由章翔(Wital),汪彦彤(SleepGuardian),王萌(SpiroFi)提供相应资料。下一步工作计划为完成IJCAI论文投稿以及TAFFC大修。
颜  焕: PPT下载 完成了会议论文投稿;阅读相关噪声跨域文献,不过是粗度调研;阅读相关多模态融合文献,进行了粗度调研,大论文最后一点工作需要完善,大论文最后工作为基于WiFE数据集的多模态情感识别。对于下一步工作,将继续完善基于WiFi的人体行为识别论文(sensors journal被拒那篇),放假之前投稿;扩充投稿会议论文,预计在ICME会议出结果之前扩充完成;将继续调研噪声跨域方向论文,争取下一阶段任务有所突破。

汪彦彤:(口头)完成基于中文数据库的Bert和Albert模型代码复现; 国科大项目预算编写。

王  萌: PPT下载 调研论文“WiPhone: Smartphone-based Respiration Monitoring Using Ambient Reflected WiFi Signals”,该论文利用手机进行呼吸检测,手机CSI噪声更大,只有一根天线因此去除时变相位偏移困难;而且手机移动性更强,遮挡导致不存在直接反射路径。本文主要贡献为首次利用手机进行呼吸检测,进行了针对NLOS的环境反射模型建模,基于聚类算法,去除信号噪声且对该算法的参数进行自适应选取。下一步工作计划为改进SpiroFi论文,进行可行性分析实验,针对模型过于简单的问题建立物理模型并应用于CSI,引入新的降噪算法,分析参数,并选择最优参数并在网络模型方面解决位置相关性、朝向问题。

朱亚男: (口头)处理实验室事务。

李江安、吴纯: (口头)最近在做omnet仿真,跑了DSDV路由仿真,在想怎么把几种不同路由协议合在一个大的仿真里面,看omnet和inet官方文档学习怎么仿真。

陆  宇: PPT下载 调研论文“Towards IP-based Geolocation via Fine-grained and Stable Webcam Landmarks”,认为与国防科大项目关联不大,针对国防科大项目进行调研,主要针对摄像头图像关键信息提取技术进行调研。

王  碧: PPT下载 “Zero-Effort Cross-Domain Gesture Recognition with Wi-Fi”,对于采用的CSI处理技术,从DFS到BVP进行了研究,并进行了部分实验。调研国防科大项目的IP定位技术,调研了了一种无需任何测量就能高效开采高质量地标的方法(ONE-Geo Alpha),并说明了具体步骤。针对图像检索技术进行了调研,由于视觉地点识别技术(Visual Place Recognition,VPR)或者基于图像定位技术(Image-based localization,IBL)通过输入某一地点的单张或多张图片与街景数据集做对比,计算之后输出与地图库中相似度最高的若干个地点的坐标与概率,该任务可以视为一个图像检索任务。调研了图像检索技术常用数据集以及主流方法。

翁一冰: (口头)复现论文MuSe-Wilder,实现了特征提取部分提取音频特征的VGGish模型,后续将继续实现PANNs和wav2vec模型。

黎歆雨、王晨巍: PPT下载 采用了多种方法对数据进行了分类,混合型朴素贝叶斯分类针对17个属性的二类分类数据集,包括离散型和连续型数据(1000条数据)的数据集分类的准确度为85.33%(使用目前的数据集,增加数据数量可以提升准确率,但最高不超过90%,需要再调研新的数据集尝试效果)。ANN拟合非线性曲线针对波士顿房屋价格与影响因素,包括连续型和离散性数据的数据集预测准确率为94.6%。BP神经网络拟合非线性曲线的工作仍然在进行中。

陶斯颖: PPT下载 对论文“Multimodal Emotion Recognition and Sentiment Analysis via Attention Enhanced Recurrent Model”进行复现,汇报了复现进度。当前确定了对Muse-Car数据集视觉特征提取技术方法,先是用OpenFace toolkit从原始视频同提取对齐的人脸,然后将带有时间标记的人脸图片输入到VGGFace、ResNetFace、SENetFace和EmoFAN网络中,分别提取高级的人脸面部特征。上周完成了OpenFace对视频中人脸是提取,运行了3天总计生成322G,已经转移到服务器上准备进一步处理。本周的周一至周三在复习准备考试,之后的时间在重装服务器系统、恢复原来的环境,对OpenFace提取的人脸图片进行筛选和配置4种网络模型的环境,以及写算法实验作业

樊文东: (口头)学习omnet软件的使用,学习并修改GPSR和AODV等路由算法源码,尝试令不同协议的网络间进行通信。

赵  鹏: (口头)网站最终版,链接,为spriofi测试新网路


会议记录

2021年12月12日星期日

总:每周汇报须用PPT
章  翔: BIBM报告完成,IJCAI图与实验表完成
颜  焕: 论文基本完成
汪彦彤: 周一汇报(翁一冰)
王  萌: 考试
李江安、吴纯、樊文东: 论文思路汇报受控安全路由设计,将标识并入中转协议完成指标,证明支持四种路由协议,下周继续汇报设计计划与目标完成
陆  宇: 看论文
王  碧: 看论文
赵  鹏: 完成网站部分,已可访问链接
黎歆雨: 软件历史记录部分,打包
王晨巍: 调研Bayes分类
陶斯颖: baseline论文与代码运行


2021年12月5日星期日

总:确定实验室管理条例,进行实验室管理员任命,结果详见
颜  焕:完成论文初稿,下周进行实验休整与论文修改
章  翔:汇报实验进度,确定论文思路与写作思想
汪彦彤:源代码复现尝试失败,找到了简易版代码
朱亚男:找工作