计算机系师生11篇论文被IJCAI’2016会议录用

日前,计算机系有11篇论文被人工智能领域高水平国际会议IJCAI’2016(CCF推荐会议A类)录用。其中智能技术与系统国家重点实验室有10篇论文被录用,人机交互与媒体集成研究所有1篇被录用。以下是被录用论文简介。

 论文“Agreement-based Joint Training for Bidirectional Attention-based Neural Machine Translation”(作者:程勇、沈世奇、刘洋、孙茂松等)针对双向基于注意力的神经机器翻译提出了基于一致性的训练算法,提升了双向翻译的准确率。

论文“Max-Margin DeepWalk: Discriminative Learning of Network Representation”(作者:涂存超、张惟诚、刘知远、孙茂松、栾焕博)提出Max-Margin DeepWalk算法,能够综合考虑社会网络中的节点标签信息,使网络表示学习模型更具区分能力。

论文“Knowledge Representation Learning with Entities, Attributes and Relations”(作者:林衍凯、刘知远、孙茂松)面向知识图谱的表示学习问题,综合考虑实体、属性和关系等三类信息,提出一种新的知识表示学习模型,在关系预测、实体预测和属性预测等三个任务上的性能均较以往模型有显著提高。

论文“Representation Learning of Knowledge Graphs with Hierarchical Types”(作者:谢若冰、刘知远、孙茂松)针对知识图谱实体和关系的表示学习问题,考虑知识图谱中丰富的实体层次类别信息,提出Type-embodied Knowledge Representation Learning (TKRL),有效提升了知识表示、特别是长尾实体的表示能力。

论文“Rating-Boosted Latent Topics: Understanding Users and Items with Ratings and Reviews”(作者:谭云志、张敏、刘奕群、马少平等)提出商品的“可推荐性”概念,创新性地基于boosting的方式将表现商品可推荐性的特性分布与用户的偏好分布联接在同一个空间上,同时利用用户评分和评论内容进行协同推荐。在来自Amazon的26个不同领域真实数据集上的实验表明,与目前已有的最好方法相比,该模型可以显著地提升评分预测和商品推荐的准确度,特别是对于历史评分较少的用户具有明显的效果,可帮助推荐系统应对冷启动和数据稀疏性问题对个性化推荐带来的挑战。

论文“Multi-grained Role Labeling Based on Multi-modality Information for Real Customer Service Telephone Conversation”(作者:马为之、张敏、刘奕群、马少平等)研究大规模语音客服数据中的角色标注问题。大数据条件下的智能客服数据分析在了解用户需求,提高产品质量,提升用户满意度等方面有重要的应用背景,角色标注是其中的一个基础性工作。而真实条件下对话场景中的噪声环境、说话人非特定人群、自由表达方式、随时打断与插话等难点,为句级别的对话内容角色标注带来极大挑战。本文创新性地综合利用对话中的底层声学信息和文本语义等多模态特征,对语音对话内容进行多粒度标注,将角色标注精度从78.5%提升到90.4%,为进一步智能客服分析提供基础。

论文“Pay Me and I’ll Follow You: Detection of Crowdturfing Following Activities in Microblog Environment”(作者:刘玉利、刘奕群、张敏、马少平等)发现了微博环境中以“关注换酬劳”为特征的一种新作弊形式,与传统关注作弊中的作弊者大都为受人操控的“僵尸账号”不同,这类作弊是由希望获得灰色收益的“正常”用户完成的,因此识别方面有很大的困难。论文基于作弊意图扩散的思路提出了一整套识别该作弊方式的方法框架,并在真实微博数据中取得了很好的应用效果,算法的F 值达到0.9以上。

 论文“Understanding Crowd Scene based on Coherent Recurrent Neural Networks”(作者:苏航、朱军、董胤鹏、张钹等)研究复杂环境下的群体运动模式分析和场景理解问题。相比于个体运动,群体运动由于其固有的非线性特点和目标间的相互作用关系,具有更为复杂的动力学特性。针对这一问题,本文通过分析群体运动自身的特点,对传统的递归神经网络模型进行改进,提出了相干长短时记忆网络模型(Coherent Long Short Term Memory),对群体的动力学特性进行建模,将其映射为高维空间中的特征描述,进而实现复杂态势分析和理解。实验结果表明,本文所阐述的方法可有效实现群体运动趋势预测、群体态势估计和群体行为理解,具有重要的理论和应用价值。

论文“From One Point to A Manifold: Knowledge Graph Embedding For Precise Link Prediction”(作者:肖寒、黄民烈、朱小燕)利用流形方法来进行大规模知识图谱的表示,创造性地解决了传统方法中存在的代数过定性和几何奇异性的问题,在保持原有模型高效率的基础上,通过更好的拟合提高了表示效果。在来自 Freebase 知识图谱的重要子集 FB15K 上显著地提高了链接预测和三元组分类的准确率,特别是针对精确链接预测任务有显著的效果,可以帮助知识工程更好地服务问答系统和检索引擎。

论文“learning stable linear dynamical system with the weighted least square method”(作者:黄文炳、曹乐乐、孙富春、赵德利、刘华平)通过加权最小二乘法——启发式的近似凸优化的方法,学习出稳定的线性动态系统,从而保证所重构的时间序列的稳定性,提高时间序列的建模和仿真的性能。

论文“What does Social Media Say about Your Stress?”(作者:贾珈、林会杰、沈光耀等)通过大规模的收集用户在社交媒体上的日常言行,提出深度混合模型用以评估用户是否存在压力、压力水平、以及压力来源。在传统的压力检测模型中,通常抽取自定义特征用以训练二分类模型(有压力或没压力)。该文工作在传统方法基础上进行开创性的拓展,在自定义特征基础上进一步抽取语义级别的深度特征,用以训练考虑融合压力源相关性的多分类的Multi-task Learning模型,实现压力水平和压力源的同时预测。 

IJCAI会议(International Joint Conference on Artificial Intelligence)是人工智能领域最重要的顶级国际学术会议,始于1969年,最初每2年举行一次,从2015年开始改为每年一次。本次是第25届,将于2016年7月9日-15日在纽约召开。今年共收到2,294篇论文投稿,是历史上最多的一次,录用率低于25%。