新浪科技讯 6月26日下午消息,近日知乎社区治理团队公布了知乎在识别阴阳怪气类内容上的解决方案。
阴阳怪气可用“杠精”这个词来指代,通常以“不针对发言内容,而是批评对方的语气”以及“提出反对意见,但不给或给出极少数论据支持”这两类常见言论为代表,此类评论极大了伤害创作者和交流者的体验,但难以解决。
解决阴阳怪气类评论的难点核心主要在于网络语言的复杂性,情感分析不同于普通文本分析,例如经典的“呵呵”,由于双方不同关系、说话的不同场景和时间都会带来迥然不同的表意。即便是人工判定都存在标准化难度,算法模型的训练挑战就更为艰辛。
据介绍,在过去一年里,知乎优化了算法机器人“瓦力”,着力挑战识别阴阳怪气这一情感分析领域的传统难题,通过综合使用情感模型、用户亲密度模型和文本识别模型,其识别准确率得以大幅优化,已超过大部分人工判断。
知乎还将在近期对该技术进行产品化尝试,向用户提供“瓦力”阴阳怪气智能过滤选项,同时,还将对“瓦力”进行更多训练,提升准确率和召回率,最终将阴阳怪气识别技术全面应用到社区治理中。
“瓦力”最新的阴阳怪气技术方案:首先通过知乎社区里的举报、反对等负向用户行为收集训练数据。然后通过各种同义替换、规则模版方式对训练数据进行扩展,以缓解训练数据稀疏的问题。同时,“瓦力”提取文本、句法、表情符等特征,并利用一个带attention的CNN和LSTM的融合模型进行分类,最终判断出内容是否为阴阳怪气。
优化技术方案后,“瓦力”已能实现对“暗藏玄机夸奖”(忍不住关注答主了,你的答案很有水平!你博士快毕业了吧!)、“好为人师”(我觉得你挺惨,虽然长这么大了,还真应该回小学改造)、“强行反驳”(你开心就好、请开始你的表演)等数类阴阳怪气内容的识别。而根据知乎社区治理团队的调查,用户最反感的阴阳怪气言论大多属于这些类型,“瓦力”在处理网络言语暴力上取得了阶段性进展。
对于饱受网络暴力困扰的用户而言,阴阳怪气识别技术能够让用户更舒适地参与网络讨论;从行业角度看,这一技术创新也极具开创性与示范效应。 (宵寒)
原标题:全球科技巨头本周将专门开会讨论用户隐私数据安全问题【TechWeb报道】6月26日消息,据国外媒体Axios报道,信息技术产业理事会...
来源:中国科学报估测人类基因组中基因数量的最早尝试涉及喝醉酒的基因学家、美国纽约冷泉港的一个酒吧以及纯粹的臆测。那是2000年。当时,人类基...
新浪科技讯北京时间6月26日消息,日本宇宙航空开发机构(JAXA)宣布,历经4年半的漫长旅程,该国最新的小行星取样返回探测器“隼鸟2号”即将...
来源:学术经纬原标题:Nature子刊:基因疗法新进展!CRISPR技术有望治疗自闭症CRISPR基因编辑技术被誉为是本世纪至今最有潜力的生...
新浪科技讯北京时间6月26日早间消息,马斯克支持的人工智能(AI)研究团体OpenAI表示,他们制作了一款能够在游戏Dota2中击败5名技术...
澎湃新闻记者彭瑜5月10日,澎湃新闻从知情人士处获悉,郑州警方已锁定“空姐乘坐滴滴顺风车遇害”案嫌疑人,正全力抓捕。据遇害空姐李某家属的朋友...
本文来自法制晚报法制晚报·看法新闻(记者周蔚)母亲在家给三岁女儿洗澡时,海尔热水器突然爆炸,母女俩全身被烫伤,女童面部瘢痕严重构成六级伤残,...
来源:饮食参考公众号龙羊峡的养殖淡水虹鳟鱼在市场上冒充大西洋鲑(真三文鱼)已有多年,一直都是闷声发大财的状态。最近不知道搭错了哪根筋,非要到...
本报记者陈佳岚李哲北京报道炙手可热的比特币让相关设备制造商赚得“盆满钵满”。北京比特大陆科技有限公司(以下简称“比特大陆”)是一家初创公司,...
来源:界面新闻作者:彭新2月12日,知乎上线了两个答题类产品。一个是知乎App端的“知识之王”答题闯关游戏,另一个则是微信小程序端“知乎答题...
新浪财经讯由新华社瞭望智库、新华社《财经国家周刊》共同主办的“2017中国新金融高峰论坛”于12月9日在北京举行。主题为“回归本源,优化结构...
新浪科技讯北京时间12月17日下午消息,2017“复旦-中植科学奖”颁奖典礼暨第三届复旦科技创新论坛今日在上海举行,今年诺贝尔物理学奖得主雷...
每经实习记者肖达明每经记者岳琦每经编辑姚治宇为筹划购买传媒行业资产,巴士在线11月27日起停牌,然而在12月9日,这一重大事项突然被宣布夭折...
来源:杭州交通918(原标题:900多块的机票,退票要收1000?!航空公司却说…网友愤怒了!)杭州的小金姑娘反映,她明年1月20号有事要到...