新浪科技讯 北京时间4月16日早间消息,谷歌研究人员开发了一种深度学习系统,可以帮助电脑在嘈杂环境中更好地识别和区分一个人的声音。
本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——就像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。(思远)
新浪科技韩大鹏360公司回归A股前后,已“折损”了多员大将。在其公布的高管名单中,COO陈杰、CFO姚珏和副总经理廖清红相继离开。昨晚,36...
新浪科技讯北京时间4月16日早间消息,马克·扎克伯格(MarkZuckerberg)对Facebook的严密控制正受到越来越多的关注。投资者...
新浪科技讯,北京时间4月16日消息,为了使科技与电影的结合更加紧密,大力发展电影科技,加大科普电影的创新能力,在第八届北京国际电影节举办之际...
新浪科技讯北京时间4月16日早间消息,据彭博社报道,世界最大智能手机与半导体制造商三星或将使用加密货币背后的技术来管理他们庞大的全球供应网络...
新浪科技讯北京时间4月16日早间消息,继Facebook首席执行官马克·扎克伯格宣称,无论人们是否在其网站拥有账户,世界上最大的社交网络都会...
近日,有不少消费者向记者发来邮件,声称近日很多店铺出现了内部优惠券,那么这些内部优惠券是怎么回事?这些淘宝内部优惠券是真的吗?会不会有病毒?...
昨晚芭莎慈善夜,网友感慨看了几出大戏,但是让人没想到的是通过《欢乐颂》爆火的22楼五美之间好像出了什么问题,相比较隔壁组小时代姐妹花五人台上...
这两天,所谓“莫言提案”刷爆了朋友圈。取消小考、中考和高考,12年义务教育改10年(现行9年),学习西方先进,自由选择大学和职业学院。结合最...
虽然上周《我们相爱吧》结束了。但大家对潘玮柏吴昕的关注没有消减。并且为了弥补大家的遗憾(我觉得是),据江苏卫视导演称:今晚十点。腾讯视频有未...
相信开车的朋友都知道驾驶证每个周期有12分但对于某些爱打晃晃的司机朋友来说12分完全不够用啊为了避免分被扣完很多人想到了找朋友代扣分或花钱销...
毛泽东思想回归,不是时代的倒退!不能推倒现实历史又重来!不能否定改革开放取得的成就!即使有人想倒退也倒退不了了。因为历史没有返程票!历史不是...
2016年淘宝天猫双11红包活动专辑,优惠大家抢...
新华社沈阳12月2日电(记者罗沙、白阳) 2016年12月2日,最高人民法院第二巡回法庭对原审被告人聂树斌故意杀人、强奸妇女再审案公开宣判,...
图文:拍好茂名黄启亮带着疑问,2018年3月16日,我们专程驱车前往湛江市遂溪县官湖村了解情况。官湖村,位于遂城镇,距离县城10公里,开车不...