每天可审数亿张图片 AI解放人工鉴黄师

2018-08-22 爱比价妈妈-能让你省钱的网站

高凉说

  随着AI(人工智能)的发展,人工鉴黄师逐渐从鉴黄行业里被“解放”出来。

  “AI鉴黄师每天可审核数亿张图片,识别准确率高于99.5%。”阿里安全部高级算法专家威视向第一财经记者举例称,如果一天要审核4亿张图片,单纯由人工来审,一人一天审1万张,需要4万人,而AI鉴黄只需将其中20万张可疑的图片筛出来,由人工再审一道,只需要20人即可。

  传统的人工鉴黄师通过一双肉眼鉴别色情图片和视频。听起来像是“福利”,但实际上并不轻松。如今,伴随着互联网上社交媒体、直播、短视频的发展,每天光上传的图片就超过10亿张,发文数量超过5亿条,不少色情、暴力等内容充斥其中。

  2015年10月,阿里巴巴“绿网”上线,用人工智能识别网络上包括色情、暴力在内的违规信息,阿里AI鉴黄师应运而生。通过人工智能、深度学习和大数据样本等技术,阿里巴巴的AI鉴黄师训练识别千万张正常图片与色情图片,最终生成一个智能鉴黄模型。

  第一财经记者了解到,阿里的鉴黄AI做的色情图片检测,从原理上来说,就是一个典型的图像分类问题。当前的解决方案是标注样本后,使用深度学习技术训练一个人工神经网络。具体步骤包括明确分类标准→收集样本→样本打标→模型训练,四个步骤。其中前三个步骤主要由人工完成。

  “我们要做的就是拿图片去‘喂养’它,让它不断学习,变得越来越聪明。”威视表示,最初在获取样本时,阿里筛选了近2000个网站、6000多万张色情图片,经过去重,标注1300多万张高质量的色情图片。之所以严格把握样本打标的过程,是因为深度学习,对高质量的标注数据有很高的要求。数据标志质量越高,最后模型的精度就会越高。

  由人类经过千挑万选建立起来的高质量“色情图片”数据库,最后交由模型训练。威视表示,GPU机器单机单卡的情况下训练时间要近一个月,后来阿里团队更换了网络结构并实现了多机多卡训练,将千万级别样本的训练时间控制在一周左右。

  不仅仅在识图领域,威视告诉记者,AI鉴黄还覆盖到了语音、视频等多媒体领域,目前已经可以识别中文、英文、日文、俄文等语言,还可以识别中国多省份方言,无语义的呻吟声也能识别。

  这离不开阿里在AI领域的布局。

  2017年底,阿里云总裁胡晓明首次全面揭幕了阿里产业AI布局和生态:以阿里云为基础,从家居、零售、出行、金融和智能城市、智能工业六大方面展开的产业布局,以及从视觉、语音、算法到芯片构建的立体合作伙伴生态。

  在学术和开发者方面,在阿里的体系中,已经有2所大数据国家工程实验室,天池平台聚集了11万+数据开发者,AUCP(阿里云大学合作计划)计划让大数据、AI相关课程部署到了307所中国大学。

  第一财经记者了解到,在时间分配上,阿里很多科学家都是三三制,跟业务的紧密沟通占到三分之一的工作时间,还有三分之一是用来带领团队,另外三分之一用来跟踪全球最新、最前沿的技术发展趋势,为团队规划研发方向。

网友评论
 验证码
 

大家都在看
乐视公布67亿债务解决方案 贾跃亭还钱指望不上汽车

乐视公布67亿债务解决方案 贾跃亭还钱指望不上汽车

乐视网(300104.SZ)8月21日晚公布了解决债务问题的最新进展。乐视网已经与非上市体系认定了债务规模约67亿左右,由于以债权转让、资产...

二季度业绩下滑 现在的腾讯被低估了吗?

二季度业绩下滑 现在的腾讯被低估了吗?

8月15日公布的第二季度业绩不如预期,8月16日盘中一度跌破320港元,连续反弹四天后,成交一天比一天萎缩,腾讯控股(00700.HK)后续...

《如懿传》不如意 出品方新丽卖身阅文集团后再失利

《如懿传》不如意 出品方新丽卖身阅文集团后再失利

来源:北京商报迟迟未能播出的《如懿传》,终于在8月20日晚间正式与观众见面,但首日播出就栽了个跟头,不仅广告问题引发观众反感,服化道、内容剧...

微软:俄国想用黑客手段攻击参议院和保守主义智库

微软:俄国想用黑客手段攻击参议院和保守主义智库

原标题:微软:俄罗斯人想用黑客手段攻击参议院和保守主义智库[环球网报道记者查希]美国有线电视新闻网(CNN)8月21日报道称,美国微软公司声...

房租上涨另一面:长租公寓ABS的百亿江湖

房租上涨另一面:长租公寓ABS的百亿江湖

每经记者聂虹    每经编辑叶峰 &nbs...

格列卫:一个神药的传奇——愿病者有其药

格列卫:一个神药的传奇——愿病者有其药

来源:我是科学家iScientist这两天,徐峥与宁浩共同监制,徐峥亲自主演的一部喜剧电影《我不是药神》刚刚在全国院线正式上映。这部在点映阶...

海尔热水器突然爆炸 3岁女童脸被烫伤构成6级伤残

海尔热水器突然爆炸 3岁女童脸被烫伤构成6级伤残

本文来自法制晚报法制晚报·看法新闻(记者周蔚)母亲在家给三岁女儿洗澡时,海尔热水器突然爆炸,母女俩全身被烫伤,女童面部瘢痕严重构成六级伤残,...

空姐乘滴滴遇害嫌犯已锁定 曾微信同事称司机想亲她

空姐乘滴滴遇害嫌犯已锁定 曾微信同事称司机想亲她

澎湃新闻记者彭瑜5月10日,澎湃新闻从知情人士处获悉,郑州警方已锁定“空姐乘坐滴滴顺风车遇害”案嫌疑人,正全力抓捕。据遇害空姐李某家属的朋友...

比特大陆“暴利经”:靠挖矿机年入百亿元

比特大陆“暴利经”:靠挖矿机年入百亿元

本报记者陈佳岚李哲北京报道炙手可热的比特币让相关设备制造商赚得“盆满钵满”。北京比特大陆科技有限公司(以下简称“比特大陆”)是一家初创公司,...

“国产三文鱼”这样检测寄生虫!用显微镜吗?

“国产三文鱼”这样检测寄生虫!用显微镜吗?

来源:饮食参考公众号龙羊峡的养殖淡水虹鳟鱼在市场上冒充大西洋鲑(真三文鱼)已有多年,一直都是闷声发大财的状态。最近不知道搭错了哪根筋,非要到...

闲鱼的困惑:买家遭遇交易“陷阱” 维权成本高昂

闲鱼的困惑:买家遭遇交易“陷阱” 维权成本高昂

李甜李静不到10分钟,清华大学运维工程师高英凯向《中国经营报》记者展示的一台苹果笔记本电脑,在未充电的情况下,电量由开机时的26%自动上升至...

首支公益无人机救援队成立 京东:就近调配自营物资

首支公益无人机救援队成立 京东:就近调配自营物资

新浪科技讯5月11日上午消息,中国灾害防御协会与京东集团签署关于无人机参与救援工作的合作协议,这标志着着首个全国性公益无人机救援队正式成立。...

长生生物科技公司狂犬疫苗造假引众怒 竟然还有前科

长生生物科技公司狂犬疫苗造假引众怒 竟然还有前科

记者粟灵  编辑 王芳洁正当《我不是药神》引发的医药产业大讨论如火如荼之际,一则关于狂...

松下考虑出售苏州生产厂 交易价格或超4.5亿美元

松下考虑出售苏州生产厂 交易价格或超4.5亿美元

...

链家上线行业公开平台“贝壳找房” 安居客如何应对

链家上线行业公开平台“贝壳找房” 安居客如何应对

本报记者 祁三连 北京报道“任何一个公司讲一个故事走不通,转到另外一个故事,这都会对内部产生巨大的投资成...

淘宝天猫优惠券、奇趣发现、9块9、天天折扣尽在

爱比价妈妈-手机版-电脑版-文章首页