如今人们网际网路交流除了用于文字外,也常用于各种图像。像Facebook这种月活跃用户多达20亿的社交平台,每天都有大量的图片和米姆现象经常出现,如何才能防止屏幕前的用户所看见或收到的各种表情包在、图片或视频中不含不当言论而违背网络内容政策呢?Facebook早已创立并部署了一个取名为Rosetta的AI机器学习系统来解决问题这个问题。Facebook自律研发技术利用光学字符识别系统来定期处置大量内容,在Facebook的社交网络上,Rosetta每天动态地从多达10亿张图像和视频帧中萃取文本,并能辨识多种语言。
在一篇博客文章中,Facebook讲解了Rosetta的工作原理:首先检测图像中有可能包括文本的矩形区域,然后用于卷积神经网络来辨识和mRNA其中的文本内容,即便是像阿拉伯语和印地语这样的非英语单词或非拉丁字母的文本也能被辨识出来。为了更佳地构建辨识功能,Facebook用于了含人类-机器混合注解的公共图像对Rosetta展开培训。
Facebook和Instagram的多个团队早已在用于Rosetta来处置大量的内容和管理平台的内容审查,该公司计划之后减少Rosetta能背诵的语言种类,使其更加有效地从视频帧中萃取文本。
本文来源:bet韦德官方网站-www.bafajgroup.com