酷科技
2019-07-17
全球首个俄语AI合成主播亮相俄罗斯
近日,在第23届圣彼得堡国际经济论坛上,中国新华社、俄罗斯塔斯社和中国搜狗公司联合推出了全球首个俄语AI合成主播。据了解,未来,它将被应用于塔斯社的新闻报道中。塔斯社是俄罗斯的国家通讯社,作为全球五大通讯社之一,对外向115个国家和地区提供新闻信息,在全球范围都具有广泛影响力。
据介绍,作为目前全球首个能真正实现AI真人影像模型构建的人工智能技术,“搜狗分身”诞生于搜狗“自然交互+知识计算”这一人工智能理念之下,是搜狗人工智能核心技术之一,同时也是AI合成主播的基础。
它通过采集学习真人的声音、嘴唇动作和表情,再结合声音合成、表情合成、唇型合成等技术对AI进行拟人化训练,便能克隆出与真人无异的AI分身,进而帮忙人类提高信息表达和传递的效率。
AI合成主播技术的迅速迭代、多语言语种的不断丰富,都离不开“搜狗分身”技术的支持。随着“搜狗分身”技术的发展,AI合成主播对数据采集的需求越来越小,目前可以在一天时间内采集完一个人所有的音频和视频素材,仅用几个小时的视频资料就可以形成一个逼真的形象。
此次由三方共同推进的全球首个俄语AI合成主播项目,将会良好地推进塔斯社在人机智能交互领域的建设,加快塔斯社在新闻播报领域的智能化进程。随着其在俄罗斯日常新闻报道中的运用,搜狗AI合成主播概念将被更多大众所认知,AI合成主播在国际上的影响力也将进一步得到扩大。
事实上这并不是搜狗第一次与世界顶级媒体的合作。早在2018年11月,搜狗就与新华社联合推出了一中一英两位AI合成主播。数据显示,这两位AI主播入职半年便已生产5100多条新闻报道,累计时长达13000多分钟。
同时这也并非搜狗的第一次国际合作,今年3月,搜狗便获得阿联酋王室的热切关注,与阿联酋阿布扎比媒体集团达成了合作,双方将共同打造全球首个阿语AI合成主播,通过多项人工智能技术帮助阿联酋实现媒体智能化升级。
未來,结合搜狗以知识计算为基础的对话和问答等核心能力,分身技术将被引入到更多行业的建设中,将能够为娱乐、医疗、健康教育、法律、金融等多个领域的多种场景赋予更强大的功能,不断实现各种“科幻到现实”的转变。
亚马逊CEO贝索斯试玩全球首款触摸式远程机器手
亚马逊CEO杰夫·贝索斯(Jeff Bezos)在拉斯维加斯的亚马逊机器人大会上控制了一对巨大的遥控机器人手(Dexterous Hand)。
这位全球首富用这双机器人手叠杯子和彩虹环,把球从一只手传给另一只手。在接过一个魔方后,贝索斯回答说:“不,谢谢,我甚至不能用我的手去做。”
贝索斯表示,反馈“很强烈”,使用它们感觉“不可思议的自然”。这双机器手可以进行24个动作,并配有129个集成传感器,可跟踪位置、力度和压力等因素。它可以举起重达5公斤(11磅)的物品。
机器人是由Shadow Robot和HaptX共同设计。 Shadow Robot专门打造机器人手,并与特斯拉首席执行官Elon Musk共同创办的AI研究机构OpenAI合作。 HaptX开发的技术为人们提供了远程操作机器人以及VR的触觉。
为了这个特殊的演示,双手还配备了由南加州大学分拆公司SynTouch制造的BioTac触觉传感器。每个传感器都包含柔软、柔韧的皮肤和指纹状的脊,覆盖一个液体填充物。当皮肤在表面上移动时,由脊产生的振动通过液体产生共振,并通过内置的水听器进行检测。这允许传感器识别纹理,并且还可以感知温度。
配备BioTec的机器人手由戴着HaptX制造的一对触觉反馈手套的用户远程控制。利用运动跟踪技术,手套能够感知佩戴者的手和手指的运动,并且它利用130个微流体触觉传感器通过选择性地按压皮肤来提供触觉。在最近的测试中,加利福尼亚州的一名操作人员远程操作了一个在伦敦的电脑键盘,通过手套上的指尖传感器检测到每一次击键。以这种方式将触摸和远程操作结合起来是突破性的,并指出未来的应用,我们可以进行远程操作,例如炸弹处理、深海工程,甚至是在不同的州执行的手术。
TensorFlow官宣新功能 攻克语言AI模型预处理偏差
谷歌发布TensorFlow优化新功能TF.Text库,可对语言文本AI模型进行周期性预处理,大大节约了AI开发者对文本模型的训练时间,简化训练流程。
TensorFlow帮助用户利用图像和视频数据构建模型。但是,许多模型是以文本开头的,从这些模型构建的语言模型需要进行一些预处理,才能将文本输入到模型中。比如关于使用IMDB数据集的文本分类教程,就是从已经转换为整数ID的文本数据开始入手的。
如果模型训练和推理的时间不一样,在训练过程以外完成的预处理可能会和模型产生偏差,这就需要额外投入更多的时间和精力对预处理的过程进行协调。
TensorFlow本次推出的TF.Text就是为了解决这个问题,TF.Text是一个TensorFlow 2.0库,可以使用PIP命令轻松安装。它可以在基于文本的模型中定期执行这些预处理过程,并提供TensorFlow核心组件中并未提供的、关于语言建模的更多功能和操作。
其中最常见的功能就是文本的词条化(tokenization)。词条化是将字符串分解为token的过程。这些token可能是单词、数字和标点符号,或是上述几种元素的组合。TF.Text的Tokenizer使用RaggedTensors,这是一种用于识别文本的新型张量。
大疆发布首款教育机器人“机甲大师RoboMaster S1”
6 月 12 日,大疆发布首款教育机器人“机甲大师RoboMaster S1”,主打以硬核科技为基础的机器人教育和机器人竞技,将教育和娱乐的元素融入机器人产品中。
这个源自RoboMaster 机甲大师机器人比赛的消费级机器人,具备准工业级硬件,拥有性能充足的中央处理器、31 个传感器、可模拟皮肤触觉的感应装甲、抖动控制精度在正负 0.02 度的云台、全向移动的底盘。
这些配置让RoboMaster S1 的大脑、感官和机体性能远超同类的教育机器人产品,同时也是一款可玩性相当高、足够酷炫的竞技玩具。
RoboMaster S1 标准套装售价为 3499 元,另有包括手柄在内的拓展包会在未来发售。该款机器支持设计自定义配件。
总的来说,RoboMaster S1 是目前消费级教育机器人领域技术集成度相当高的一款产品。它拥有性能优异的硬件和完备的基础功能,是一台真正的机器人,更重要的是它足够好玩和酷炫,有足够的吸引力驱动用户去探索现实世界。在此基础上,它拥有精心设置的视频课程和项目教程,可以让入门者保持探索学习的兴趣,并具有足够的可拓展空间,可以让用户尽情地捣鼓钻研。RoboMaster S1 的出现将大大拉低人们接触和拥有竞技、教育机器人的门槛。