我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:2019全年资料大全正版 > 翻译记忆 >

百度输入法80上线!带你深挖一大技术突破与两项全新功能

归档日期:05-30       文本归类:翻译记忆      文章编辑:爱尚语录

  【TechWeb报道】1月17日消息,今日百度在京举办了主题为“AI输入,开启全感官输入时代”的发布会,百度输入法8.0版本于今日正式上线,依托于百度在语音技术的最新突破,全新的功能孕育而生语音速记、AR表情。接下来我们先从用户关心的两大新功能谈起。

  语音速记功能,其实这个功能百度在去年的世界大会上就秀过,Robin在现场的演讲都在两侧的大屏幕中得到记录与展现。此次百度将这个AI能力开放给了输入法。

  在语音速记功能中,又分为单人与多人两种模式,在多人模式下,利用百度的声纹识别技术,能将不同对话者进行分开标注,让速记页面得到更直观的显得。录音结束后,可通过文字的形式进行复制或分享。对于文字工作者来说,这是一个极富价值的功能,大大省去了录入所耗费的时间成本。

  在现场测试中,速记功能在58秒内准确无误识别并记录了426个字,其中涵叠字、中英混合等语句,完全超过了专业速记员的水准。

  另一大功能AR表情则是结合了百度人脸识别及AR技术而成,制作表情包、虚拟形象可谓样样精通,并与桃花坞等国内非物质文化遗产达成了合作,将表情包内融入了更多古典元素(年画、戏曲、风俗)。

  据百度给出的数据统计,目前百度输入法使用人群70%为90后,斗图成为了他们生活中发泄的一种方式,AR表情的上线,是图库素材较少用户的福音。结合了人脸识别功能,在一些家庭场景应用下(如拜年),既能活跃气氛又不显浮夸。

  除了上述两项新功能外,百度输入法此前还上线过语音修改、语音翻译、语音轻声识别、场景化语音识别、语音联想表情、OCR扫描输入6大功能。不难看出百度正在从更懂中文变得更懂你!

  今日起Android用户可去百度输入法官网进行下载体验,而iOS用户还需等待苹果商店的审核。

  之所以语音速记能够有如此好的表现,离不开百度在Deep Peak 2模型上的技术突破。该技术全称为基于LSTM和CTC的上下文无关音素组合建模。

  早在几年前百度就开始利用CTC进行语音搜索系统的训练,采用5层单向LSTM模型,对上线文相关的声韵母建模,利用CTC技术训练之后采用区分度训练提升CTC训练后的模型性能。当时测试结果是,准确率提升了18%左右,解码速度提升了40%以上。

  而全新Deep Peak 2模型核心解决了国际上端到端系统建模的过拟合问题,配合中英文及口语和朗读混合建模,让语音识别的准确率变得更高。

  通俗点来理解就是,当你说:“帮我拿点东西,thanks”,Deep Peak 2模型推出的上下文无关建模,能够将音素定义为唯一的一个建模单元,这样的建模方式,让语音输入有了更高的中英文混合识别能力。

  同时,Deep Peak 2采用了CI的音素组合建模,建模单元数目减少了10倍之多,意味着路径解码部分的消耗也将降低10倍,从而提升交互的流畅度。

  或许有些人觉得,AI技术应用到这种层面就已经足够了,但百度告诉你,未来想象的空间还有很大。如VR体验上,现如今多数VR在操作上略显粗糙,未来利用AI技术,能够对眼神进行捕捉,将体验上升到一个新的高度。

  从最新一代的输入法中,我们也看到了百度正逐渐在应用层落地着自家的AI成果,其品牌与价值也在被AI一点点重塑着,随着商业化的逐步落地,将会对百度在未来十年中产生巨大影响。

  【TechWeb】5月27日,IDC最新发布的《中国人工智能软件及应用(2018下半年)跟踪》报告显示,2018年中国人...

  新浪科技讯 5月26日下午消息,2019年中国国际大数据产业博览会在贵阳举行,在“数字经济:数字产业化...

  想象一下,有人通过窃取您的Facebook个人资料照片创建了一个伪造的视频。幸运的是,坏人还没有掌握这种技术...

  【TechWeb】5月24日,人工智能自适应学习引擎松鼠AI创始人栗浩洋在今天的“AI+智适应教育峰会”...

  【TechWeb】5月24日消息,人工智能不仅可以提高人们工作效率,减少重复劳动,而且还可以扩展人类在美学上...

本文链接:http://buggystordera.com/fanyijiyi/316.html