快捷搜索:

“双十一”第11年,AI定义网购新玩法

科技日报记者 崔爽

“双十一”来到第11年,直播风头正劲。“所有女生”这句来自立播李佳琦的口头禅,成为直播期间的宣言,无数工资之掏空口袋。今年“双十一”时代,淘宝直播已经成为商家标配,衣饰、美妆、食物等行业商家纷繁拿起了直播对象,有人以致戏称:现在还不开直播的商号,就跟没有详情页一样。

为了更好的不雅看体验,淘宝自立研发了全新的音视频实时通信架构,实现了大年夜规模低延时直播,从本来5秒至7秒的延时低落至2秒以内,提升了用户和主播的互动效率,此外,人工智能技巧还可以实时识别主播正在解说的商品,陈设在直播页面中。

没错,期间的风吹到哪,技巧先行抵达。直播、短视频当道,这类“双十一”新弄法的背后,也有赓续进步的AI。

AI助手为主播分忧

收支直播间的剁手党成千上万,分分钟形成刷屏之势,主播分身乏术。这时刻,他的AI秘书就登场了。给主播打下手,供给主播问答、商品问答、优惠券问答等办事都不在话下,也便是说,你在直播间问的问题,大年夜多都是AI助手在解答。

据阿里巴巴达摩院资深总监、阿里巴巴集团智能办事奇迹部总经理赵昆先容,AI秘书应用了自然说话理解和基于常识图谱问答等技巧,能够正确解析直播间不雅众对付商品和主播的多种繁杂表达和问法,在直播场中实现多对一沟通的高效快速相应,大年夜比例前进直播间的客户问题的回覆率、办理率。

除了基于翰墨,AI客服还可以进行基于图片的智能问答。赵昆表示,AI客服使用图片解析算法理解图片内容,结合用户的问题,自动理解和识别截取可以回答用户的图片作为回答,并高亮图片中的正确谜底位置。今朝,智能图片问答已经覆盖了家电数码、零食果蔬、母婴洗护等多个行业。

方便了剁手党,卖家同样沾恩于AI。“双十一”时代,卖家必要在短光阴内制造大年夜量鼓吹图、海报图等,图像智能天生技巧就派上了用处。基于图像智能天生技巧,AI设计师可以改变传统的设计模式,在短光阴内完成大年夜量横幅广告、海报图和会场图的设计。卖家只必要随意率性输入想杀青的风格、尺寸,系统就能代替身工完成素材阐发、抠图、配色等耗时耗力的设计项目,实时天生多套相符要求的设计办理规划。

据阿里巴巴达摩院资深算法专家谢宣松先容,今朝该系统已经达到了高档设计师的水准,每秒可以供给几十种规划、可以设计8000张不合的海报,去年“双十一”时代,这位AI设计师就累计为20万企业、商家设计了近600万张图片,破费者在天猫网站看到的各类海报和活动商品图片险些都出自它手。

图片之外,短视频也成了标配。谢宣松先容,短视频智能设计产品基于图像智能识别技巧和视频智能天生技巧,赞助用户在极短光阴内完成大年夜量的商品营销类短视频的设计和制作。“用户只必要输入商品详情页链接或者从本地上传图片视频素材,它就可以进行图片素材解析过滤、商品理解和定位、视频素材剪裁筹备、视频剧本导演、视频衬着天生等一系列繁杂的设计事情,并可以依据用户的风格尺寸等简单的个性化要求进行输入,供给流媒体内容天生视频的办理规划。”谢宣松解释说。

机械翻译赞助货通举世

卖货到全天下,说话不通怎么办?“双十一”之前,机械翻译技巧已经经历了进级,对话机械人可以赞助全天下中小卖家将产品详情与评论自动翻译资源地说话,还实现了实时AI说话翻译的客户办事与营业咨询,涵盖64种说话偏向。当然,获取商品信息光靠看商家网页还不敷,有问题找客服,外洋破费者也不例外。在海内,承担客服职责的是对话机械人,这两年,它还有了国际版,专门办事外洋营业平台。

据赵昆先容,对话机械人精晓英语、法语、泰语、西班牙语、阿拉伯语等11种说话,两周就能学一门新外语。

“今年,对话机械人新学了阿拉伯语、法语和繁体中文,并且推出了马来语—英语、泰语—英语等混杂说话问答功能。”赵昆说,“混杂说话问答的环境在马来西亚等地很常见,在当地的客服场景中,大年夜部分用户用英语咨询,少数用户用马来语咨询,并且常有英语、马来语混用。对话机械人不仅要同时理解这两种说话,还必须理解繁杂的说话混用环境,并给出响应的回答。”

不过,它应用的并不是机械翻译技巧,而是一种自然说话处置惩罚技巧跨说话进修(Cross-lingual Learning)。“小语种短缺大年夜规模练习语料,很难经由过程以前的机械进修技巧习得,跨说话进修能够降服资本匮乏的瓶颈。”赵昆解释说,跨说话进修是一种多说话的自然说话处置惩罚技巧,它经由过程说话之间的常识迁移,借助中文、英文等语料资本充沛的说话,赞助算法模型提升理解小语种的能力,从而快速拓展机械人的多语种支持功能。借助跨说话进修技巧,对话机械人还能掌握更多说话,以致包括土耳其语、乌尔都语等小语种。

“普通地说,说话是符号,不合的说话是不合的符号系统。想象说话所指的每个事物/常识都对应一个确定的身份标识,后者在不合的说话中被不合的符号所代表,或者说,不合说话所用的符号映射到同一个语义空间。跨说话进修做的是赞助机械理解说话所指的身份标识,并借助资本富厚的说话去进修资本匮乏的说话。”赵昆进一步解释。

他表示,基于说话之间的交叉映射关系,对机械来说,在资本匮乏的环境下,经由过程将多种说话混杂,进修说话间的共性,反而能比进修单一说话效果更好。2017年对话机械人初次在外洋落地,用6个月学会了印尼语,又用6个月在智能客服岗位上杀青堪比中文机械人的办理能力,而现在,多语机械人新学一门说话的光阴已经缩短到两周。

声纹识别开启语音购元年

今年“双十一”,语音购物千呼万唤始出来:破费者只要对天猫精灵说出想要购买的商品,就能直接下单;假如开通了“声纹支付”功能,还可以直接语音付款。

“语音购元年”,听起来科技感实足,据报道,已稀有百万人体验了语音购物,此中跨越折半的用户是首次考试测验。声纹识别技巧采纳基于深度收集的留意力嵌入式模型,经由过程收集布局的参数设计,模拟了基于人耳感知的频谱特性,可以在必然程度上打消同一人在不合场景发音下的频谱特性差异滋扰,显明提升远场交互下的声纹识别机能。

措辞就能付钱,若何确保安然?阿里巴巴人工智能实验室语音技巧首席科学家聂再清先容,作为首个达到商用级其余声纹识别技巧智能音箱,天猫精灵的声纹识别率已达99%,这是它支持声纹支付功能的根基,在支付级利用下,用户只要经由过程3次不跨越10秒的交互语音,声纹识别技巧就可以准确形貌用户的鲁棒性声纹特性,实现跨越99%的识别准确度。

不仅如斯,运用中文识别的自然说话理解算法,语音设备可以准确定位破费者必要购买的商品,以平台大年夜数据为根基,依托声纹保举能力,为破费者进行个性化保举。“在语音购场景,天猫精灵基于留意力影象收集可以自立进修各个行业导购员的履历,并结合用户特征出现最优的导购流程,成为最懂用户和最懂行业的智能导购员。”聂再清说。

此外,今年“双十一”,破费者还可以体验AR试妆产品,AR试妆经由过程标准化对象拿到彩妆色号、材质等数字信息,经由过程AI+AR技巧让用户看到同样商品在自己脸上出现出的不合效果。

经由过程高效实时的精准人脸识别技巧,即便在人脸晃荡和大年夜角度偏转时,都能有很好的稳定性体现,以毫秒级别画出商品在用户脸上的逼真效果。新弄法背后是新技巧。在屡屡刷新的成交额、令人瞠目的商业数字之外,赓续冲破的技巧正贴地而行。

加载更多>>

您可能还会对下面的文章感兴趣: