已收藏,可在 我的资料库 中查看
关注作者
您可能还需要

跨越语言的鸿沟,阿里达摩院AI技术帮助跨境电商卖家提高运营效率

“跨境电商场景下,最远的鸿沟不是距离,而是语言的障碍”

跨越语言的鸿沟,阿里达摩院AI技术帮助跨境电商卖家提高运营效率

“跨境电商场景下,最远的鸿沟不是距离,而是语言的障碍”,阿里巴巴达摩院机器智能技术实验室智能翻译解决方案方向负责人施杨斌表示,在全球化的今天,跨境电商生意遍布全球,但因语言的沟通障碍,很多卖家在跟买家交流的时候,无法准确抓捕对方想表达的信息。

因此,在【雨果网111大会】上,施杨斌从智能翻译在AI场景的应用以及其技术挑战和亮点上,全方位向跨境电商卖家展示了人工智能渗透到跨境电商的应用表现,帮助卖家解决语言沟通障碍。

一、智能翻译特定的AI场景在跨境电商领域的具体应用

1、跨境电商业务语言复杂性

跨越语言的鸿沟,阿里达摩院AI技术帮助跨境电商卖家提高运营效率

(图/施杨斌演讲PPT截图)

“语言问题是跨境电商领域面临的很大的难题”施杨斌指出,如上图所示,18个主要跨境电商国家有不同地区的分布,而上图的卖家可以理解为不同的原发商品,有英文、俄语、西语等不同的原发商品。这些不同的卖家将货卖给左边18个不同国家的买家。再者,底下为电商平台,包括阿里内部以及物流、支付、营销领域内的其他电商平台。不同的领域,需要不同的语言,可见跨境电商语言业务的复杂性。

2、智能翻译在跨境电商全链路的应用

跨越语言的鸿沟,阿里达摩院AI技术帮助跨境电商卖家提高运营效率

(图/施杨斌演讲PPT截图)

1、卖家在做跨境业务的时候,需要使用多语言的本地化网站或者APP,就会涉及到网站文案的多元化、国际化的标准扫描,还有本地化的测试以及网规、网站信息的本地化。

2,当卖家有本地化的站点之后,接下来就需要为APP或者网站做引流拉新,这就涉及到引流词的多元化和引流标题商品的多元化、多元创意文案、多元的类目。

3、卖家把用户引流到自己的网站之后,需要考虑的是怎么提高到站的修复转化率,也就涉及多元的搜索、多元的类目等。

4、当用户很成功找到自己想买的商品,就需要考虑如何提高用户的购买转化率,如上图D到O的转化率,就需要做商品所有详情信息的多元化,标题、评论以及UGC的内容。

5、最后用户下单成功还涉及物流支付的环节,这里包括支付物流以及关检务过程中问题的解决。当货到买家手中,卖家需要考虑怎么提高留存复购率,有多元实时沟通和智能客服等。

针对以上的每一个步骤,施杨斌从到站搜索和留存复购给卖家做具体的案例分析。

1、多元的搜索。搜索是大部分流量的入口,首先要解决的问题是报关。假设一个俄罗斯人在自己的本地电商平台搜索想买的商品,输入是俄语,但大部分搜索引擎底层的技术都是基于英语做索引。如何输入俄语能让页面他想要的商品信息,就是怎么解决商品报关的问题。具体包括:对关键词做语种识别、智能纠错翻译成英文,通过搜索引擎检索,展示买家想要的商品。

其次,做展示的优化。如淘宝的场景,卖家为了提高搜索透出率,有很多的重叠词和修饰词。卖家做跨境贸易的时候把中文的商品直接翻译成英文或者俄语,商品标题非常长,以致于搜索展示页只能看到前面的几个单词,导致本地买家看不懂标题表达的意思。

通过展示优化,搜索页面会根据不同地区消费者的习惯做智能标题改写,把长标题改成短标题,然后再做机器翻译。最后呈现的是品牌+两三个修饰词+品类词,这样的标题就一目了然。

2、搜索转化率。通过用户的行为去反哺两个智能的算法:通过搜索词的优化,比如有些高流量的搜索词,搜索出来的结果对用户的点击、CTR的转化率很高。卖家可把这些词过滤出来,人工辅助挑这些词出现的问题,再反哺给机器翻译;通过不断的业务指标驱动的算法优化路径去提升翻译和标题改写算法,最终向业务指标提升的方向拟合。

二、搭建电商领域机器翻译引擎的挑战和技术亮点

1、电商场景机器系统的挑战

翻译质量,包括电商场景翻译结果可读性要求高、相关领域关键信息翻译的准确性、灵活的干预机制,特别是电商的关键术语、商品的品名,数字和商品的型号、规格,翻译的准确度要求非常高。

服务要求,电商平台对整体的服务稳定性和多区域的要求非常高,同时要求有高的响应程度,用户不可能在商品详情页渲染的时候等一两分钟,甚至半分钟都等不了。

•快速迭代,由于跨境电商业务的快速发展,针对更多国家的扩张和更多语言翻译的需求,卖家要求速度非常快,所以需要快速迭代的能力。

2、电商翻译系统的技术亮点

为了应对以上的三个挑战,阿里翻译团队整体通过模型、数据、工程三方面去应对。

模型。模型上采用机器翻译多模型翻译的方案,把不同的模型用在擅长的领域。比如神经网络翻译机器比较善长文本和口语化的翻译,可应用在商品翻译、评论和沟通的场景;统计机器翻译就比较适用于短的文本,像标题搜索和属性这样的场;规则翻译主要用于数字、日期、单位地址和菜单之类的翻译;翻译记忆,先过一遍人工翻译的记忆库,精准匹配。

卖家可结合业务指标数据对头部商品进行翻译质量自动评估,如果有翻译质量不过关,能更有针对性的对头部商品质量进行优化,以达到业务指标提升的目的。

数据。数据优势主要是为了表达出人工智能最底层、最依赖数据,数据有多么庞大、多么高质量,出来的模型就有多智能。

工程。分布式训练能加速整体模型训练的速度,并行计算和性能优化可提升整体的存储量和响应时间。

(文/雨果网 吴桂真)

免费在线咨询
联系雨果跨境顾问,在线为您答疑!
我想问
免费咨询
未注册的手机号将自动创建新账号,且代表您已阅读并同意雨果跨境 《用户协议》 《隐私协议》

分享到:

--
评论
最新 热门 资讯 资料 专题 服务 果园 标签 百科 搜索

收藏

--

--

分享