已收藏,可在 我的资料库 中查看
关注作者
您可能还需要

专家洞察:用数据科学来分配HS编码

跨境合规是Eurora使用数据科学将合规性提高到新水平的领域。数百名专家、科学家、分析师和研究人员开发了跨境贸易合规方面的机器学习。

专家洞察:用数据科学来分配HS编码

(图片来源:图虫创意)

事实证明,在许多领域,数据科学(Data Science)是企业的最佳盟友。但你知道数据科学是如何工作的吗?

我们采访了Eurora的数据科学家Simo Jaanus。他解释了什么是数据科学,数据科学家会面临哪些挑战,以及Eurora如何利用数据科学来提供更可靠的服务。

鉴于今天产生的巨大数据量,数据科学是许多行业的重要组成部分,如跨境合规。”——Simo Jaanus, Eurora数据科学家

跨境合规是Eurora使用数据科学将合规性提高到新水平的领域。数百名专家、科学家、分析师和研究人员开发了跨境贸易合规方面的机器学习。

专家洞察:用数据科学来分配HS编码

(图片来源:Eurora)

Simo是Eurora数据科学团队的一员他是数据科学家和机器学习工程师。

他毕业于塔尔图大学,这是世界排名前1.2%的大学之一在那里他获得了软件工程的硕士学位。Simo在成功通过他的硕士论文 《为产品图像的HS编码预测建立分类模型 》后获得了学位。

他的研究工作将有助于改进Eurora的人工智能引擎,该引擎是由我们的专家建立的。

以下是他与我们分享的内容。

1什么是数据科学(Data Science)?

数据科学是一个研究领域,它结合了领域专业知识、编程技能以及对数学和统计学的理解。其目的是从数据中提取有意义的洞察力。

数据科学家在各种数据类型上使用机器学习(ML)算法:数字、文本、照片、视频和音频。他们从中创造出人工智能(AI)系统,可以进行通常需要人类智慧的活动。

这些系统产生的见解,分析师和商业用户可以转化为实际的商业价值。

鉴于今天产生的巨大数据量,数据科学是许多部门的一个重要组成部分,如跨境合规。Simo说道。

数据科学家每天都在处理许多问题:我们应该如何使用这些信息?我们如何利用它来发挥我们的优势?我们能从中找到什么实际用途?

自从数据科学变得越来越流行以来,企业已经开始使用它,这样他们可以扩大他们的业务,提高消费者的满意度。在跨境合规领域,Eurora使用了数据科学,这是解决方案的核心。

2Eurora为什么要使用数据科学?

Eurora使用数据科学来自动分配HS编码。我们使用AI(人工智能)分配HS编码,以基于文本的产品描述作为输入数据。

协调制度(HS)是一个国际编码系统,用于对贸易商品进行分类。它是跨境贸易的支柱,因为它被海关当局用来识别产品和评估适用的税收。鉴于HS编码的重要性,在分配这些编码时,是没有模糊分配或者错误分配的空间的。

这就是为什么在贸易合规中使用数据科学会更加安全。Eurora的数据科学主管Kristi Helekivi在之前的采访中解释了为什么使用AI来分配HS编码是最可靠的方式。

人工分配很容易出错,一个人不可能熟记整个HS命名法,该命名法大约有5300个HS编码。通过使用机器,可以获得准确的数据,也可以处理更大量的数量。

“一台机器比一个人的知识储备更广阔。有了人工智能,所有来自不同人的知识都能被一台机器学习并吸收。”Simo补充说道。

如果企业知道如何使用数据,他们可以从数据中获益良多。数据科学家的任务之一正是在业务方面也发现和引入可能性。数据科学还帮助Eurora从竞争对手中脱颖而出,因为它使公司能够跟上市场需求,给客户提供他们想要的服务。

数据科学将领域知识、编程技能和数学结合起来,以减少人工劳动。——Simo Jaanus

3数据科学在合规领域的挑战是什么?

尽管使用数据科学在监管合规方面是一笔真正的财富,但它也有它的难处。

Simo和我们详细解释道:当你开始一个数据科学项目时,第一步就是要找到所需要的数据来开始工作。因此,数据科学家从一开始就可能面临挑战。

当Eurora开始开发其引擎时,并没有那么多可用于电子商务的有效数据。尽管如此,Eurora还是设法收集了高质量的数据。我们建立了一个团队和系统,能够快速有效地验证新的数据。

数据科学和机器学习正在迅速发展。每个月都会有新的发现和解决方案待解锁。因此,跟上这些发展很耗时,围绕它们建立可用的系统架构也需要时间。

正如Simo所解释的,除了每天会有大量的新发现,需要及时提供解决各种解决问题的策略也会让人不知所措。

找到正确的行动路线和解决方案需要大量的知识、时间和实验。——Simo Jaanus

由于Eurora是该领域的先驱,数据科学团队还面临着其他关于关键绩效指标和衡量标准的挑战。我们仍在寻找一个有效、简单和易懂的追踪进展的最佳方式,因为我们正在建立一个之前从未自动完成的东西。

4Eurora如何克服数据科学的挑战?

正如Simo所解释的,使用人工智能分配HS编码是提供准确结果的最可靠方式。尽管如此,它仍可能面临挑战,因为它依赖于客户提供的输入。客户需要向引擎提供准确的产品描述,以便它能够确定正确的HS编码。为了避免引擎因为描述不完整而无法分配HS编码的情况,数据科学团队进行深度研究,并正在实施一个根本原因的检测机制。

我们的机器正在自动检测根本原因,即时指出是否有任何必要的信息没有正确填写,这样客户就可以立即调整他们的产品描述。该团队已经对描述实施了产品、材料和细节检测。从这些结果中,我们可以确定产品、材料或细节对于最终的根本原因预测是否是必要的,或者HS编码是否可以在没有它的情况下进行分配。由于我们刚刚实现了这一功能,目前我们仍在内部评估结果,并只在付费客户要求时提供反馈。近期的目标是及时确定根本原因,甚至建议可以利用更多的描述词来正确分配HS编码。

此外,该团队目前正在调查新的数据输入类型以分配HS编码。他们发现,基于图像的数据可能是一种非常有资源的方法,这一点被Simo的研究工作所证实。Simo的硕士论文名为 从产品图像中建立HS编码预测的分类模型。他的研究工作的目的是发现从图像中预测HS编码的最有效方法。

他发现了非常有希望的结果。通过图片,我们不需要细节来分配HS编码,因为大部分的信息都是非常直观的。为了找到最佳的解决方案,我在论文中试验了各种机器学习的人工神经网络,将准确性和推理速度考虑在内。表现最好的模型能够产生与人类专家非常相似的结论,甚至超过了三个模型中的两个。

即使这些结果是有希望的,该团队仍在不断进行应用研究,调研在商业中实施其发现。

从长远来看,这也为使用基于文本的产品描述和图像给出最准确的预测铺平了道路。——Simo Jaanus

5Eurora计划在未来如何进一步发展数据科学?

数据科学团队将继续研究模型。他们计划尝试使用嵌入式模型或更强大、更快速的模型。计算机视觉是不断发展的,新的模型也经常被建议。

作为一名数据科学家,要接触创新和研究。我们有很多有趣的想法来改进Eurora的AI引擎。每天都有新客户来使用我们的服务,所以我们可以收集更多有用的数据和反馈来改进系统。”Simo和我们分享道。

除了HS编码分配,该团队计划使用数据科学来改善Eurora在其他领域的活动。这可能包括使用数据科学来改善Eurora的网页和用户体验,甚至是翻译和语言检测。

如果一切按计划进行,将有数十亿行的数据可供我们分析和训练模型。——Simo Jaanus

Simo坚信,数据科学将帮助Eurora实现极高的目标。

我坚信我们在Eurora所做的事情,并理解这是一件意义重大的事情。因此,已经有迹象表明,Eurora可能会成为下一个独角兽、十角兽,或者是百角兽。我希望数据科学能够协助企业朝着这个方向发展!——Simo Jaanus

数据科学不仅有助于HS编码分配过程,也有助于关税和税收计算、IOSS、限制筛选和清关服务。你愿意用安全的基于人工智能的解决方案让你的合规流程自动化吗?Eurora就在这里,随时为你提供有效的解决方案!

想要了解Eurora如何助力您的跨境业务,敬请联系sales.cn@eurora.com

Eurora是一家可以提供跨境贸易全链解决方案的基于人工智能和机器学习的科技公司。Eurora不同的组合服务包括IOSS解决方案、OSS&VAT注册服务、HS编码适配服务、关税及税金计算服务、限制方&违禁品筛查及欧盟在线化清关方案可以帮您实现报税自动化和清关自动化,从而帮您节约时间成本和人工成本。

专家洞察:用数据科学来分配HS编码

专家洞察:用数据科学来分配HS编码

(编辑:江同)

(来源:Eurora)

以上内容仅代表作者本人观点,不代表雨果跨境立场!如有关于作品内容、版权或其它问题请于作品发表后的30日内与雨果跨境取得联系。

分享到:

--
评论
最新 热门 资讯 资料 专题 服务 果园 标签

收藏

--

--

分享