不一样的IT生态思维

re:Invent 2022亮点观察:助力行业数智融合,数据赋智势在必行

作为位置服务进入数字化时代的标志,GIS(地理信息系统)与云技术的融合,赋予了地理信息服务新的生命形态。

事实上,随着智慧城市的飞速发展,多元海量数据接入、管理以及分析处理、整合应用对地理行业的数据资源转化提出了巨大的“数智融合”挑战,而云上机器学习已经为这一挑战提供了最佳的实践模式。

透过行业场景看数智融合落地

通常,行业客户基于地理空间数据开发机器学习模型时会遇到耗力耗神的窘境:达到PB 级的地理空间数据从收集、构建、关联、合并再到可视化,整个过程可能需要几个月的时间,这使得客户很难利用地理空间数据及时产生机器学习预测。

另一方面,地理信息数据的存储加工意味着庞大的投资,行业客户都在寻求一种既占成本优势又兼具效率优势的智能化的数据处理技术,显然,云上的机器学习工具提供了广阔的数智融合发展空间。

谈地理信息的“数智融合”发展,亚马逊云科技的Amazon SageMaker是绕不开的重磅角色。其可从多个方面推动地理数据资源从孵化走向有效应用:

Amazon SageMaker可将客户丰富数据集、训练地理空间模型并将结果可视化的时间从数月缩短到数小时,从而加速和简化地理空间机器学习预测的生成。

客户只需几次点击或使用 API就可以使用 Amazon SageMaker访问各种地理空间数据源,例如亚马逊云科技的位置服务Amazon Location Service、开放数据集Amazon Open Data、客户自有数据和来自Planet Labs等第三方供应商的数据。

而当专业人员选择了想要使用的数据集,其可以利用内置的运算器将这些数据集与自己的专有数据合并起来。为了加快模型开发,Amazon SageMaker 提供了预训练的深度学习模型,其支持的用例包括通过精准农业提高作物产量、监测自然灾害后区域恢复以及改善城市规划等。训练完成后,内置的可视化工具在地图上显示数据,揭示新的预测。

由此可以看出,Amazon SageMaker在与行业数据“对接”中,针对性的为数据应用整合发挥着不可替代的作用。

事实上,对于所有千行百业的客户而言,Amazon SageMaker在地理领域卓越表现,即是亚马逊云科技引领云服务全面实现数智融合的一个缩影。

据悉,Amazon SageMaker推出以来,亚马逊云科技不断围绕机器学习平台Amazon SageMaker,推出大量新功能,将机器学习技术传授给客户。五年来已经为Amazon SageMaker增加了260项新功能,不断降低机器学习的技术门槛,简化机器学习的前期工作,加速为客户“赋智”。在数据服务方面也是如此,通过各种新服务和新功能,尽可能让开发人员可以上手开展机器学习。

在前不久结束的亚马逊云科技在2022 re:Invent全球大会上,亚马逊云科技推出了一系列与数据、跟机器学习相关的服务和功能。在亚马逊云科技看来,数智融合下的数据与机器学习新工具、新能力释放了两层重要意义:一是数据服务和功能为会机器学习服务,帮助客户获得数据价值;二是机器学习技术的天赋异禀在数据新服务和新功能中将进一步得到升级。

熟悉亚马逊云科技的用户都知道,亚马逊云科技在推动机器学习与大数据的融合发展上,有着超群出众的“云、数、智”三位一体的大数据与机器学习融合服务组合,这一服务组合具体涵盖三个方面:构建云中统一的数据治理底座,为机器学习提供生产级别的数据处理能力,给业务人员提供更加智能的数据分析工具。

与之对应,上云、用数、赋智,则精炼应和了企业上云的三个阶段,三重境界。上云可以相对容易,用数学问较大,赋智则是更高的境界。

授人以渔,用技术创新应和行业赋智

在亚马逊云科技看来,作为最高境界的赋智,在亚马逊云科技开展的机器学习创新中颇有烘云托智,直指人心的魅力—其便是授人以渔。

亚马逊云科技大中华区产品部总经理陈晓建表示,本次re:Invent所发布的数据服务中既有机器学习所提供的最新生产级数据处理能力,更有赋能行业实现大数据创新的智慧路径。

“从这些re:Invent发布的新技术服务中,业界可以清晰的看到未来技术演进的方向是数智融合。例如本次re:Invent所推出的Quicksight Q,其把人工智能和业务洞察相结合,使得客户不用再去掌握数据分析技术,而是通过人类自然语言来进行业务的洞察,从而大降低了使用门槛”。陈晓建如是说。

陈晓建所提及的Amazon QuickSight Q 最大亮点在于,其可以运用机器学习让任何用户都能以自然语言提出有关业务数据的问题,并在几秒钟内获得可视化的准确答案。

它让没有技术专业知识的业务人员都可以探索历史趋势和数据指标,让用户能够从支撑其看板和报表的数据中获得新的洞察。例如,销售用户可能会问,“去年在哪里销售的商品最多?”,或者财务用户可能会问,“与目标相比,实际收入是多少?”。

从这一角度而言,Amazon QuickSight Q数据预测能力从“赋智”层面应和了客户的行业所需。

显然,这对于行业业务决策者或者管理者来说,就像为业务发展增添了一位智慧超群的智囊,它可以查看特定结果受哪些历史数据影响同时针对预测结果追问预测依据。例如,销售经理可能会询问“预测办公椅在加州的销售情况”,Amazon QuickSight Q会根据先前指标的模式提供销售预测,自动考虑季节性和异常数据。销售经理可能会追问“为何上月销售额增加了?”,在几秒钟内,Amazon QuickSight Q会总结出驱动这一增长的主要因素。这样,业务人员可以更好地理解潜在因素,并且可以做出更多数据驱动的、决定未来结果的决策。这一新功能现已向所有Amazon QuickSight Q客户提供,不需要额外付费。

而对于客户而言,以往其只能针对业务类型提出“是什么”,现在不仅可以问“是什么”,还可以追问业务发展走向“为什么”。

此外,Amazon QuickSight Q的自动数据准备功能使用预先训练的机器学习模型,从客户现有的看板和报表等数据资产中进行学习,在几分钟内为每个新数据集预配置业务术语,从而减少开始查询数据所需的时间。例如,流媒体服务可以使用Amazon QuickSight Q自动数据准备功能,通过已经存在的看板为数据集预配置业务术语。之前的看板可能包含了按客户类别、客户编号和地理位置划分的付费用户信息。

在数据管理层面,Amazon SageMaker Studio Notebook提供全新数据准备功能,帮助客户直观地通过几次点击检查和解决数据质量问题。

以往,企业用户可能要花费数月时间编写样板代码将数据集的不同部分可视化,检查数据集,以期识别和修复问题。

Amazon SageMaker Studio Notebook新提供了内置的数据准备功能,让企业用户只需点击几下即可直观地查看数据特征、修复数据质量问题,所有这一切都直接在Notebook环境中进行。

当用户在Notebook中显示data frame(即数据的表格形式)时,Amazon SageMaker Studio Notebook 会自动生成图表帮助用户识别数据质量问题,提供数据转换建议帮助解决常见问题。专业人员选择数据转换后,Amazon SageMaker Studio Notebook 会在Notebook中生成相应代码,可供每次运行Notebook时重复应用。

值得一提的是,Amazon SageMaker Studio 是一个集成开发环境,它提供了一个基于 Web 的可视化界面,开发人员可以在其中访问各种工具,执行所有机器学习开发步骤,从准备数据到构建、训练和部署机器学习模型,将数据科学团队的生产力提高多达 10 倍。开发人员可以快速上传数据、创建新记事本、训练和调优模型,在各个步骤之间来回切换以调整实验,还可以在不离开 Studio 的情况下将模型部署到生产环境中。

亚马逊云科技还为Amazon Glue推出的一项新功能,其被称为Amazon Glue Data Quality,可以跨数据湖和数据管道自动管理数据质量。其最终目标也是指向机器学习应用。

事实上,目前成千上万客户都在使用Amazon Glue,以快速、轻松且经济高效地构建和管理现代数据管道。组织需要监控其数据湖和数据管道中信息的数据质量(衡量数据的即时性、准确性和完整性),确保数据的高质量,然后再将其用于分析或机器学习应用。

但数据质量管理是一个耗时且复杂的过程,需要数据工程师花费数天时间收集数据的详细统计数字,根据这些统计数字信息手动识别数据质量规则,并将其应用于数千个数据集和数据管道。实施了这些规则之后,数据工程师必须持续监控数据中的错误或变化,相应地调整规则。

Amazon Glue Data Quality可以自动测量、监控和管理Amazon S3数据湖和Amazon Glue数据管道的数据质量,将数据分析和规则识别的时间从几天缩短到几小时。Amazon Glue Data Quality可以计算客户数据集的统计数字(如最小值、最大值、直方图和相关性),使用统计数字自动地推荐规则,确保数据的即时性、准确性和完整性。

另外,客户可以安排Amazon Glue Data Quality在数据发生变化时定期运行,自动分析数据并提出质量规则的更改建议以确保相关性。一旦出现质量问题,数据工程师无需编写代码即可配置用户提醒或终止数据管道。

由此可见,在数智融合大趋势下,技术赋智在行业业务层面的分工也将会越来越细化,机器学习与数据服务未来3至5年内有望形成现象级创新力量,这对于行业来说是一个巨大的历史机遇,显然,亚马逊云科技有实力,也能更为精准的满足数智时代的用户需求。

赞(23)
未经允许不得转载:维端网 » re:Invent 2022亮点观察:助力行业数智融合,数据赋智势在必行
分享到

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

不一样的IT生态思维

联系我们