华为FusionData：源于数据，高于数据-维端网

自首台计算机ENIAC诞生起，人们便对数据收集、整理、分析和使用产生了高度依赖。

这种依赖随着数据应用的不断扩展，逐步发展到数据驱动与转化阶段。

那些有志于在数字化转型中先拔头筹的企业深知，数据驱动与转化意味着庞大的数据资源必将通过计算、交互产生智慧与财富。

而另一方面，企业也看到前所未有的挑战近在咫尺：数据应用呈现出大规模、多元异构、跨行业、实时联动等形态，此场景的背后则是数据接入难、分析难、消费难的“三难”窘境。

根据华为全球产业展望(GIV)报告显示，全球数据量将从2018年32.5ZB快速增长到2025年的180ZB。

与之形成对比，企业生产活动产生的数据中只有不到2%被保存，而其中得到分析利用的不足10%，显然，数据价值的充分释放距理想状态相去甚远。

正视数据“三难”

在如何科学而有效的利用数据潜在价值这一问题上，不乏用户端的声音—来自金融行业的某企业CIO曾这样评价：若要从根本上解决企业面临的数据三难，应当具备“两重视”、“+智能”的应用思维。

所谓“两重视”，即重视数据“主权”与数据“提纯”，前者旨在强调企业对数据湖中的数据资源实现主导，并全方位掌握数据的流向与接入，其重要性不言而喻—让数据百分之百地满足自身业务所需；而后者旨在强调数据的精确应用，让有效数据对接明确需求，高效精准的使能业务成长。

其次便是“+智能”！顾名思义，通过基于多样算力的AI技术，将杂乱而无序的海量关联数据实现智能聚合、分析，形成精准化、有序化、结构化的数据，数据应用的场景价值才会由此得以全面释放。

FusionData，华为新近发布的智能数据解决方案，显然并有意从上述应用需求中切入，力求点亮客户在数据应用道路上的新锐脚步—强有力的迈向智能数据的大产能时代。

正如华为Cloud & AI产品与服务总裁侯金龙于FusionData发布会现场所言：“数据成为新生产资料，智能成为新生产力，企业需要构建领先的数据基础设施，从而打通数据供应全流程，使能数据与业务全连接，提升业务敏捷性！

侯金龙的语义背后或许还存在另一提示—各种经济时代的区别，不在于生产什么，而在于用什么生产资料，怎样生产。

FusionData即是数据大产能时代最需要的生产工具，而它的使命即是基于数据资料，完成对数字化转型的数据使能！

与之相呼应，FusionData的特质也确有“一切源于数据，高于数据”深刻意味。

源于数据—FusionData从数据服务需求的根本—（数据汇聚）出发，通过聚合数据源，提供‘采-存-算-管-用’全生命周期管理能力，让数据存得下、流得动、算得快、用得好，助力客户将数据资源转变为数据资产。

高于数据—FusionData将数据的应用提升到万物互联的智能世界之上。而FusionData的终极目标则要实现一家企业一个数据湖，一座城市一个数据湖，满足居民的生产与生活、企业的运营和发展、城市政府的管理和服务等各项需求，加速全社会的智能化进程。

在FusionData发布会现场，华为IT产品线副总裁、智能数据与存储领域总裁周跃峰，用数据服务的线性图形将FusionData的“完美实力”展现于业界。

笔者的直观感受是：有高度、够清晰、全方位地触达到数据服务的各项能力环节。FusionData重定义着数据基础设施，其声量可谓振聋发聩，而其精彩内容包括：底层多样性算力平台、数据接入、存储、处理以及使能项。

其中，结合FusionData的特质，令华为引以为傲的三项重点—聚焦于数据接入、数据处理和数据使能三个层面，力图通过“连接”、“处理”、“使能”三个关键词让用户明白，任何复杂、异构、海量的数据难题都能在华为FusionData的全生命周期的管理能力下一一化解，同时还有意外“惊喜”。

FusionData的实力与惊喜

下文便通过三个关键词在细节上对FusionData做出一番简要总结，一窥其实力与惊喜之处。

“连接”:多样与高效

要做到企业用户理想中的数据智能全连接并非易事，因为只要让数据连接就意味着要与多源异构数据深度关联，后者直接引发的结果即是割裂的数据孤岛，而数据孤岛还是非统一，且形态各异。

事实上，传统的数据融合接入方式处理的对象多聚焦在来源相同、结构类似、维度单一的数据单元。而面对两多一异(多源、多维、异构）的数据源，华为选择了智能数据连接部件ROMA完成对多数据源接入、消息和API的统一管理，同时智能通道选择等技术实现智能全连接，加速数据流动，让应用与数据连接更高效。

形象地说，FusionData的全智能“连接力”做到了让数据湖在“海纳百川”中“浑然一体”，且“四通八达”。

所谓“海纳百川”即是在接入能力上，FusionData做到了支持1100多种应用和异构数据源接入，通过开放式数据接入框架可灵活接入第三方数据源。最大限度地容纳数据多样性，找到各类数据的平衡点，让各类数据相互融合的同时将其本色充分保留，并完美地体现在分析应用管道中。

做到“浑然一体”旨在强调界面式的一触即达，即基于统一的管理平台实现分布式消息和API服务的跨网跨域跨云集成，让数据自由流动的同时提升数据应用的效率。

不忘提及的一项重点是针对跨网跨域跨云集成，华为在云、管、端的基础设施平台上具备了其它业界友商并不完全具备的核心优势，这一点，华为已拔得头筹。

实现“四通八达”，则是来自智能通道的选择，即支持数据多通道传输，并且可根据数据特点智能选择传送通道，大幅提升数据接入效率。

“处理”-重定义数据智能化

尽管FusionData是作为智能数据整体解决方案亮相于业界，但其光芒仍然被其两个重要组件-业界首创的 AI Native 分布式数据库 GaussDB 和分布式存储产品 FusionStorage 8.0所占据。

两大角色性格分明：GaussDB将 AI 技术引入数据库，大幅提升数据库自动化管理和优化能力；FusionStorage 8.0则实现一套存储系统同时支持块、文件、对象、HDFS、数据库协议，适用于全业务场景混合负载，满足云上云下数据流动并保障一致性体验。

两者再搭配FusionInsight，通过多类型数据融合存储、融合分析引擎完成了从单一处理到智能融合处理，加速了数据价值的转化。综合而言，三者结合极大提升数据处理平台的速度，即处理数据的效率；宽度，数据应用的范围得以扩展；能力，处理数据的质量直接提升。

作为FusionData的一大灵魂角色，GaussDB在此值得为其浓墨重彩一番，这主要得益于其极为抢眼的创新表现力：其作为首个将AI技术融入分布式数据库的全生命周期中的 AI-Native数据库，一并实现了自运维、自管理、自调优、故障自诊断和自愈，形成了自家独特的数据库内生管理力；其次，作为首款支持ARM架构的企业级数据库，更能充分发挥X86、GPU、NPU的综合算力优势，在算力出口上不存在桎梏，也无配额，而是实现计算资源配置价值的最大化释放。

周跃峰给出的GaussDB成绩单令关注华为数据库产品的用户与合作伙伴倍感振奋—基于深度强化学习的自调优算法，其调优性能比业界标准提升 60% 以上；根据权威标准测试集 TPC-DS 进行测试，GaussDB性能比业界提升 50%，排名第一，当然，与GaussDB相匹配的成绩表现仍有很多，不在此赘述。

值得强调的一点是，GaussDB搭载的融合分析引擎，能够做到支持数据库、大数据、AI多引擎融合分析和多样性算力统一调度，实现极简分析。

使能-数据先感知再驱动

使能数据，即通过智能技术加速数据的提纯，并快速转化其潜在价值。这一过程，用户需要考虑在海量、异构数据中如何让信息能够精准地触达应用所需，而不至于埋没在数据洪流中。简而言之，选择有效数据，淘汰无效数据，但此项工作并不轻松—基于数据平台工具对数据进行感知、过滤再实现筛选。

FusionData中，智能元数据感知功能便通过AI技术，自动感知和采集多个系统的元数据，对数据进行智能化分级分类，生成全局统一的数据视图，零数据归纳、筛选达到秒级响应。其遵循数据提纯的精准、合理即有效性原则，避免了用户对海量数据提纯的劳力费神。

而接下来的数据加工流程中，FusionData提供了OneQuery Tuobo工具，让数据访问接口实现统一，实现多数据源、多类型数据的统一访问，简化数据加工流程，数据获取速度提升10倍以上。

FusionData的生态家园

不容否认，数据应用的本质是信任与共享。FusionData生态发展同样如此。

诠释“信任”，华为智能数据解决方案FusionData已经应用于全球60多个国家及地区，服务于1500多个客户，拥有500多家商业合作伙伴，并广泛应用于金融、运营商、政府、大企业等行业。这一连串的数字表明，FusionData已成为业界用户与伙伴极为信任的数据服务方案品牌。

诠释“共享”，华为生态圈的各个参与者共享着数据创新所带来的回报，其不仅体现在业务层面，更体现在携手共赢之处—华为正在联合客户和合作伙伴，从行业应用、平台工具、标准组织和社区三个层面完善产业生态，让FusionData在真正的数据应用共同体的道路上走得更宽，更远。

如果向华为生态圈的伙伴们问及对FusionData的深刻印象，答案一定是：源于数据，高于数据。

华为FusionData：源于数据，高于数据

相关推荐

热门文章

AI与科技出海生态平台

切换注册登录

切换登录注册