不一样的IT生态思维

对话Dell PowerScale:如何做好非结构化数据“油井”的钻井人

全球数据正在迎来井喷与云化的时代。

根据IDC的预测,2020年以前全球用户产生的数据量每两年翻一倍,到2025年前后这一数据量将突破179.6 ZB, 而其中非结构化数据,正以占全部数据量的80%~90%的体量告诉世人:伴随全球智能化与云化的进程,非结构化数据增长的速度与潜在的资源价值,将决定未来人们生活与生产质量。

非结构化数据“油井”的机遇与挑战

业界认同这样一种说法,即非结构化数据犹如数据“油井”,其喷发出的资源量将远超于结构化数据,但对其进行有效的管理,则必须适配一位具备释放数据潜能,使能业务创新的“钻井人”。

这一论断自有其坚实的依据,在我们所处的疫情特殊时代,5G、云计算、AI、IOT等技术的蓬勃发展使得非结构化数据的产生更为直接,更为迅速。

同时,传统的文件共享、备份、归档,云原生应用的持续开发交付、大数据分析,机器学习等所产生的各类型数据的应用,也进一步带动了企业业务的数字化创新。

而这些趋势背后则凸显着两个明显的挑战:一方面,由于非结构化数据产生速度快、体量大,传统的扩展方式会导致存储设备性能与容量无法灵活扩展,客户所保留的非结构数据也很难灵活地使用;另一方面,在非结构化数据的价值信息密度上,如何高效地批量处理如此之多的结构化数据也引起了新的思考。

作为在数据存储和管理市场中的“钻井人”,戴尔多年来对数据管理的实践与认知,使得非结构化数据的价值有了得以发挥的舞台。事实上,戴尔不仅在数据管理领域引领创新发展,同时其专为非结构化数据打造的PowerScale 存储系统,更奠定了戴尔科技在非结构化数据领域的头部创新地位。

为人熟知,戴尔科技集团在2020年推出的PowerScale演化于横向扩展NAS存储平台Isilon,其融合了横向扩展文件系统OneFS与PowerEdge服务器,可高效地存储、管理和分析非结构化数据,为在行业场景中的应用提供了强大的支撑能力。

事实上,在“勘探”与“利用”非结构化数据这一“宝藏油井”上,PowerScale 除了耳熟能详的释放数据潜能,使能业务等创新能力之外,其所展现的独门绝技远比用户想象的还要多。

在了解它的出色能力之前,产业界对PowerScale的价值认可自然是绕不开的光环:自2016年Gartner首次发布《分布式文件系统和对象存储魔力象限》以来,戴尔已连续六年被评为领导者殊荣!同时,其作为横向扩展NAS平台,PowerScale在近二十年间引领着市场领先地位—其已为客户提供超过17EB的存储容量;更为引人关注的是,其搭载的OneFS操作系统久经验证,成为业界公认最好的横向扩展NAS平台操作系统。

戴尔大中华区非结构化数据存储事业部总经理刘志洪

戴尔大中华区非结构化数据存储事业部总经理刘志洪认为,在中国数字经济大发展的背景下,数据和智能技术的结合有利于提高行业数字化转型的技术含量和产业附加值。

“无论是IDC亦或是Gartner的报告,戴尔的分布式存储方案在行业以及细分市场的表现可圈可点,从Isilon到PowerScale,戴尔将存储系统功能扩展、性能等多方面的能力实现显著的飞跃”。刘志洪表示。

值得一提的是,中国千行百业对非结构化数据的管理与应用的需求巨大。其中,用户不仅要加速融入数据平台化的产业链,同时更加聚焦数据的智能监控管理释放数据红利。并以此进一步实现经济、社会、产品的全面数字化和智能化升级,可谓挑战与机遇并存。

“钻井人”PowerScale的五大能力维度

Dell PowerScale的核心优势让业界清晰得看到:PowerScale正在通过五个能力维度,将挑战转化为机遇:

一、智能化存管融合,释放孤岛数据价值

在数字经济利用数据红利的过程中,企业数据管理的存储分离始终被客户视为数据应用的第一大挑战,其难度在于企业内部大量数据分布在不同的存储平台之上,数据的杂乱无章以及缺乏数据标签、监控、管理,直接导致管理盲区。

尤其是在数据孤岛的情况下,这种盲区不仅导致企业的数据存储利用率走低,更加难以释放存在于各种孤岛上的数据价值。

对此,PowerScale首先在“存”字上体现了自身的优势:借助OneFS强大的横向扩展体系结构能力,客户可根据需要动态配置所需的恰当的容量和性能,而无需过度配置存储或进行推倒重来式的升级。同时,借助OneFS单一文件系统,跨集群节点统一管理以及自动数据均衡等需求得以发挥到极致。

而在“管”上,PowerScale方案中的DataIQ软件则让来自于数据孤岛的挑战迎刃而解。作为能够帮助用户对数据进行洞察和提取价值的工具,DataIQ能发现跨越存储平台、文件、非结构化存储的所有数据,并在公有云中创建全局搜索和索引。

“DataIQ构建与内部数据库,所以当面对新加入的存储数据,其就已经能把索引功能建立起来。客户能够在一个统一的界面洞察所有的非结构化数据,同时根据实际业务需求为非结构化数据添加标签,进而洞察数据实际的价值”。戴尔大中华区非结构化数据解决方案部高级系统工程师赵斌强调。

二、打破壁垒,让数据管理无处不在

随着大数据人工智能、物联网、云等技术的快速发展,更多的数据产生和处理并不只局限于数据中心而是云端、边缘。Gartner统计数据显示: 2025年,将有75%的数据存在并应用于数据中心之外。这也就带来了另一个挑战:如何应对来自边缘与云端的非结构化数据的管理。

Dell PowerScale的亮点在于,其能够部署在从边缘到核心再到云的任意环境之中。

Dell PowerScale灵活的特性,既可以部署在云端与边缘,也可以部署在数据中心内部,其大大增强了灵活性和敏捷性,并优化了企业数据存储和访问的能力。例如,PowerScale的多协议访问能力能够为企业数据访问提供无限的灵活性,DataIQ则可以实现异构存储平台的数据的统一的管理,跨地域数据的交互和共享。

戴尔大中华区非结构化数据解决方案部高级系统工程师王国明强调,早在PowerScale诞生之日起,该系列产品就致力于帮助客户在核心、边缘、云端各个数据位置满足不同的数据需求,通过丰富的产品线应对不同的业务场景,基于领先业界的数据湖平台,打破数据和系统的壁垒,帮助客户实现数字转型,并且发现数据中的更多价值,并保证用户能够在瞬息万变的竞争中保持领先。

三,精智平台,满足多样化的性能与容量需求

随着数字经济的发展,存储的需求也面临着多样化、复杂性的趋势。

对一个企业而言,单一存储以及计划容量已经无法满足多样和复杂的场景需求。这也就要求数据存储管理方案能够体现出无缝扩展与场景适配的能力。

Dell PowerScale的OneFS无缝扩展功能以及适配能力,可以实现集群从 11TB 原始容量升级到 100PB,节点设计可在一分钟内添加到 PowerScale 或现有的 Isilon 集群。

因此无论非结构化数据环境规模有多大,PowerScale均可轻松进行扩展和管理,是企业构建其数据湖的最佳选择。

“PowerScale是一个横向扩展的平台,其最高的集群是可以扩展到252个节点,并且随着容量与性能的提升,PowerScale能够做到让不同类型的节点甚至不同代的节点可以部署在同一个集群中”。赵斌表示,通过数据湖支持不同的业务流程混合负载,PowerScale在广泛地支持传统应用和现代应用同时,更可通过CloudIQ实现全自动化的运维管理。

据悉,PowerScale 产品组合的增强功能使企业有能力支持任何数据工作负载,轻松管理并保持其灵活的架构弹性,这其中的重点是:

与同类归档节点相比,新的PowerScale归档节点(A300和 A3000)提供高达两倍以上的性能。与同类混合节点相比,新的PowerScale混合节点(H700和H7000)性能提升高达75%以上。

四,高效低碳,让有效容量发挥价值

从存储的角度来讲,数据的存储除了技术的创新之外,节能环保一向被客户视为业务进程中的考核指标。一个不争的事实是,数据存储量越大能耗就越高,同时企业的只管生数据,不管养的粗放管理方式,直接导致了能耗在数据仓库中快速上升,成本与效率直接进入窘境。

Dell PowerScale方案中全新的DRR技术,即联线数据精简压缩技术通过对重复数据的删除管理,从真正意义上让数据的压缩和精简融入了节能与低碳的佳境。因为其可以通过数据的有效容量以及可用容量为客户带来,看的见,摸得着的出色性价比,这也就间接使能了用户在能源、空间的场景应用,从而实现了高效低碳。

五,安全防护,内外一体全面护航

随着数据跨核心、边缘、云以及非结构化数据价值的不断凸显,如何在释放数据价值的同时来确保数据安全,直接关系到企业的生存和发展。

在全面防护上,OneFS 不仅包括多种协议的身份验证支持、实现逻辑隔离以及支持加密功能复制和快照的容灾能力。还包括了面对威胁实施的主动保护,即实时勒索软件保护、反病毒扫描、高级审计日志分析和报告,以及用于快速文件恢复的快照索引等先进功能。另外, PowerScale具备支持硬件加密的AirGap,AirGap可以将关键数据复制到第三组隔离网络,生产网络与容错网络都不可见,让安全更有保障。

深入行业,PowerScale落地场景有实力

行业应用是非结构化数据长袖善舞的关键领域,可以说,对非结构化数据的利用在某种程度上决定了企业数字化转型的价值转化能力。

Dell PowerScale不仅具备对行业数字化需求的深度理解,同时通过自身的方案在技术环节上给予了极富应用价值的助力。

例如,在芯片设计行业,随着半导体制程工艺的进步,半导体设计的复杂度越来越高,同时,各行业对芯片数量,芯片种类、功能都提出了高要求。EDA作为芯片设计不可或缺的重要环节,是芯片制造最上游、壁垒最高的部分。对于EDA而言,不论是前端设计、后端设计,还是制造端,工作负载对存储提出了严苛要求。

这一行业的用户在IT应用上面临着,前端设计时,需要达数千台工作终端设计工作并行,大量小文件的密集读写,需要存储具有极高的IOPS性能;后端设计时,大量仿真模拟,产生大量IO,要求存储具有极高的吞吐能力;产品迭代升级时,大量设计数据需要系统具备完善的归档能力,以及存储设备跨代兼容的能力;海量文件访问、存储,要求存储架构具有高可靠性、可扩展性。

“目前Dell PowerScale在芯片行业已经取得了非常辉煌的成绩,在全球目前大概排名TOP20企业里,基本上80%都有PowerScale的成功案例。它可以很轻松地应对存储芯片设计各个环节里面临的IT方面的挑战”。戴尔大中华区非结构化数据解决方案部高级系统工程师高中耀如是说。

聚焦到场景中,PowerScale做到4到252个节点的横向扩展硬件架构;全闪存、混合、归档类型节点灵活组合,其智能的数据生命周期管理,让EDA从设计验证到归档实现了全流程覆盖;高达N+4的冗余,经过验证的企业级数据备份和灾难恢复,确保存储平台高可用和高可靠;在线数据缩减,显著提高存储效率,降低存储成本;智能完善的数据防勒索,让实时行为分析、入侵检测、安全隔离、快速恢复得以呈现。

再例如,随着AI、大数据技术与千行百业的快速融合,数据分析和处理量急剧增长。传统的HPC开始向HPDA方向发展。例如视频清晰度从2K到8K的变革,使得视频渲染数据量增长数十倍;3D模型的油气勘探,模型的精准化意味着十倍甚至更大的数据规模;卫星测绘精度的提高,带来数据量的激增。这些多样化的数据密集型负载给数据存储不论是性能还是容量、协议都带来全新的挑战。

Dell PowerScale方案有针对性的将多协议数据互通(文件、大数据、对象),保证数据在HPDA平台的快速流转;支持混合工作负载,数据自动均衡管理,线性扩展保证激增业务稳定;让PB级大容量无缝扩展,数据线内缩减、重删以及生命周期智能管理,实现海量数据存储的高效。

刘志洪总结,类似的行业成功实践不胜枚举,无论是置于哪一类场景,PowerScale的独门绝技都在生动映衬着自身的存在理念:即横向扩展,真正做到伸缩自如、简捷如一;软件定义,将更新、更好、更快的产品优势发挥到极致;全闪设计,助力现代化应用创新;云端就绪,让数据管理一触即达;智能洞察,帮客户轻松掌握数据与存储设施的运行;安全防护,实现数据存储应用与管理“高枕无忧”。

赞(89)
未经允许不得转载:维端网 » 对话Dell PowerScale:如何做好非结构化数据“油井”的钻井人
分享到

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

不一样的IT生态思维

联系我们