数据剖析更灵活、更快捷,火山引擎DataLeap动态探查全面升级 全球看点
2023-05-10 17:10:58 来源:中关村在线 小 中
近期,火山引擎DataLeap上线“动态探查”能力,为用户提供全局数据视角、完善的抽样策略,提高数据探查的灵活度以及响应速率。
传统的数据探查是基于库表的全量探查,由后端引擎执行,通过自动化检查数据成分、关系、格式等,以报告形式展示探查后列的统计分布结果,避免数据质量导致项目开发、上线出现问题,主要应用于元数据管理、数据研发、数仓开发以及数据治理等环节,满足使用者对数据质量初探的需求。
但在数据量级大、用户需要探查数据明细或需要数据预处理操作时,由于传统的数据探查要对全量表进行检测,导致无法实时产出报告、等待时间变长,灵活度低,且无法跟踪数据明细。
【资料图】
针对上述痛点,火山引擎DataLeap在传统数据探查基础能力上,进一步增强了动态探查能力。其特点在于:
● 基于大数据预览探查,支持对数据进行函数级别预处理。
● 数据探查结果秒级更新、实时响应。
● 与数据监控联动,有效打通数据探查到质量分析闭环。
据介绍,DataLeap动态探查的对象是抽样数据,支持连续抽样(按照默认顺序连续抽样前x条数据)、过滤抽样(使用where过滤语句过滤)、随机抽样(随机抽样x条数据)3种模式,用户可对数据进行预处理,实时、动态获得统计分布结果,具备灵活度高、实效性强的特点。
火山引擎DataLeap动态探查使用流程
除此之外,DataLeap动态探查具备对探查结果基础分析能力,包含列删除、过滤、排序等。用户对探查结果的每一次操作都会被记作一次操作,多次操作串联成操作栈,DataLeap支持用户自由修改或删减操作栈里的步骤,并实时查看最新结果。
火山引擎DataLeap动态探查操作栈
火山引擎DataLeap数据探查报告
目前,DataLeap动态探查可以应用在以下三个场景中:
● 场景1:用于分析型探查场景,用户可利用hive基本函数,如get_json_object,将列进行数据提取。
● 场景2:与探查报告打通,用户点击探查报告中的统计值,即可跳转到数据表格,并应用具体行过滤函数。
● 场景3:用于数据过滤后的探查场景,用户通过过滤和分组条件进行写条件探查,例如校验status=0时current_price为0的占比。
DataLeap是火山引擎数智平台旗下产品,提供数据集成、开发、运维、治理、资产、安全等能力,帮助用户提升数据研发效率、降低管理成本,加速推动企业的数字化转型,目前已经应用于泛互联网、制造、新零售、汽车等领域。(作者:姚元宇)
关键词:
相关文章
- 数据剖析更灵活、更快捷,火山引擎DataLeap动态探查全面升级 全球看点
- 2023青羊区教办幼儿园招生计划表(名单+人数)
- 环球短讯!江铃汽车涨停
- 苦杏仁的吃法_怎么吃苦杏仁好呢
- 女子自曝被郑州大学教授性侵,警方:她未报警,被指控者已报警
- 淤青是怎么产生的(淤青的产生原因有哪些)
- 阿里系淘天集团首次亮相,定调“三新”变革
- 昇兴股份:拟金堂县投建制罐产线 完善西南地区业务布局
- 环球热消息:硅业分会:多晶硅短期需求减少 价格扩大跌幅
- 首钢股份:4月新能源汽车用电工钢销量同比增长约97%
- 简讯:大金重工:全资子公司蓬莱大金与某欧洲能源开发企业签署了某海风项目供货合同
- 【时快讯】棕榈股份:中标1.2亿元生态修复工程项目
- 速递!新致软件:上海仰岳等拟合计减持不超0.88%股份
- 中核钛白:金星钛白的钛白粉产线已全面恢复正常生产 全球速看
- 宗申动力:宗申航发公司拟引入战略投资者对其增资扩股
- 国家区块链技术创新中心落地中关村
- “索罗斯战友”密集唱空美国经济,但称未来几年机会难以置信-当前通讯
- 观速讯丨太可怕了!今天A股又大跌46点,为啥主力却抄底了?原因是这样
- 热点聚焦:接下来需求弱势轮动到晶圆代工、设备、零部件了。
- 为什么看好网宿科技300017?|当前快报
- 每日投顾发车信息汇总:大盘回调看投顾机构都在买什么 全球热推荐
- 阿里系淘天集团首次亮相,定调“三新”变革
- 全球观点:硅业分会:多晶硅短期需求减少 价格扩大跌幅
- 热门看点:伦敦金属交易所(LME):铝库存增加8700吨
- 环球微动态丨交通银行副行长周万阜:预计二季度对公信贷增速较一季度将放缓 项目储备总体较为充裕
- 首钢股份:4月新能源汽车用电工钢销量同比增长约97% 焦点观察
- 新城镇邓善沽村:帮扶慰问困境群众 真情关怀温暖人心 全球聚焦
- 5月10日国内黄金期货涨0.46%-天天最新
- 萍乡市芦溪县全县党建融合工作现场会召开
- 每日热议!李云泽同志任国家金融监督管理总局党委书记