会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 10. 发明申请
    • Visualizing Large Data Volumes Utilizing Initial Sampling and Multi-Stage Calculations
    • 使用初始采样和多阶段计算可视化大数据卷
    • US20160179852A1
    • 2016-06-23
    • US14575633
    • 2014-12-18
    • Alexis NaiboXiaohui XuYann Le Biannic
    • Alexis NaiboXiaohui XuYann Le Biannic
    • G06F17/30
    • G06F16/2462G06F16/217G06F16/23G06F16/2458G06F16/2465G06F16/26G06F16/338G06F16/34G06F16/9038
    • Embodiments visualize large data volumes utilizing initial sampling to reduce size of a dataset. This sampling may be random in nature. The sampled dataset may be refined (wrangled) by binning, grouping, cleansing, and/or other techniques to produce a wrangled sample dataset. A user defines useful end visualization(s) by inputting expected dimension/measures. From these visualizations of sampled data, minimal grouping sets are deduced for application to the full dataset. The user publishes/schedules the wrangled operation and grouping sets definition. Based on this, a wrangled dataset and grouping sets are produced in the big data layer. When the user accesses the visualization(s), minimal grouping sets are retrieved in the in-memory engine of the client and processed by an in-memory database engine according to the common processing plan. This produces result sets and a final set of visualizations of the full dataset, in which the user can recognize valuable data trends and/or relationships.
    • 实施例可以利用初始采样可视化大数据量来减少数据集的大小。 此抽样本质上可能是随机的。 采样数据集可以通过分组,分组,清理和/或其他技术进行改进(争吵),以产生被争吵的样本数据集。 用户通过输入预期的尺寸/度量来定义有用的结束可视化。 从采样数据的这些可视化中,推导出最小分组集应用于完整数据集。 用户发布/调度被纠正的操作和分组集定义。 基于此,在大数据层中产生了一个被扭曲的数据集和分组集。 当用户访问可视化时,根据公共处理计划,在客户端的内存中引擎中检索最小的分组集合,并由内存数据库引擎进行处理。 这产生了完整数据集的结果集和可视化的最终集合,用户可以在其中识别有价值的数据趋势和/或关系。