会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 5. 发明申请
    • META-DATA DRIVEN DATA INGESTION USING MAPREDUCE FRAMEWORK
    • 使用MAPREDUCF框架的元数据驱动数据采集
    • US20130275363A1
    • 2013-10-17
    • US13466981
    • 2012-05-08
    • Mingxi WuSongting Chen
    • Mingxi WuSongting Chen
    • G06F17/30
    • G06F9/46
    • A generic approach for automatically ingesting data into an HDFS (Hadoop File System) based data warehouse includes a datahub server, a generic pipelined data loading framework, and a meta-data model that, together, address data loading efficiency, data source heterogeneities, and data warehouse schema evolvement. The loading efficiency is achieved via the MapReduce scale-out solution. The meta-data model is comprised of configuration files and a catalog. The configuration file is setup per ingestion task. The catalog manages the data warehouse schema. When a scheduled data loading task is executed, the configuration files and the catalog collaboratively drive the datahub server to load the heterogeneous data to their destination schemas automatically.
    • 将数据自动摄取到基于HDFS(Hadoop文件系统)的数据仓库中的通用方法包括数据存储服务器,通用流水线数据加载框架和元数据模型,它们一起处理数据加载效率,数据源异构性和 数据仓库架构发展。 负载效率通过MapReduce横向扩展解决方案实现。 元数据模型由配置文件和目录组成。 配置文件是每次摄取任务设置的。 目录管理数据仓库模式。 执行计划的数据加载任务时,配置文件和目录协同驱动数据存储服务器,将异构数据自动加载到目标模式。
    • 6. 发明授权
    • Meta-data driven data ingestion using MapReduce framework
    • 使用MapReduce框架进行元数据驱动的数据采集
    • US08949175B2
    • 2015-02-03
    • US13466981
    • 2012-05-08
    • Mingxi WuSongting Chen
    • Mingxi WuSongting Chen
    • G06F17/30
    • G06F9/46
    • A generic approach for automatically ingesting data into an HDFS (Hadoop File System) based data warehouse includes a datahub server, a generic pipelined data loading framework, and a meta-data model that, together, address data loading efficiency, data source heterogeneities, and data warehouse schema evolvement. The loading efficiency is achieved via the MapReduce scale-out solution. The meta-data model is comprised of configuration files and a catalog. The configuration file is setup per ingestion task. The catalog manages the data warehouse schema. When a scheduled data loading task is executed, the configuration files and the catalog collaboratively drive the datahub server to load the heterogeneous data to their destination schemas automatically.
    • 将数据自动摄取到基于HDFS(Hadoop文件系统)的数据仓库中的通用方法包括数据存储服务器,通用流水线数据加载框架和元数据模型,它们一起处理数据加载效率,数据源异构性和 数据仓库架构发展。 负载效率通过MapReduce横向扩展解决方案实现。 元数据模型由配置文件和目录组成。 配置文件是每次摄取任务设置的。 目录管理数据仓库模式。 执行计划的数据加载任务时,配置文件和目录协同驱动数据存储服务器,将异构数据自动加载到目标模式。