最新文章

  • Hadoop安装与配置

    Hadoop程序存储的目录为/home/hadoop/hadoop3.0,相关的数据,包括日志、存储等指定为该程序目录下的data、log等。将程序和数据目录分开,可以更加方便地进行配置的管理和同步。

    技术维基 工具组件 2018/11/01
  • 开源大数据分析和可视化工具:Lumify

    Lumify是每人可用的的开源项目大数据融合、分析和可视化平台。其直观的Web界面通过一套分析选项帮助用户发现数据中的关系,并探索其关系,包括2D和3D图形可视化、全文分面搜索、动态直方图、交互式地理地图以及实时共享的协作工作空间。

    开发平台 2018/09/25
  • TensorFlow的新型模型优化工具包可使模型速度提高3倍

    本周TensorFlow推出了一个新的模型优化工具包。这套技术同时适用于新老开发员以优化机器学习模型,特别是运行TensorFlow Lite的开发人员。任何现有TensorFlow模型均适用。

    机器学习 2018/09/22
  • Informatica推出基于Spark的大数据云的创新

    企业云数据管理供应商Informatica正在为基于Apache Spark的大数据云环境引入新的解决方案。这些由CLAIRE引擎驱动的创新使组织能够以更少的工作量传输、处理、清理、保护和管理更多大数据。新AI驱动的混合大数据管理解决方案可为混合和多云环境提供机器学习,从而提供更可靠的信息资产并加速

    数据处理 2018/09/22
  • 开源数据四大管道对比:Luigi、Azkaban、Oozie、Airflow

    随着公司的发展,工作流程逐渐包含很多具有复杂依赖关系的流程。这些流程需要增加监控、故障排除和日常维护。如果没有明确的数据族系,就会出现问责问题,并且可能会丢失操作元数据。这是有向无环图(DAGs)、数据管道和工作流管理器发挥作用的地方。复杂的工作流程可以通过DAG表达。DAG图形要求信息必须在特定方

    调度与管理服务 2018/09/22
  • 什么是Pentaho数据集成工具(Kettle)?

    Pentaho数据集成(PDI)是Pentaho开源商业智能套件的一部分。它含有以下支持业务决策的软件:数据库管理实用程序、数据集成和分析工具、管理器软件和数据挖掘工具。Pentaho数据集成以其易用性和易学性而闻名。PDI实现了元数据驱动的方法,这意味着,开发基于要做什么,而不是如何做。

    分析和报告工具 2018/09/22
咨询·反馈