The Data Day: August 10, 2016
What happened in data and analytics this week will shock you For @451Research clients: @H2Oai lets off a little Steam, advances Spark integration for machine learning https://t.co/gBEJB6OmHD ― Matt...
View Article从TDW-Hive到TDW-SparkSQL――TDW数据引擎演进之路
8月3日-6日,世界公认的“必须参加”的数据盛典Strata + Hadoop World首次登陆中国。作为顶级的数据盛会,美国总统奥巴马曾亲自2015年加州的Strata + Hadoop...
View Article利用phoenix进行Hbase数据访问
一、背景 近期一个 用户画像 的项目,数据量庞大,用mysql进行存取不太现实,所以采用 Hbase集群 的方案来实施。由于业务层使用的是 php ,所以研发同学首先想到的是 PHP-Thrift 来访问 Hbase ,编码实验了几天,效果不是太理想,尤其是编码成本较大,各种 scan、filter 之类的语法,不利于团队进行快速开发;当然,最崩溃的还是想利用 count 进行数据总量计算,是...
View ArticleBest practices for streaming applications
Data Tools Best practices for streaming applications Mark Grover and Ted Malaska offer an overview of projects for streaming applications, including Kafka, Flume, and Spark Streaming, and discuss the...
View ArticleOperation Hadoop Infographic: Experiencing Cluster Flux? You’re Not Alone
Experiencing Cluster Flux? The growth of Hadoop over the past decade has proven that the ability of this open source technology toprocess data at massive scale, and allow users access to shared...
View ArticleLevelDB 源码分析(四):Slice
LevelDB 中的字符串并没有使用 std:string ,而是将其封装成了Slice类, Slice 是非常简单的数据结构,它包括 size (字符串的长度)和一个指向外部字节数组的指针。 返回一个 Slice 比返回 std:string 更加方便,因为我们不需要去复制大量原始的key和value的数据。 使用 slice 之前必须要保证 slice 中指针指向的内存没有被收回。 源码:...
View ArticleDividing Infinity - Distributed Partitioning Schemes
This is the second post in a series discussing the architecture and implementation of massively parallel databases, such as Vertica, BigQueryor EventQL. The target audience are software and system...
View Article图解微软ReportBuilder3连接SqlServer2008数据库表创建报表
ReportBuilder3下载; http://pan.baidu.com/s/1skFeGVj 这东西还是一个好东东; 下面演示使用ReportBuilder3连接sql server 数据库表生成报表; 一 安装 下面安装ReportBuilder3;当然需要先在Sql Server 中安装了Report服务,才能进行后面的演示;ReportBuilder3也可单独使用; 二...
View ArticlePL/SQLDeveloper客户端安装及配置
问题?PL/SQL Developer客户端安装及配置及一些问题的处理 一、问题分析 在使用PL/SQL Developer客户端工具的时候,一定要了解一下两点知识,它不同于sql...
View ArticleCentOS6.6上安装MySQL5.6
1、首先第一步是安装好CentOS 6.6 先下载好centos 6.6,然后,在虚拟机中安装好系统。 需要安装vmware tools,由于VMware Tools这个目录中包含了空格,所以要用 \ 来转义空格:[root@ggg1 Desktop]# cd /media/VMware\ Tools[root@ggg1 Desktop]# tar -zvxf...
View Articleredis源码分析――replication主从复制的实现分析(1)
对于replication.c的源码分析,我将会分两部分介绍。本文主要分析slave连接master进行主从复制的同步实现。 redis-cli通过向从服务器发送slaveof命令,可以使从服务器去复制一个主服务器: slaveof...
View Article基于hadoop生态圈的数据仓库实践――OLAP与数据可视化(一)
一、OLAP与Impala简介 1. OLAP简介 OLAP是Online Analytical Processing的缩写,意为联机分析处理。此概念最早是由关系数据库之父E.F.Codd于1993年提出,至今已有20多年。OLAP允许以一种称为多维数据集的结构,访问业务数据源经过聚合和组织整理的后数据。以此为标准,OLAP作为单独的一类产品同联机事务处理(OLTP)得以明显区分。...
View ArticleCentOS6.7下使用非root用户(普通用户)编译安装与配置mysql实现mysql数据库服务随机自动 ...
CentOS6.7下使用非root用户(普通用户)编译安装与配置mysql数据库并使用shell脚本定时任务方式实现mysql数据库服务随机自动启动 1.关于mysql? MySQL是一个关系型数据库管理系统,由瑞典MySQL...
View Articlemybatis-spring官方中文教程文档(1.3.1-SNAPSHOT版本)
简介What is MyBatis-Spring?MyBatis-Spring 会帮助你将 MyBatis 代码无缝地整合到 Spring 中。 使用这个类库中的类, Spring 将会加载必要的 MyBatis 工厂类和 session 类。 这个类库也提供一个简单的方式来注入 MyBatis 数据映射器和 SqlSession 到业务层的 bean 中。 而且它也会处理事务, 翻译...
View Articlemybatis入门基础(五)----动态SQL
一:动态SQL1.1.定义 mybatis核心对sql语句进行灵活操作,通过表达式进行判断,对sql进行灵活拼接、组装。 1.2.案例需求 用户信息综合查询列表这个statement的定义使用动态sql,对查询条件进行判断,如果输入参数不为空才进行查询拼接。 1.3.UserMapper.xml 1 5 7 select * from t_user 8 9 10 11 12 and...
View ArticleMybatis入门基础(一)
一:对原生态JDBC问题的总结新项目要使用mybatis作为持久层框架,由于本人之前一直使用的Hibernate,对mybatis的用法实在欠缺,最近几天计划把mybatis学习一哈,特将学习笔记记录于此,方便大家参考,也方便自己查阅。 话不多说,先看看原始的JDBC程序代码,看看这样的代码存在什么问题。 package com.utils;import...
View ArticleHadoop Webinar: Making Business Intelligence Work on Hadoop
Hadoop Webinar: Making Business Intelligence Work on Hadoop August 11, 2016/ inProduct Knowledge / by Remy Rosenbaum Learn how Jethro seamlessly integrates with BI tools to achieve interactive BI on...
View ArticleThe Opportunity Ahead
You have probably heard I recently decided to leave Hortonworks. Rob shared some kind words earlier this week and I would like to take this opportunity to shout THANK YOU to Rob and the entire...
View Article