Partialbackup备份指定表/库
Partial BackupsXtraBackup支持partial backups,这意味着你可以只备份部分表或库.要备份的表必须是独立表空间,即inn_file_per_table=1有一点需要注意的是,部分备份不要copy back prepared backup.restore partial backups应该用导入,而不是–copy-back创建partial...
View ArticleSpark在文本统计中的应用
问题起因学长之前用Java写了一个程序,有两个文档,其中一个文档是regular expression,大概有8万行,每一行是一个regular...
View ArticleSQL列属性
列属性: 真正的约束字段的是数据类型,但是数据类型的约束很单一,需要有一些额外的约束,来保证数据的合法性。 列属性有很多:NULL / NOT NULL,default,primary key,unique key,auto_increment,comment 空属性 虽然数据库基本都是字段为空,但是开发的时候,尽量保证所有的数据都不应该为空,空数据没有意义,空数据也没有办法参与运算。...
View ArticleMark Needham: Neo4j/scikit-learn: Calculating the cosine-similarity of Game...
A couple of months ago Praveena and I created a Game of Thrones dataset to use in a workshop and I thought it’d be fun to run it through some machine learning algorithms and hopefully find some...
View ArticleInside DSE Graph: What Powers the Best Enterprise Graph Database
DSE Graph is a scalable, real-time graph database which was released at the end of Juneas a new addition to the DSE platform. After recovering from the turbulence of a major release, the time has come...
View ArticleRedis学习笔记2-进阶
Redis学习笔记1-基础命令及数据结构: http://blog.guoyb.com/2016/07/21/learn-redis-basic-commands/ 学习笔记的第二部分记录Redis的进阶内容,如事务、过期时间等。 事务...
View ArticleIntroduction to data Artisans and Flink
data Artisans and Flink basics start: Flink is an Apache project sponsored by the Berlin-based company data Artisans. Flink has been viewed in a few different ways, all of which are similar to how...
View ArticleApache Spark grows in popularity as Hadoop-based data lakes fill up
At Sky Betting and Gaming (Sky Bet), promotions are the key to bringing in punters keen to place a stake on a winning team or horse, to try their luck at poker, or to go “eyes down” in a game of bingo....
View ArticleApple's AI Plans, MapR Raises $50M: Big Data Roundup
Hadoop distributor MapR raises new round of equity funding and hints at possible IPO, Salesforce acquires another analytics startup, PwC partners with Coursera on a data analytics course, and Apple CEO...
View Article非关系型数据库性能调优
Mongodb 1、Mongodb优化: a、语句优化可能通过Profile找到执行时间长的语句。db.getProfiling.Level()来获取profile级别 db.system.profile.find()查看profile记录。...
View Article使用redis-trib.rb-官方推出的管理redis集群的工具。
需要安装ruby 在开始搭建redis之前,你需要确保你本地有ruby(2.0以上),且该ruby 中有redis 扩展包。 需要有ruby redis包 //验证是否安装好ruby redis扩展包:[这里查看ruby 扩展包有更好的办法请告诉我,我对ruby完全不熟悉]//如果没有安装好ruby redis,请看"2.1 安装ruby redis 扩展包",//如果已经安装好,直接看"二...
View Article视频演讲: Hadoop at 10: the History and Evolution of the Apache Hadoop Ecosyste ...
个人简介 Todd Lipcon,自2009年初开始担任Cloudera Software Engineer,负责开源项目Apache Hadoop生态的各模块设计。2009年至2012年专注于Apache HBase, HDFS, and...
View Articlesql高级查询语句总结
–这是一个学生成绩管理系统,创建数据库表语句在最后,表包括四张表tblStudent 学生信息表,tblScore 成绩表 ,tblteacher 教师信息表,tblcourse 课程表–希望大家学会使用mysql数据库,以后工作中使用的数据库是由公司决定,有可能是mysql数据库也有可能是oracel...
View ArticlePostgreSQL安装与配置介绍
安装 Postgresql服务的安装和初始化,根据不同的linux发行版本而有所差别。本文档目的在于总结如何在最近的fedora系统版本上,进行postgresql的基本安装。首先,你可能考虑到先安装fedora的较新版本,请查看网址。但是,不太建议你这么做。$ sudo yum install postgresql-server postgresql-contrib或者使用fedora...
View Article关于vertica的ConnectionFailover
最近在生产中发现vertica有个别节点老师宕机,实际业务中有python通过odbc连接vertica,还有jdbc连接vertica。加入你连接的那个节点正好是down的节点或者是standby节点,那么就会连接失败,程序就会报错,影响正常业务。其实vertica官方文档已经给出了解决方法。 ODBC Connection Failover...
View Article代码级操作指南 | 如何在Docker Swarm中运行服务
最新版本Docker Engine v1.12中,包含了多项与Docker Swarm紧密相关的功能变更。在今天的文章中, 数人云 将和大家探讨如何利用Docker的Swarm Mode进行服务部署。 在Ubuntu 16.04之上激活Swarm Mode 在向Docker Engine...
View Article初识 MongoDB
之前对于 MongoDB 的了解比较泛泛,也是因为在工作中使用的比较少的缘故,好吧就是没用过。。。最近工作上新项目使用的主要数据库为 MongoDB,那么正好系统的了解学习一下。 简介 MongoDB 是一款为 Web 应用程序和互联网基础设施设计的数据库管理系统。MongoDB 的数据模型和持久化策略的设计目标是提供高读写吞吐量,在易于伸缩同时还能进行自动故障转移。 MongoDB 的主要特性:...
View ArticleMongoDB 学习笔记(一)
整理学习通过常见编程语言操作使用 MongoDB,因为阅读的书籍和资料多以 Ruby 为主,所以一并整理并总结两种编程语言的使用方式(Ruby & php),整理 PHP 主要原因是因为工作项目使用。 Ruby 篇 安装 MongoDB 的 Ruby 驱动 因为 Ruby 拥有自己的包管理系统 RubyGems,故使用其安装即可。 $ gem install mongo Fetching:...
View Article教你成为全栈工程师(Full Stack Developer) 四十六-利用yarn多队列实现hadoop资源隔离
大数据处理离不开hadoop集群的部署和管理,对于本来硬件资源就不多的创业团队来说,做好资源的共享和隔离是很有必要的,毕竟不像BAT那么豪,那么怎么样能把有限的节点同时分享给多组用户使用而且互不影响呢,我们来研究一下yarn多队列做资源隔离 请尊重原创,转载请注明来源网站www.shareditor.com以及原始链接地址 CapacityScheduler...
View ArticleCouchbase 使用 cbbackup 备份
cbbackup 工具 是一个灵活的备份命令, 使您可以备份本地数据和远程节点和涉及您的集群数据的不同组合: 单节点单buckets 单节点上所有buckets 整个群集上单个buckets 整个群集上所有buckets 备份可以在一个单独的节点直接拷贝文件,也可以通过连接远程群集然后通过数据流的形式保存到备份位置。备份可以运行在运行的节点或集群或脱机节点上执行。 cbbackup...
View Article