2016db.pdf - 双体系卓越人才教育基地

99

Transcript of 2016db.pdf - 双体系卓越人才教育基地

目录

大会简介........................................................................................................................ 1

大会概况 .................................................................................................................... 1

大会介绍 .................................................................................................................... 2

大会整体日程安排 .................................................................................................... 5

全体大会........................................................................................................................ 9

数据定义未来 ............................................................................................................ 9

聚焦大数据+引领行业变革 .................................................................................... 16

专场论坛...................................................................................................................... 20

数据库架构设计 ...................................................................................................... 20

NoSQL 技术实践 ...................................................................................................... 25

数据加速技术 .......................................................................................................... 30

实时计算与流计算 .................................................................................................. 34

SAP 技术交流专场 ................................................................................................... 40

我的 DBA 之路 ......................................................................................................... 41

数据库性能优化 ...................................................................................................... 46

大数据应用及实践 .................................................................................................. 51

数据架构&治理 ....................................................................................................... 56

数据挖掘&BI ............................................................................................................ 60

大数据安全 .............................................................................................................. 65

大数据行业应用及探索 .......................................................................................... 69

推荐系统架构及算法 .............................................................................................. 73

人工智能 .................................................................................................................. 77

参会总结与感想.......................................................................................................... 83

重庆双体系软件技术教师代永亮参会总结 .......................................................... 83

重庆双体系项目助理周婷婷参会总结 .................................................................. 86

重庆双体系十期学员唐伟参会总结 ...................................................................... 89

山西双体系软件技术教师刘金良参会总结 .......................................................... 92

山西双体系职场能力教师陈江会参会总结 .......................................................... 94

山西双体系六期学生张天浪参会总结 .................................................................. 96

1

大会简介

大会概况

随着大数据影响力的不断扩张以及其相关技术的深入发展,大数

据从互联网领域向其他行业急速蔓延,行业、金融、政府等领域爆发

大数据风潮,大数据对传统行业的影响越来越深重。2015 年,国务

院常务会议通过了《“互联网+”行动指导意见》,明确推进“互联

网+”促进协同制造、现代农业等 11 个重点领域,以“互联网+”深

度改造传统行业,数字驱动转型,促进产业跨界升级,进而助力经济

转型升级。今时今日,各行业都意识到,大数据已成为现代发展的核

心资源之一,那么对于新的资源我们应如何最大化的发掘、治理和应

用,使企业在数字主导的未来中获得长远发展?

作为国内数据库与大数据领域最大规模的技术盛宴,2016 第七

届中国数据库技术大会(DTCC)将如约于 2016 年 5 月 12 日-14 日再

度震撼来袭。大会以"数据定义未来"为主题,云集了国内外顶尖专家,

共同探讨 MySQL、NoSQL、Oracle、缓存技术、云端数据库、智能数

据平台、大数据安全、数据治理、大数据和开源、大数据创业、大数

据深度学习等领域的前瞻性热点话题与技术。本届大会共设定 2 个主

会场,25 个分会场,并将吸引 5000 多名 IT 人士参会,为数据库人群、

大数据从业人员、广大互联网人士及行业相关人士提供最具价值的交

流平台。

2

大会介绍

数据库架构与技术实现

传统关系型数据库的架构设计与优化、数据库加速技术、实时计

算与流计算和特定领域的应用经验和优化心得,都是我们大会的讨论

热点。本届大会除以上内容外,还增加了对传统关系型数据库与新型

数据库融合的讨论,包括 NoSQL 的技术应用实践等话题。传统的关

系型数据库对海量数据带来的问题显得力不从心。NoSQL 数据库、分

布式数据库等因此而生,它们为解决海量数据提供了多种选择,也越

来越被用户认可。NoSQL、NewSQL 与传统关系型数据库的关系不再

是你死我活,而是趋向融合。

本届大会我们邀请到国内外顶级的 Oracle、SQL Server、MySQL

和 PostgreSQL 等传统关系型数据库的技术专家,以及 NoSQL、云计算

等领域的技术专家和大家分享这些技术和产品的最新动态,以及在各

个行业领域里的应用部署和管理经验。

行业大数据挖掘、应用及实践

大数据成为了新的自然资源,蕴含着丰富价值,这一点已经毋庸

臵疑。随着观念的进步,大数据作为工业革命 4.0 的核心及趋势,人

们对它的关注已经从表层的概念争论深化到了实际价值发现,工业大

数据、农业大数据、健康大数据等等,大数据内尚有巨量潜在价值等

待发掘。

2016 中国数据库技术大会以“数据定义未来”为主题,特别开

设了“大数据应用及实践”、“数据挖掘和 BI”、“初创企业技术实

3

践”、“大数据生态系统”等专场。

数据库与云计算结合的深度探讨

随着海量结构化数据与非结构化数据的快速增长,越来越多的供

应商相继推出了云技术,在云中托管数据库,如阿里云、腾讯云、亚

马逊云等,其中更有数据库巨头 Oracle 全面云化。由此结合大数据的

发展趋势可见,云端将是大数据前进的最终归宿。云服务供应商提供

了一系列服务让用户轻松完成数据库的扩展,将用户从繁琐的数据库

硬件定制中解放出来,比如 AWS、EnterpriseDB、Garantia Data、Google

Cloud SQL、Azure、MongoLab、SAP、Xeround、Rackspace、StormDB

等。本届大会开设了“云端数据库”、“数据库自动运维”“数据库

技术前瞻”等专场,分享前沿数据库技术及实践案例。

大数据安全

当大数据风暴袭卷传统行业,政府、科研、金融、医疗等行业纷

纷将大数据提升至战略规划,市场对数据安全的要求也就越来越高。

但受开源技术和云计算等因素的影响,管理运维形式多维化,数据管

理以及安全保障的难度不断增加。

本届大会数据安全专场,我们将邀请各领域数据库技术专家,为

大家分享相关行业案例与技术安全解决方案。

2016 中国数据库技术大会会场面积达到 1000 平方米,共有 23

个会场 50 个展位,并且,将重磅邀请 130 位知名数据库和大数据行

业技术专家参会分享。本届大会嘉宾顾问团成员包括,云和恩墨创始

4

人盖国强、阿里巴巴高级研究员阳振坤、腾讯数据平台部总经理蒋杰、

网易杭州研究院副院长汪源、百度大数据部架构师马如悦等等。

2016 中国数据库技术大会将紧扣技术热点,专门安排了行业大

数据、云数据库专场等进行技术交流探讨,同时秉承理论结合实际的

原则,大会期间将邀请企业开设展台进行互动或招聘,以及邀请高校

开展学术坐堂和动手实验专场、开设大会晚宴交流 party。除此以外,

2016 中国数据库技术大会特别举行“2016 中国大数据技术 100 人评

选”活动,让影响中国大数据和数据库技术的专家能够共聚一堂,并

在大会主会场现场颁出杰出贡献奖 10 人。

路漫漫其修远兮,吾将上下而求索!第七届中国数据库技术大会

将成为引领大数据技术的风向标,汇聚大数据领域的顶尖专家,打造

一场大数据领域极具价值的技术实战。2016 年 5 月 12 日-14 日,北

京国际会议中心我们不见不散!

5

大会整体日程安排

6

7

8

9

全体大会

数据定义未来

演讲课题:

Oracle 数据库技术创新与市场领导力

演讲嘉宾:

吴承杨

甲骨文公司副总裁

嘉宾简介:

2008 年北理工硕士毕业,毕业以来一直在中

航信研发中心工作,2012-2014 年任中航信重庆

研发中心测试部门经理。2015 年担任离岗核心系

统研发项目的测试经理。主要方向是自动化测试

框架、测试过程改进及持续集成全栈技术的研

究。

内容简介:

应用 ATDD 的过程中会因为支撑可执行用例的中间层及底层脚本

维护成本过高而走向失败。使用 DSL 语言逐步隔离业务关键字的方式

中断言的复杂性会随着项目关联系统复杂性增加而增加,运行稳定性

降低。在中航信进行的离岗核心系统研发过程中,使用建立并统一管

理跨系统的特征抽象测试数据,提升关键字运行的稳定性。同时可以

很好的配合 MOCKSEVER 在早期执行基于 mock 的可执行自动化,系

统间集成测试过程中可以复用早期单系统脚本。

10

演讲课题:

闪存数据中心的新趋势——3D-NAND

演讲嘉宾:

阳学士

宝存科技 CEO

嘉宾简介:

2008 年北理工硕士毕业,毕业以来一直在

中航信研发中心工作,2012-2014 年任中航信重

庆研发中心测试部门经理。2015 年担任离岗核

心系统研发项目的测试经理。主要方向是自动

化测试框架、测试过程改进及持续集成全栈技

术的研究。

内容简介:

应用 ATDD 的过程中会因为支撑可执行用例的中间层及底层脚本

维护成本过高而走向失败。使用 DSL 语言逐步隔离业务关键字的方式

中断言的复杂性会随着项目关联系统复杂性增加而增加,运行稳定性

降低。在中航信进行的离岗核心系统研发过程中,使用建立并统一管

理跨系统的特征抽象测试数据,提升关键字运行的稳定性。同时可以

很好的配合 MOCKSEVER 在早期执行基于 mock 的可执行自动化,系

11

统间集成测试过程中可以复用早期单系统脚本。

演讲课题:

内存计算引领新一轮数据技术

演讲嘉宾:

刘伟

SAP 大中华区副总裁, 大数据与平台事业部负责人

嘉宾简介:

刘伟先生目前负责 SAP 在大中华地区的大数

据及平台事业部,致力于推动客户向数字化企业

的全面转型,并携手合作伙伴一起打造一个基于

HANA 大数据平台的生态系统。在此之前,刘伟先

生曾长期负责微软的合作伙伴业务,以及开发工

具及平台事业部。刘伟毕业于北京大学光华管理学院,并拥有美国

Thunderbird 国际管理商学院的硕士学位,他在硅谷开始其 IT 职业生

涯,拥有丰富的行业及管理经验。

内容简介:

传统行业正在被互联经济颠覆,传统 IT 技术也正在被更多更新

的数据技术(Data Technology)影响并取代。 本演讲环节将从 21 世

12

纪最性感的职业——数据科学家出发,通过对数据技术、数据消费在

不同企业的不同阶段衍生不同的数据管理平台,到目前不可阻挡的横

跨传统关系型数据管理及开源大数据计算的内存计算融合架构的详

细阐述,让听众了解如何在当今技术驱动已经从 IT 时代全面迈向了

DT 时代,利用 SAP HANA 构建企业内外数据联动的实时大数据架构,

并通过实时数据挖掘实现数据的深度应用,最大限度的为企业和个人

带来成长价值。

演讲课题:

内存计算引领新一轮数据技术

演讲嘉宾:

宋一平

SAP 中国数据库与数据管理部售前总监

嘉宾简介:

传统行业正在被互联经济颠覆,传统 IT 技术也正在被更多更新

的数据技术(Data Technology)影响并取代。 本演讲环节将从 21 世

纪最性感的职业——数据科学家出发,通过对数据技术、数据消费在

不同企业的不同阶段衍生不同的数据管理平台,到目前不可阻挡的横

跨传统关系型数据管理及开源大数据计算的内存计算融合架构的详

细阐述,让听众了解如何在当今技术驱动已经从 IT 时代全面迈向了

13

DT 时代,利用 SAP HANA 构建企业内外数据联动的实时大数据架构,

并通过实时数据挖掘实现数据的深度应用,最大限度的为企业和个人

带来成长价值。

内容简介:

传统行业正在被互联经济颠覆,传统 IT 技术也正在被更多更新

的数据技术(Data Technology)影响并取代。 本演讲环节将从 21 世

纪最性感的职业——数据科学家出发,通过对数据技术、数据消费在

不同企业的不同阶段衍生不同的数据管理平台,到目前不可阻挡的横

跨传统关系型数据管理及开源大数据计算的内存计算融合架构的详

细阐述,让听众了解如何在当今技术驱动已经从 IT 时代全面迈向了

DT 时代,利用 SAP HANA 构建企业内外数据联动的实时大数据架构,

并通过实时数据挖掘实现数据的深度应用,最大限度的为企业和个人

带来成长价值。

演讲课题:

BI 与大数据分析领域的剧变?现状、原因和趋势

演讲嘉宾:

何春涛

永洪科技创始人&CEO

嘉宾简介:

14

拥有近 20 年的大数据、BI 和企业应用从业经

验,是 BI 和大数据领域的顶级专家。他对大数据、

商业智能领域的发展趋势、产品技术演进有着高

度的前瞻性和丰富的实践经验,其主导研发的产

品多次获得软件界的“奥斯卡”Jolt、Java One、

JDJ 等大奖。

内容简介:

Gartner 在 2016 年 2 月 发布的《BI 与分析平台魔力象限》年度

报告显示:

1.传统 BI 厂商几乎全部被驱除出了领导者象限,包括 IBM、

SAS、Microstrategy 等传统 BI 巨头无一幸免;

2.2015 年还处于领导者象限的某些传统大厂已经完全消失了,连

利基象限都没能保住;

3. Birst、Logi Analytics 等处于挑战者象限的 BI 厂商也被全部驱

除。在 Gartner 分析师眼中,居然没有一家厂商满足挑战者条件。

一年的时间里,全球 BI 与分析行业市场到底发生了哪些剧变?何春

涛将分享关于这些剧变的现状、原因和趋势,并分享数百家国内领袖

企业在 BI 与大数据分析领域的演进之路。

演讲课题:

风云再起--Oracle Database 12c 新特性和最佳实践

15

演讲嘉宾:

盖国强

云和恩墨创始人

嘉宾简介:

Oracle ACE 总监,ITPUB 版主 盖国强先生是

中国地区首位 Oracle ACE 和 ACE 总监,曾获评";

2006 年中国首届杰出数据库工程师";奖,拥有超

过 15 年的数据库实施和顾问咨询经验,对于数据

库性能优化及内部技术具有深入理解。盖国强先

生是中国地区最著名的 Oracle 技术推广者之一,他的专著《深入解析

Oracle》、《循序渐进 Oracle》等书籍受到 Oracle 技术爱好者的广泛

好评,他主编撰写的《OracleDBA 手记》系列作品是 Oracle 技术爱好

者们分享和传播技术的重要书籍。2009 年,盖国强先生创建了云和

恩墨,致力于为中国数据库用户提供专业的数据库服务,2010 年,

他与 Oracle ACE 总监张乐奕先生共同创立 ACOUG(中国 Oracle 用户

组),持续推动 Oracle 技术圈的地面活动与技术交流。

内容简介:

Oracle 12cR1 这一云数据库版本已经发布了 4 个年头,国内的很

多核心用户也已经将 Oracle 数据库运行在 12c 的版本上,而在 2016

年,12cR2 的发布,必然将用户的采用度推向高峰。在这个主题中,

我们将和大家分享国内核心用户在 12c 上的最佳应用实践,以及在

12c 第二版中,Oracle 在核心特性方面的增强,这其中包括多租户和

内存数据库两个重要方向。Oracle 将通过这一数据库版本重新赢回数

据库在云上的主动权。

16

聚焦大数据+引领行业变革

演讲课题:

大数据管理系统的发展与机遇

演讲嘉宾:

孟小峰

中国人民大学信息学院教授

嘉宾简介:

2008 年北理工硕士毕业,毕业以来一直在中

航信研发中心工作,2012-2014 年任中航信重庆

研发中心测试部门经理。2015 年担任离岗核心系

统研发项目的测试经理。主要方向是自动化测试

框架、测试过程改进及持续集成全栈技术的研

究。

内容简介:

应用 ATDD 的过程中会因为支撑可执行用例的中间层及底层脚本

维护成本过高而走向失败。使用 DSL 语言逐步隔离业务关键字的方式

中断言的复杂性会随着项目关联系统复杂性增加而增加,运行稳定性

降低。在中航信进行的离岗核心系统研发过程中,使用建立并统一管

理跨系统的特征抽象测试数据,提升关键字运行的稳定性。同时可以

17

很好的配合 MOCKSEVER 在早期执行基于 mock 的可执行自动化,系

统间集成测试过程中可以复用早期单系统脚本。

演讲课题:

大数据时代的智能金融服务

演讲嘉宾:

谢军

上海雅捷董事长兼总经理

嘉宾简介:

基于 GPU 技术的数据处理以及精准营销式

的人工智能服务,从客户信息:构建 360°立体

画像;营销信息:执行个性化的智慧营销;风险

信息:实现高效准确的风险控制三个方面,实现

典型的互联网金融大数据服务。

内容简介:

复旦大学物理系本科 牛津大学应用统计博士。 现为雅捷信息首

席数据科学家,从业 25 年,有 18 年数据仓库数据挖掘工程经验,是

中国电信行业(电信、移动)、银行业、教育业 数据仓库数据挖掘

开拓者和实践者,有近 50 个项目一线工作经历。至今编码,并享受

技术冲浪带来的刺激和乐趣。从业后曾获得人总行科技进步二等奖

18

(项目奖),农总行科技进步二等奖(个人奖),银监会科技进步奖

(项目奖)真正让大数据落地。

演讲课题:

GBase UP--SQL 与 NoSQL 的融合架构

演讲嘉宾:

武新

南大通用高级副总裁兼 CTO

嘉宾简介:

第五批“国家千人计划” 专家,法国奥尔

良大学、法国国家科研中心博士,资深数据库

专家,主导设计和研发了 GBase 8a 列存储数据

库, GBase 8a MPP Cluster 大规模并行数据库

集群等一系列产品。曾在甲骨文公司(法国)

工作 11 年。

内容简介:

重点介绍南大通用采用 SQL 与 NoSQL 的融合架构成功构造的企

业级大数据平台产品 GBase UP,并结合 GBase 8a、GBase 8t 的能力和

水平,展示南大通用产品为用户带来的价值和对业界的影响。 分享

南大通用未来三年产品规划和方向以及对于数据库行业的见解。

演讲课题:

Apache Kylin 大数据分析平台的演进

演讲嘉宾:

李扬

Kyligence 联合创始人兼 CTO

嘉宾简介:

19

联合创始人兼 CTO,Apache Kylin 联合创建

者及项目管理委员会成员(PMC), 主创团队架

构师和技术负责人,专注于大数据分析,并行

计算,数据索引,关系数学,近似算法,压缩

算法等前沿技术。曾任 eBay 全球分析基础架构

部大数据资深架构师、IBM InfoSphere BigInsights

的技术负责人,负责 Hadoop 开源产品架构,“杰出技术贡献奖”的

获奖者、摩根士丹利副总裁,负责全球监管报表基础架构。

内容简介:

最新发布的下一代 Apache Kylin 版本推出了一系列新功能,包括

可扩展的总架构,高速 Cube 构建算法,并行查询能力,准实时流式

构建,自定义聚合函数等。可扩展架构使 Kylin 更加灵活和易于扩展,

适用于各种分布式计算平台,从 MapReduce 扩展到 Spark 等新的计算

引擎。新的 Cube 构建过程针对网络瓶颈重新设计洗牌算法,提速 50%

以上。新的分片存储和并发处理带来 2 倍以上的查询的性能提速。流

式构建能满足分钟级别的准实时查询需求。自定义聚合函数带来了

TopN,精确 Count Distinct 等一系列新功能以满足不同的业务需求。

20

专场论坛

数据库架构设计

演讲课题:

从传统银行到互联网金融

——Oracle 数据库架构设计实践

演讲嘉宾:

杨廷琨

云和恩墨 CTO

嘉宾简介:

2008 年北理工硕士毕业,毕业以来一直

在中航信研发中心工作,2012-2014 年任中航信

重庆研发中心测试部门经理。2015 年担任离岗

核心系统研发项目的测试经理。主要方向是自

动化测试框架、测试过程改进及持续集成全栈

技术的研究。

内容简介:

应用 ATDD 的过程中会因为支撑可执行用例的中间层及底层脚本

维护成本过高而走向失败。使用 DSL 语言逐步隔离业务关键字的方式

中断言的复杂性会随着项目关联系统复杂性增加而增加,运行稳定性

降低。在中航信进行的离岗核心系统研发过程中,使用建立并统一管

理跨系统的特征抽象测试数据,提升关键字运行的稳定性。同时可以

很好的配合 MOCKSEVER 在早期执行基于 mock 的可执行自动化,系

统间集成测试过程中可以复用早期单系统脚本。

21

演讲课题:

达梦数据库技术新特性及国产化推进实践

演讲嘉宾:

付栓

武汉达梦数据库有限公司副总经理

嘉宾简介:

2008 年北理工硕士毕业,毕业以来一直在

中航信研发中心工作,2012-2014 年任中航信重

庆研发中心测试部门经理。2015 年担任离岗核

心系统研发项目的测试经理。主要方向是自动化

测试框架、测试过程改进及持续集成全栈技术的

研究。

内容简介:

应用 ATDD 的过程中会因为支撑可执行用例的中间层及底层脚本

维护成本过高而走向失败。使用 DSL 语言逐步隔离业务关键字的方式

中断言的复杂性会随着项目关联系统复杂性增加而增加,运行稳定性

降低。在中航信进行的离岗核心系统研发过程中,使用建立并统一管

理跨系统的特征抽象测试数据,提升关键字运行的稳定性。同时可以

很好的配合 MOCKSEVER 在早期执行基于 mock 的可执行自动化,系

统间集成测试过程中可以复用早期单系统脚本。

演讲课题:

云是未来:12C RAC 私有云架构

演讲嘉宾:

魏兴华

杭州沃趣高级技术专家

嘉宾简介:

22

就职于东软集团,阿里巴巴集团,Oracle

ACE-A,DBGEEK 用户组发起人,ITPUB 认证博客

专家,ACOUG、SHOUG 核心成员。曾在 ORACLE

技术嘉年华、ORCL-CON、YY 分享平台等公开场合

多次做过数据库技术专题分享。ORACLE INTERNAL

达人,对数据库架构设计、高并发下数据库性能调优有丰富的经验。

内容简介:

介绍了 ORACLE RAC 的架构演变,讲解了 12C RAC 出现的新技术,

以及 12C RAC 下的私有云解决方案:

SERVERPOOL+RAC+INMEMORY,能够给企业带来的业务价值。

演讲课题:

飞信数据库访问组件的演进历程

演讲嘉宾:

黄湘龙

北京新媒传信科技有限公司架构师

嘉宾简介:

飞信核心平台任职 7 年,带领飞信服务器侧

核,开发团队,撑飞信产品迭代同时,保障亿级,

用户、数百万在线系统的平稳运行,全程参与飞信

架构设计与核心代码编写,对承载亿级用户的高可

用应用云平台架构有深刻理解。组建、带领开发团

队打造中东陌生人交友 App,从开始写第一行代码

到产品商用,全程主导产品的开发,包括通信协议设计、各平台协议

栈实现、数据库设计、服务器高可用架构等。深度理解互联网应用开

发技术,包括高效的二级制协议栈,服务器端高可用框架设计,面向

海量数据的 JAVA 应用开发,WEB 前端开发,JAVA 性能调优等。

23

内容简介:

飞信,在线用户数曾经长期排名全国第二的 IM 软件,经历了从

10 万在线用户到 400 万在线用户的成几何倍数上升的过程,在这个

过程中,飞信系统架构不断演进以适应不断增长的业务压力。飞信的

数据库访问组件这块也经历了多个版本演进,最终稳定地支持了 7 亿

多注册用户,三个机房的规模。我有幸参与了飞信后端架构演进的整

个历程,对于扑面而来的一个一个坑,我们兵来将挡,水来土掩,用

最合适的架构设计,动态扩容系统,解决了业务压力带来的系统压力。

飞信的数据库访问的形式经历了三个大的阶段,第一阶段是组件形

式,简单高效,后来的服务形式,收敛了数据库连接,对数据库进行

了保护封装,最终演进到数据库代理形式,解耦了数据库服务和其他

服务。

演讲课题:

魅族互联网发展路程之数据库篇

演讲嘉宾:

左兴宇

魅族首席 DBA

嘉宾简介:

原美国 saas 营销软件公司 Demandforce 北京

研发中心高级 DBA,2013 年加入魅族数据库团队,

对数据存储技术有浓厚兴趣。主导魅族核心机房

迁移,用户数据业务 DB 架构优化,应用中心架构

优化,多机房业务容灾数据方案落地,闪存技术

落地等工作。

内容简介:

主要介绍魅族年出货量从 400 万到 2000 万,用户数 300 万增长

24

到 4500 万的过程中,数据库作为关键存储技术所遇到的问题,以及

我们的如何解决这些问题的。内容包括环境标准化,两地三中心,数

据库服务高可用,读扩展,数据一致性保证,数据库 IO 瓶颈解决,

数据库分表分库方案,超大数据量的日常运维,缓存技术对关系数据

库的补充,应对数据灾难的经验等。

主要技术点:

1:MySQL,Redis,MongoDB,zookeeper,MHA,LVS;

2:单机房到多机房,GSLB;

3:数据分片,用户分片;

4:SSD 闪存的应用;

演讲课题:

数据库一致性架构设计实践

演讲嘉宾:

沈剑

58 到家技术委员会主席

嘉宾简介:

互联网架构技术专家,“架构师之路”公众

号作者。曾任百度高级工程师,58 同城高级架构

师,58 同城技术委员会主席,58 同城 C2C 技术

部负责人,58 同城技术学院优秀讲师。2015 年 9

月调任至 58 到家,任技术委员会主席,技术总监,

负责数据库、后端平台、基础服务、架构部、测试平台等多个后端部

门。58 沈剑本质是技术人一枚,爱沉淀总结,常在深夜写写技术文

章,欢迎同行沟通交流。

内容简介:

一、数据库架构设计时会有什么一致性问题;

25

二、“并发写”一致性问题实践;

三、“伪分布式事务”一致性问题实践;

四、“数据冗余”一致性问题实践;

五、“数据迁移”一致性问题实践;

六、“主从库”一致性问题实践;

七、“数据库与缓存”一致性问题实践;

NoSQL 技术实践

演讲课题:

MongoDB 在 58 同城的应用实践

演讲嘉宾:

孙玄

58 同城技术委员会架构组主任

嘉宾简介:

58同城高级系统架构师,技术委员会架构组

主任,产品技术学院优秀讲师,58同城即时通讯、

C2C 技术负责人,代表 58 同城多次参与 QCon、

SDCC、DTCC、Top100等业界大会嘉宾演讲,并为

《程序员》杂志两次撰稿。前百度高级工程师,

参与基础系统的设计与实现。毕业于浙江大学。

内容简介:

2011年,我们开始使用 MongoDB,逐步覆盖了 58同城、赶集网、

58 英才等多条业务线。随着每天数据量和请求并发越来越大,为

MongoDB在存储与处理方面带来了诸多的挑战。面对百亿量级的数据,

我们该如何存储与处理。

本文将详细讲述 MongoDB在 58同城的应用实践:

26

MongoDB在 58同城的使用情况;

为什么要使用 MongoDB;

MongoDB在 58同城的架构设计与实践;

针对业务场景我们在 MongoDB中如何设计库和表;

数据量增大和业务并发,遇到典型问题及其解决方案;

MongoDB集群服务治理。

演讲课题:

游戏云存储--TRedis 高性能缓存及持久化

演讲嘉宾:

康中良

腾讯互娱高级 DBA

嘉宾简介:

2009年毕业加入互娱运营部,09-11年为业

务运维,12 年至今任互娱 DBA. 目前主要工作方

向是 TRedis 项目研发及 TRedis 在游戏的推广。

先后参与的项目包括: 腾讯 TMySQL 开发,腾讯

游戏云存储(GCS)系统设计&开发,腾讯游戏

Redis集群设计&开发&推广,TRedis设计。热衷技术包括:数据库、

系统架构、负载均衡、缓存技术、分布式存储、网络、系统等方面。

致力于为用户解决技术问题,并提供便捷、可靠的存储层解决方案。

内容简介:

TRedis是腾讯互娱基于官方 Redis,以 Rocksdb为存储引擎定制

的一个 Redis 版本。TRedis 主要特性是支持 Redis 数据直接落地到

SSD磁盘,大大减少 Redis数据大量存储的内存耗用,节省成本,同

时提供一致性备份、增量同步及在线迁移支持等特性,方便 Redis的

管理。本次分享主要介绍 TRedis 的架构,定制特性及应用,分享腾

27

讯游戏在 TRedis存储这块的经验。

演讲课题:

如何在 MongoDB 中实现强事务

演讲嘉宾:

唐建法

MongoDB 大中华区首席技术顾问

嘉宾简介:

MongoDB大中华区首席技术顾问 MongoDB中

文社区发起人, 曾任 FedEx首席架构师。

内容简介:

oin, ACID 事务, 是关系型数据库可以用来嘲笑分布式数据库

的两大核心功能。可你是否知道,也正是 Join和强事务这两个枷锁,

扼制了关系型数据库的查询(Join)和并发写入(ACID 的锁)性能。程

序员可以很牛叉,代码可以很优化,但是这对提高数据库的物理性能

没有任何用处。相反,事务的处理则可以通过程序的方案来巧妙解决。

这个讲座 TJ 会通过一个具体案例(代码)来给大家介绍在面临高并

发需求又涉及到多表多文档事务性的场景下的应对策略。

演讲课题:

NoSQL 向 NewSQL 的演进

演讲嘉宾:

王涛

SequoiaDB 巨杉软件联合创始人&CTO

28

嘉宾简介:

曾就职于 IBM DB2 数据库北美实验室,作为

IBM DB2 全球最高技术专家小组的成员,参与了

IBM 下一代大数据平台的架构规划,精通数据库

内核及体系结构,是数据库领域国际顶尖的专家。

在 IBM 多伦多实验室工作了八年后,王涛选择了

回国创业。王涛是大数据、数据库和开源领域的专家,对于开源技术、

开源社区以及开源商业模式都有深刻的理解。

内容简介:

从技术和业务的角度,向听众介绍新一代分布式数据库中,NoSQL

向 NewSQL演进、靠拢的这一趋势以及新一代 NewSQL的优势所在。介

绍这一演进过程中出现的新技术,并通过实际的应用展现其实际应

用。

演讲课题:

MongoDB 服务化及其在网易游戏中的应用

演讲嘉宾:

黄文宇

网易游戏-系统运维专家

嘉宾简介:

网易游戏 MongoDB团队负责人;网易天下 3、

天谕等端游及乱斗西游、天下 HD等系列手游的

运维负责人,专注运维系统体系设计与运维自动

化、服务化等方面研究。

内容简介:

MongoDB 作为 NoSQL数据库的代表,在为网络游戏提供了非常好

29

的数据存储体验,在网易游>戏也得到了大量应用。本次分享将会为

大家简单介绍网易游戏的应用范围,以及如何将 Mongo服务化,划分

调度资源与提供服务的方式。总结分析网易游戏在 mongoDB业务上线

两年来遇到的几个影响整个业务集群可用性的故障以及应对措施。主

要技术点:MongoDB、云服务化、自动化运维。

演讲课题:

MongoDB 多数据中心的使用姿势

演讲嘉宾:

周李洋

Teambition 运维总监

嘉宾简介:

Teambition运维总监,社区常用 ID:

eshujiushiwo;专注运维与 MongoDB领域;大陆

首位 MongoDB Certified Professional;MongoDB

Contribution Award获得者;CSDN MongoDB版主;

DBA PLUS联合发起人。

内容简介:

作为近年最为火热的文档型数据库,MongoDB受到了越来越多人

的关注,尤其是非常多的互联网公司都开始使用 MongoDB,但是随着

业务的发展,多 Data Center的需求,跨 Data Center的需求也随之

而来。本次分享将为大家介绍多种 MongoDB Multi-Data Center的解

决方案,各类方案的技术要点,适用情况分析等。并分享 Teambition

正在开发与使用的 Multi-Data Center方案。

30

数据加速技术

演讲课题:

百分百 Postgres,百倍性能提升

演讲嘉宾:

田丰

Vitesse Data CTO

嘉宾简介:

威斯康星大学博士,曾就职 Microsoft SQL

Server, Greenplum, VMware, Datrium。长期

从事数据库,虚拟化核心技术研究。 现为

Vitesse Data CTO/Founder。

内容简介:

最近硬件的高速发展使传统的数据库构架成为大数据应用的瓶

颈。Vitesse DB 使用 LLVM, SIMD, SPMD, Column Store 等技术,

大幅度提升数据仓储系统的性能。在保持与 Postgres 完全兼容的前

提下,Vitesse Data 几十倍甚至上百倍的提升查询性能。Vitesse MPP

将这些技术应用于 Greenplum 这种 MPP 架构,可以高效处理 PB 级

数据。

演讲课题:

流数据库及内存计算加速物联网数据分析

演讲嘉宾:

刘睿民

柏睿数据董事长兼 CTO

嘉宾简介:

31

国家信标委ISO SC32 SQL9075国际专家, 国

家信标委 ISO WG10 IoT物联网国际协调员, 柏

睿数据科 技有限公司董事长兼 CTO, 联想中国

服务总部前首席技术顾问,早年获得新 加坡电

信海外全额奖学金赴美科罗拉多大学Boulder分

校攻读博士。同期加盟惠普实验室主攻海量并行

MPP数据库,之后先后参与 Nonstop SQL/MP, SQL/MX及 Neoview的

实现。后加盟美国 摩托罗拉总部,专注于 911 城市应急及智能指挥

联动系统,ITS 系统及智慧城市 CAD 系统的设计 与实施,系统曾广

泛应用于世界各大城市如伦敦、芝加哥、纽约、洛杉矶等。2004 年

回国后 历任华胜天成 CTO,惠普大中华区数据挖掘总监,太阳微系

统/甲骨文大中华区管理服务总经理及专业服务总裁。2013年起在协

同联想中国服务总部组建大数据团队时开始自主研发国内首创的 MPP

内存数据仓库引擎,现已推出 MPP内存数据仓 库 RapidsDB/分布式

内存流数据库 Rapids StreamDB。 专著:《政府管理创新与电子政

务》 汪玉凯 陈拂晓 刘睿民 王延章

演讲课题:

用户体验为王--网易视频云在数据传输方面的优化实战

演讲嘉宾:

邱似锋

网易杭州服务端技术专家

嘉宾简介:

网易杭州研究院部门经理、服务端技术专家。

07 年浙大计算机系毕业后,一直在网易公司从事服

务端开发工作。分别领导了分布式数据库、分布式

文件系统、云存储平台、云数据库平台、视频云产

32

品的研发工作。在超大规模分布式系统和高性能服务器开发方面有丰

富实战经验。

内容简介:

如何让用户能够通过互联网最快的获取到云端的数据?如何能

够保证在弱网条件下用户体验最佳?网易视频云作为承载整个网易

公司多媒体类应用的基础技术平台,在这方面做了非常多工作。本次

分享将详细讲解我们如何在全球范围内构建起一个数据上下行加速

体系,并从各种维度进行深度技术优化。

演讲课题:

腾讯云数据库内功修炼之道

演讲嘉宾:

祝百万

腾讯系统架构师,数据库架构师

嘉宾简介:

系统架构师,数据库架构师,拥有 8 年研发、

产品设计经验。擅长高并发、大规模后台服务,

对数据库云化工作有丰富的经验。目前就职于腾

讯云从事数据库产品的研发和产品管理工作。

33

内容简介:

介绍腾讯云在数据库方面的技术解决方案、遇到的问题和所做出

的创新,以及在开源数据库 Mysql PostGreSQL Redis MongoDB 的一

些优化;同时介绍商业数据库 Oracle SQLServer等的一些技术亮点;

以及云时代的数据库发展方向,数据库应用趋势等。腾讯云数据库团

队是一个专业的数据库团队,对各种数据库产品都有云化,在游戏、

金融、移动、O2O、 政企、制造业、教育、视频等领域都有丰富的产

品经验。

演讲课题:

RocksDB: Key-Value Store Optimized for Flash-Based SSD

演讲嘉宾:

董思颖

Facebook Inc软件工程师

嘉宾简介:

Siying Dong is a software engineer

working in the Database Engineering team at

Facebook, focusing on RocksDB. He also

worked on Hive, HDFS, and some other data

warehouse infrastructures. Before joining

Facebook, Siying worked in the SQL Azure

Team at Microsoft. He received a bachelor’ s degree from

Tsinghua University and a master’ s degree from Brandeis

University.

内容简介:

RocksDB is an embedded persistent key-value store for

low-latency and high-throughput workload. It has been adapted

34

to a wide range of workloads, including RocksDB as an embedded

DBMS and as storage engines of other DBMS systems. Our

benchmarks show RocksDB can achieve 126K random reads per

second on flash and 7 million random reads per second on memory.

RocksDB also uses half the space as InnoDB, writes out half

the bytes to SSD with a similar read and write performance,

under the same MySQL test workload. In this talk, we will start

with typical use cases of RocksDB and then describe basic

architecture of RocksDB. We will explain why RocksDB is

SSD-friendly by showing our view of performance on SSD. Its

mainly about trade-offs among read , write and space

amplifications. By tuning RocksDB compactions users can strike

a balance among the three. Finally, we will introduce the

features of compaction filters, merge operators, backup

engines and transactions.

实时计算与流计算

演讲课题:

Transwarp StreamSQL:A SQL/PLSQL Stream engine on Spark

演讲嘉宾:

季钱飞

星环科技 Transwarp Stream系统架构师

嘉宾简介:

星环信息科技初创成员、Transwarp Stream系

统架构师,具有丰富的流式计算和分布式系统的经

验。

35

内容简介:

流处理应用正在越来越多的行业中扮演重要的角色,完成了传统

数据库和批处理所不能完成的功能,如智能城市、风电行业中设备的

监控甚至银行的风险控制业务。 Transwarp Stream是基于 Spark开

发的支持 SQL的流计算执行引擎,支持完整的 SQL语法(SQL2003)、

支持 PLSQL(Oracle PLSQL 11g、 DB2 PLSQL)、完善的任务管理、

高性能高可靠性等特点。 通过 SQL 实现流处理应用,可以提高开发

效率,降低迁移维护成本,而且可以更灵活地在流上做扩展,如机器

学习等。

演讲课题:

携程实时数据平台的实践

演讲嘉宾:

张翼

携程大数据平台的负责人

嘉宾简介:

携程大数据平台的负责人,浙江大学硕士毕

业,2015 年初加入携程,主导了携程实时数据计

算平台的建设,以及携程大数据平台整合和平台技

术的演进;加入携程之前在大众点评从事大数据基

础架构以及数据平台建设的相关工作,从 0开始规

划和搭建点评的大数据基础平台; 在大数据底层框架(Hadoop ,

36

Hive, Spark, Storm …)以及数据平台建设方面有丰富的经验和

实践。

内容简介:

携程的实时数据平台是基于 Kafka和 Storm构建的,这次分享主

要将分享我们在实时数据平台的构建,作业管理,监控告警等方面的

经验和教训,以及实时数据平台的一些应用,同时也会分享我们自己

在技术上的思考以及未来的工作方向;面向的人群是对于大数据技术

和实践感兴趣的工程师或技术经理。

演讲课题:

1 号店搜索实时更新架构实践

演讲嘉宾:

周航

1号店搜索架构团队负责人

嘉宾简介:

2012年加入 1号店,目前负责搜索架构相关工

作,推进分布式搜索平台、实时更新、搜索监控、

性能优化、搜索基础数据等架构改造。加入 1号店

之前,在 EMC中国研发中心负责云存储系统 Atmos

的开发,包括存储资源服务、系统在线升级等工作。

内容简介:

主要分享 1号店在搜索实时更新系统构建中的架构演进,包括:

(1)如何实现更新流程可跟踪和可监控;

(2)如何保证批量更新与实时数据的一致性;

(3)如何尽量保证各个来源更新调度的公平;

(4)如何提升更新系统的吞吐量等几个方面,分享架构改造过

程中积累的经验和教训

37

面向的人群是对搜索系统、实时更新感兴趣的工程师或技术经

理。

演讲课题:

爱奇艺实时数据采集计算平台--Venus

演讲嘉宾:

叶炜晨

爱奇艺实时计算团队负责人

嘉宾简介:

毕业于上海交通大学计算机系,2014年加入

爱奇艺云平台。长期跟踪大数据相关技术发展,

先后从事 HBase/Storm/Spark/Kafka/Flume 等多

项大数据架构相关业务。目前主要负责爱奇艺实

时计算分析平台相关工作。

内容简介:

Venus 是爱奇艺研发的一套实时数据的采集计算的综合解决方

案。该方案专注于为公司各业务提供专业、灵活、可扩展的实时数据

接入处理平台,对各类数据实时地进行汇总分析,分析结果可及时的

反馈到各业务线(播放系统,搜索,CDN,会员等),用于故障排查、

报警,日志分析,指标统计,智能化运营等场景,上线以来,日均处

理数据量近 50TB。Venus平台技术的实现是基于 Spark Streaming,

Flume,Kafka,Elasticsearch,Hadoop等大数据技术的二次开发应

用,不是简单的部署搭配。本演讲将和大家分享一下 Venus的各个模

块的设计思路和关键技术的实现细节。

38

演讲课题:

360 云盘实时存储计算系统

演讲嘉宾:

郭东东,倪传蕾

奇虎 360技术经理,高级软件工程师

嘉宾简介:

郭 东 东 : 熟 悉 HDFS 、 Cassandra 、

BigGraph、Kylin等大数据存储分析平台,负

责 360 公司大数据存储系统的开发及运维、

对开源系统进行二次开发,平台规模超过 4w+

服务器,支持公司大量搜索、云盘、安全、

商业广告等业务; 倪传蕾,男,江苏南通人,

2014 年毕业于南京大学计算机系,现在奇虎 360 从事实时计算方面

的工作,主要关注 Storm、Kafka、Spark Streaming和 Druid等技术。

内容简介:

360云盘采用 Cassandra作为后端存储,满足云盘海量数据的实

时读写需求,纯数据量约 400PB,每天新增 500TB, 完善的跨 IDC 备

份方案,数据采用 EC存储方案(1.4 副本存储), 计算:storm为云

39

盘业务提供缩略图在线生成、视频转码、热门文件计算、实时统计,

通过 drpc 的方式将 storm 的业务逻辑以服务化的方式呈现,毫秒级

相应业务请求,定制了 Storm框架与多语言的交互协议,方便业务部

门使用 php、python等语言编写 storm服务。

演讲课题:

移动广告中的实时计算

演讲嘉宾:

汪巍

多盟架构师

嘉宾简介:

09 年硕士毕业于哈尔滨工业大学,加入百度

有啊,12 年 2 月加入多盟,先后负责广告检索、

基础平台团队、海外项目团队。在多盟 ADN 时代

负责广告检索工程优化,DSP/RTB时代做了第一版

架构设计及选型沿用至今,带领海外技术产品团

队设计完成了 D3项目,使多盟成为中国第一家 Facebook Marketing

Partner。

内容简介:

移动互联网广告市场日趋增大,如何合理运用开源组件,搭建处

理百亿级数据的实时计算系统。如何提高 kafka的可扩展性进行动态

扩容,如何提升平均单机吞吐量,如何搭建 Redis集群以合理利用机

器资源等,都是大家关心的问题,本次演讲将跟大家分享这些信息。

听众受益:了解移动广告平台的大致背景,复杂业务架构/网络环境

下的系统架构,实时计算系统的开源组件及其改进措施。

40

SAP 技术交流专场

演讲课题:

内存计算引领新一轮数据技术

演讲嘉宾:

宋一平

SAP中国数据库与数据管理部售前总监

嘉宾简介:

SAP 中国数据管理首席架构师,近 30 年的 IT

经验,从事数据库技术工作超过 18 年。亲自领导

并参与了诸多全国重要项目的方案讨论、系统论

证、技术答辩等工作。

内容简介:

传统行业正在被互联经济颠覆,传统 IT 技术也正在被更多更新

的数据技术(Data Technology)影响并取代。 本演讲环节将从 21

世纪最性感的职业——数据科学家出发,通过对数据技术、数据消费

在不同企业的不同阶段衍生不同的数据管理平台,到目前不可阻挡的

横跨传统关系型数据管理及开源大数据计算的内存计算融合架构的

详细阐述,让听众了解如何在当今技术驱动已经从 IT 时代全面迈向

了 DT时代,利用 SAP HANA构建企业内外数据联动的实时大数据架构,

并通过实时数据挖掘实现数据的深度应用,最大限度的为企业和个人

带来成长价值。

演讲课题:

利用 SAP分析与预测推进企业创新

演讲嘉宾:

41

尹海宁

SAP商务分析业务发展总监

嘉宾简介:

SAP全球预测分析专家团队成员,HANA高级

方案专家。拥有 15 年以上数据仓库与商务预测

分析解决方案经验。目前主要负责将 SAP全球预

测分析解决方案进行整合和优化,以满足中国客

户的需求。

我的 DBA 之路

演讲课题:

十年风雨数据路--从 Oracle DBA 到 ACE 总监的成长之路

演讲嘉宾:

侯圣文

恩墨学院院长

嘉宾简介:

高级培训专家、OCM 联盟创始人、ACOUG 核

心专家、DATAGURU专家团成员、Blogger ITPUB

Oracle 专题深入讨论版版主。为多家大中型企

业提供过 Oracle 相关课程培训,培训经验丰

富,讲课富有激情和感染力,善于理论联系实践,

擅长以通俗易懂、诙谐幽默的语言讲解枯燥深奥的数据库理论,并凭

借丰富的实践经验,教导学员学以致用、融会贯通,使学员受教于课

堂之上,受益于工作之中。作为 OCM 认证金牌讲师,目前培养 OCM 大

42

师百余人,培训 DBA 千余人。个人博客 http://www.secooler.me

内容简介:

随着互联网技术的深入发展,我们已经从小数据时代迈入了无处

不在的大数据时代,每个从业人员的职业生涯也面临着新的挑战,恩

墨学院院长就经历了整个时代的演进过程,从一个数据维护人员成长

为一位资深的 Oracle DBA,再到 Oracle ACE总监的最高荣誉,进而

到今天,又成为首席大数据讲师,MySQL领域的奋斗者,且看侯圣文

的 DBA之路,与大家分享借鉴。

演讲课题:

从 Oracle DBA 到 PostgreSQL 布道者

演讲嘉宾:

周正中

阿里云高级技术专家

嘉宾简介:

网名: 德哥 ( digoal );PostgreSQL 中

国社区 发起人之一;PostgreSQL 象牙塔 发起

人之一;DBA+社群 联合发起人之一;10余项数

据库相关专利;曾就职于斯凯网络,负责数据

库部门。主导了集团数据库系统、存储、主机、

操作系统、多 IDC 的架构设计和建设;完成了对数据库 HA、容灾、

备份、恢复、分布式、数据仓库架构设计和建设;数据库管理和开发

的标准化体系建立。于纳斯达克上市前成功使用 PostgreSQL 完成去

O,并顺利通过 SOX审计。现就职于阿里云 数据库内核技术组。

内容简介:

混 Oracle 的那些美好时光 为什么选择开源数据库 企业如何选

择开源数据库 为什么选择 PostgreSQL 从法律问题,性能,稳定性,

43

可靠性,功能,代码成熟度,社区活跃度,社会资源,未来发展潜力,

案例 等方面聊一聊那些支撑我们选择 PostgreSQL 的数字。 为什么

要做布道者 DBA及企业如何利用好全球云化的浪潮。

演讲课题:

DBA 职场进阶之路

演讲嘉宾:

徐戟

子衿技术团队 首席架构师

嘉宾简介:

网名白鳝(老网虫白鳝),子衿技术团队首

席架构师,国内著名的系统优化专家,著有《DBA

优化日记》、《DBA RAC 日记》、《DBA 的思想

天空》等 Oracle 数据库方面的技术专著。从事

IT 行业 20 余年,曾供职于美国 DEC 公司、赛格

集团、长天集团、联想金融事业部等,在大型信

息系统建设方面具有十分丰富的经验。从事过电信、政府、金融、能

源行业的应用软件开发与信息系统建设工作。曾主持开发了全国第一

套电信级联机实时计费系统、全国第一套三检合一的检验检疫综合管

理系统和 EDP电子申报系统。主持开发的银行大前臵平台 IPP目前被

国内十余家商业银行使用。2002年起专业从事 IT咨询服务工作,为

金融、运营商、国家电网等行业客户提供高级技术咨询服务。目前正

在从事信息系统国产化、开源产品导入大型国有企业以及国有企业信

息系统架构演进等相关关键技术研究工作。

内容简介:

1、什么是 ORACLE DBA;

2、不同阶段的 DBA的知识结构;

44

3、DBA与群体学习;

4、DBA的发展与归宿;

5、云时代,DBA路在何方;

演讲课题:

从一个程序员到 MySQL DBA 转型的历程和心得

演讲嘉宾:

周彦伟

去哪儿网数据库总监

嘉宾简介:

在去哪儿网负责数据库平台的管理和维护

工作。工作范围包括 MySQL,Redis,HBase 平

台的架构设计,性能调优,日常运维以及自动

化运维平台设计。曾经担任人人网(校内网)

MySQL技术主管,负责数千规模的 MySQL数据库

实例的运维管理。目前还担任中国 MySQL 用户

组(ACMUG)主席,领导和组织中国 MySQL社区活动。2016年初,被

Oracle官方授予 Oracle ACE Director。

内容简介:

正式结缘 DBA是毕业之后 5年的事情了,在此之前,一直从事程

序员工作,虽然也偶尔涉及数据库,但那时候坚定地认为自己是地地

45

道道的码农。一个偶然的机会在校内网被启荣大师带入了 MySQL的殿

堂,从此一发而不可收,并登堂入室,乐在其中。在过去的这些年里

面,经历了很多人,经历了很多事,同时也学到了很多东西,收获了

很多的开心。期望自己的一点经历和心得能在 MySQL学习和提升方面

帮助到更多的新手。

演讲课题:

选择的悖论--十年成长路反思

演讲嘉宾:

肖鹏

新浪微博平台研发部技术经理

嘉宾简介:

主 要 负 责 微 博 数 据 库

(MySQL/Reids/HBase/Memcached)相关的业

务保障,性能优化,架构设计以及周边的自

动化系统建设。经历了微博数据库各个阶段

的架构改造,包括服务保障及 SLA体系建设,

微博多机房部署,微博平台化改造等项目,

10年互联网数据库架构和管理经验,专注于

数据库的高性能和高可用技术保障方向。

内容简介:

选择有时候会造成我们或犹豫,或烦躁,或迷茫,但是在工作中

我们又会面临很多的选择,比如跳槽,比如如何选择方向,比如技术

还是管理,工作还是生活,讲师结合本人 10 年的技术工作经验,将

自己在自身几次重大选择中的思考过程和心路历程分享出来,并介绍

几种可以做出明智选择的方法和原则,希望可以帮助大家在做选择的

时候更加“机智”。

46

数据库性能优化

演讲课题:

阿里海量数据迁移同步核心架构及最佳实践

演讲嘉宾:

付大超

阿里巴巴数据库团队技术专家

嘉宾简介:

2012年加入阿里巴巴,目前负责 DTS团队研

发工作,曾负责阿里 HBase的开发及维护工作,

开发了阿里 HBase集群高用性系统,曾先后实习

及工作于 IBM、Cisco、淘宝。

内容简介:

阿里巴巴拥有全球最为庞大的数据库集群,为了让数据在各种类

别的数据库之间流动起来,解决阿里双十一单元化架构中海量数据的

快速异地建站(一键建站)和交易级别的异地多活问题,解决阿里业

务迁移到公有云数据库问题,迫切需要一种高性能、高可用、数据一

47

致性、还要支持各种异构数据库的迁移同步服务,由此诞生双十一新

闻稿中“黑科技” , 我有幸全程经历了这一过程,我将分享其中遇

到的关键问题,如怎样确保海量数据迁移同步数据不丢?无主键表迁

移同步怎么不丢数据也没有重复数据?如何实现多种异构的数据库

之间的迁移?如何实现异地多活及中美秒级同步?

演讲课题:

基于云的系统性能诊断与优化

演讲嘉宾:

鲍倚天

Maxgauge资深优化工程师

嘉宾简介:

Maxgauge产品咨询顾问,高级优化工程师,

Oracle OCM,长期致力于 Maxgauge产品咨询和

实施,系统性能优化方法论的研究和实践工作,

拥有在 电信,金融,物流,制造,政府等多个

行业的系统性能优化项目经验。

内容简介:

如何通过云的方式,对数据库进行远程诊断优化,如何对数据库

进行实时监控、实时收集运行信息、精密诊断及分析、实施 SQL优化,

有效管理数据库系统的性能等。 通过主动监控快速发现问题,有效

分析应用程序的瓶颈现象,保存多样的性能数据。通过这种方式,开

发工程师、DBA可以有效地对数据库应用系统进行实时诊断,排除存

在的问题,快速的定位和解决问题,从而降低优化成本和投入时间,

为客户带来最大收益。

48

演讲课题:

软件性能工程在数据库优化中的应用

演讲嘉宾:

冷建全

人大金仓数据库业务部总监

嘉宾简介:

毕业于中国人民大学信息学院,获工学硕士

学位。毕业后加人大金仓,现为人大金仓公司数

据库业务部总监,主要负责金仓数据库的架构设

计和研发。对数据实现技术有深入研究,拥有多

年的研究和开发经验。

内容简介:

主要描述在数据库优化中使用软件性能工程的几个性能模式:

Fast Path(快速通道)、Batching(批量)、Flex Time(弹性时间)、

Fist Things First(要事优先)、Coupling(耦合)、Alternate Routes

(替代路径)来解决性能问题的经验。

演讲课题:

分分合合--Oracle数据库性能优化之道

49

演讲嘉宾:

周亮

技术服务部经理

嘉宾简介:

老 A,杭州美创科技首席 DBA,10 年以上

Oracle 运维经验。Oracle ACE,OCM。中国南

方 Oracle 用户组发起人。《Oracle DBA 实战

攻略》作者,《Oracle运维之道》作者,《Oracle

数据库性能优化方法论和最佳实践》审校。擅

长高容量、高并发的数据库架构设计、运维、

故障诊断、性能优化及数据灾难挽救工作。

内容简介:

Oracle数据库的资源(latch、mutex、lock等)使用率及冲突管

理一直数据库性能优化工作的难点和重点。本次演讲将结合实际运维

工作中碰到的多个案例,分享我在性能优化方面的一点经验和心得。

演讲课题:

美丽说数据库架构变迁及自主研发中间件应用

演讲嘉宾:

冯超

50

前美丽说数据库及中间件负责人

嘉宾简介:

前美丽说数据库及中间件负责人,技术经理,

6 年数据库架构经验,1 年创业经验,30 年瞎掰经

验。

内容简介:

美丽说从导购网站转型电商过程中数据库面临前所未有的挑战,

主要有两方面:

1.应用场景不同,导购网站的数据库量级轻,无账户,支付等系

统等,流量稳定,无大促秒杀等;

2.流量增加迅速,交易额 million /day增长至接近 billion/day

过程中犯下了一些错误,积累了一点经验,开发了一个插件,调整了

一点架构;

本次分享主要有两方面:

1.人文,转型之路,思维意识转变,计划的制定及实施;

2.技术

a.架构调整与优化,包括数据库拆分,架构调整;

b.中间件开发与应用,连接池,读写分离,流量控制,功能实现

等;

c.电商特殊场景主要是大促等容量评估以及应对方案;

51

大数据应用及实践

演讲课题:

使用 Kudu搭建 OLAP 云服务

演讲嘉宾:

常冰琳

小米云平台工程师

嘉宾简介:

长期专注于 Hadoop 生态的分布式计算框架,

Kudu的 PPMC和 Committer,Hadoop,Hive等多个

开源项目的贡献着。华中科技大学硕士毕业后在百

度商务搜索和基础架构部门,从事数据分析平台搭

建以及 Hadoop 开发工作;之后在 VMware 从事

Hadoop 开发,目前在小米负责 SQL 类数据分析平台,最早在国内引

入 Kudu,一个新的分析型存储引擎,目前在利用 Impala 和 Kudu 搭

建实时数据分析服务。

内容简介:

Kudu 是 2015 年 Cloudera 最新公布的开源项目,弥补了在线事

务处理(OLTP)和在线分析(OLAP)之前的空白,本演讲将简单介绍 Kudu

项目的最新进展,然后详细介绍小米如何利用 Kudu和 Impala构建数

据分析云服务,简化数据分析流程,包括如何充分利用 Kudu的特性,

利用简单的 SQL界面完成数据实时导入,数据和查询管理,进行实时

分析和复杂查询,存储并服务分析结果,以及权限,资源隔离和调度

方面的设计,最后对未来的工作进行展望。

演讲课题:

大数据时代的数据仓储

52

演讲嘉宾:

张琪

百度高级产品经理

嘉宾简介:

百 度 高 级 产 品 经 理 , 百 度 开 放 云

(bce.baidu.com)大数据平台的产品负责人,

热爱数据热衷布道,希望打造良心产品以及交流

核心技术,帮助中国企业充分发挥其数据的商业

价值。

内容简介:

了监视进度、成本、质量以及指导业务流程改进,企业往往需要

建设数据仓库以便产生报表和支持决策,一向是企业应用中的明珠。

进入大数据时代以后,人们往往把大数据与 Hadoop/Spark等同起来,

数据仓库也非要 SQL on Hadoop/Spark不可。其实,这个观点有些教

条。大数据并不只是 MapReduce,Massively Parallel Processing

(MPP)也是一种为数据仓库设计的计算模型。MPP 与 MapReduce 有

许多类似的地方,比如都是在集群上分布式处理数据然后汇总数据,

只是术业有专攻,它们有各自擅长的场景,是个互补的关系。在这个

专场中,我们将介绍数据仓储的两种实现技术、各自适合的场景以及

优缺点,借助 demo,帮助观众灵活运用两种技术在大数据时代获取

新的洞察力。

演讲课题:

搭建运营和分析二合一的大数据平台

演讲嘉宾:

刘鹏翔

易鲸捷技术总监

53

嘉宾简介:

百 度 高 级 产 品 经 理 , 百 度 开 放 云

(bce.baidu.com)大数据平台的产品负责人,热

爱数据热衷布道,希望打造良心产品以及交流核

心技术,帮助中国企业充分发挥其数据的商业价

值。

内容简介:

IT 产业越来越多地采用 Hadoop和 NoSQL来解决大数据问题。以

更低的成本,获得更大的规模和更高的性能,意味着选用不同的工具。

这对开发者的要求更高--使用多种语言、并自行解决各开源工具的缺

陷。 随着大数据应用的逐渐深入,从单纯的分析,演化为运营和分

析相结合。要求用同一个数据库,支持运营和新兴的社交网络、移动

互联、物联网等数据,用同一个查询引擎和数据模型支持运营事务、

实时报表和 BI任务流,为半结构型和非结构型数据提供丰富的手段,

适应多种存储模型, 并确保线性拓展、高可用、安全和其他企业级

服务水准。2014年 Gartner也提出“混合事务和分析处理技术(HTAP)”

这一概念。 Apache Trafodion 和其商用版本 EsgynDB 作为 HTAP 的

典型实施,致力于将 SQL/RDBMS和 NoSQL的能力完美结合,用同一个

数据库处理 PB级的 BI、实时报表、和运营事务等任务流和数据类型。

演讲课题:

百度时空大数据上的研究与应用

演讲嘉宾:

周景博

百度数据科学家

嘉宾简介:

于 2014 年从新加坡国立大学博士毕业,主要研究方向为时空数

54

据挖掘,包括轨迹预测,交通流量预测等。周景

博于 2015 年底加入百度研究院大数据实验室任

数据科学家,从事百度时空数据和用户行为预测

相关的研究工作。

内容简介:

以手机百度和手机百度地图为代表的百度移动应用每天会收到

数十亿次的搜索和定位请求。本次讲座将介绍如何利用数据挖掘技术

来探究百度时空大数据里所隐藏的信息,来帮助我们洞察变化中的真

实世界。在此基础上,我们会进一步介绍若干基于百度时空大数据的

具有商业和社会价值的应用,包括商业智能选址,群体行为研究和城

市空间量化分析等。

演讲课题:

Google BigData solution using Dataflow, BigQuery and Pub/Sub

around the world

演讲嘉宾:

胡際善

Staff Engineer LinkerNetworks

嘉宾简介:

Staff Engineer of LinkerNetworks at

Taipei. Also a core member of GCPUG.TW

(Google Cloud Platform User Group Taiwan).

Familiar with Googles cloud services, and

also a google certificated cloud engineer.

I want to show how googles solution in big data process below

googles cloud infrastructure.

55

内容简介:

Google provide a wonderful cloud framework that developer

can enter big data domain very quickly. I will show the google

way from collect data, compute data and store data... finally,

you can easily analysis the data quickly to feedback your system.

Another important issue is the cost of using cloud for big data

processing. In the totally cost dimension, I will also show

you the way to minimum the cost of your big data processing in

my experience.

演讲课题:

基于图数据库的大数据应用

演讲嘉宾:

李文哲

普惠金融首席数据科学家

嘉宾简介:

普惠金融(puhuifinance.com)的首席数据

科学家,负责公司的人工智能、大数据技术以及

创新产品的研发。在大数据、机器学习、深度学

习、自然语言处理,图数据库等领域有丰富的研

究和实践经验。在美期间,先后就职过亚马逊、

高盛、Fiserv等多家公司。南开大学本科,美

国 Texas AM 大学人工智能硕士,美国南加州大学机器学习博士,荷

兰阿姆斯特丹大学访问学者,主要的研究方向为图模型、贝叶斯优化、

深度学习、知识表示,先后发表数篇论文在 AAAI、KDD、AISTATS、

CHI 等国际顶级会议和期刊上。

内容简介:

56

作为国内最早使用图数据库的公司之一,我们的图数据库

(Neo4j)已经在公司的各个业务线上发挥着强大的作用。 本次演讲

主要讲解图数据库技术以及其在互联网金融风控中的应用。

(1)图数据库 Neo4j的介绍;

(2)基于 Neo4j的数据流处理架构;

(3) Neo4j 在风控中的应用 - 反欺诈,关联搜索,失联客户

管理等;

数据架构&治理

演讲课题:

世界级平台的 IT4IT 设计

演讲嘉宾:

王翔

软件工程师

嘉宾简介:

软件工程师;国际贸易学和产业经济学在站

博士后。关注于外贸信息化、企业架构、信息安

全、国际 IT合作。

内容简介:

主要结合近两年的项目经验,运用企业架构的全面视角,从“世

界级体验、世界级推广、世界级运营、世界级挑战”四个方面介绍如

何利用主流的新技术,设计、实施、运营类似的大型平台,不断围绕

商业发展扩充“以我为中心”的 IT 生态系统,并用 IT4IT 的方式服

务内控和风险管理。

57

演讲课题:

中国移动某分公司:标准数据模型构建及管控实践

演讲嘉宾:

郑保卫

恩核(北京)创始人兼技术总监

嘉宾简介:

于 2013年 12月被北京市朝阳区认定为“凤

凰计划”海外高层次人才,参与过大量关于数

据架构、数据建模、数据治理、系统性能优化

等方面项目,长期致力于数据架构及数据治理

技术方面的研究和实践。荣获 2015年中国大数

据领域领军人物奖,由国家信息公共服务平台及国家软件公共公共服

务平台颁发。

内容简介:

通过在企业成立数据架构管理委员会,制定数据治理策略以及数

据标准、数据模型、数据库管理和数据库管理流程,更重要的是,通

过构建企业级的数据治理平台,将数据标准、数据模型设计规范等有

效落地,应用到系统开发中。 在开发过程中的数据建模阶段,就通

过工具进行数据的标准化自动引用,自动进行模型字段的标准化,从

而解决了数据标准的落地问题。并且,通过数据模型的协同设计和版

本管理等功能,实现了外包开发的数据模型管控,进而从某种程度上

实现对系统的管理与掌控。

演讲课题:

由数据同步到双业务中心架构的最佳实践

演讲嘉宾:

58

张粤磊

飞谷云创始人

嘉宾简介:

飞谷云(www.feiguyun.com)创始人,平安付

大数据平台架构师。历经了 DBA,到开发工程师,

再到大数据平台架构师的经历转变,有着 10余年

各行业(制造,咨询服务,互联网金融)一线数据

处理及技术实践经验。

内容简介:

1.传统数据仓库的数据处理技术及思考;

2.大数据环境下对于公共数据及行为数据的数据处理处理技术;

3.由传统数据仓库到大数据数据仓库的数据处理实践思考及建

议。

演讲课题:

农银人寿新核心数据架构规划与当前进展

演讲嘉宾:

赵华,种磊

农银人寿信息技术部副总经理,农银人寿新核心数据架构组组长

嘉宾简介:

59

赵华,农银人寿 IT 部副总经理、新核

心项目经理,先后在平安保险信息中心、合

众人寿工作,06 年加入国民人寿(农银人

寿前身),有近 16 年寿险信息化经验,曾

负责技术架构并领导过多个重大项目实施,

在核心系统建设领域有突出贡献。 种磊,

经济师,农银人寿 IT 部资深专员、新核心

数据组组长。04 年进入农总行软件开发中心,有 8 年银行信息化经

验,09 年参与核心银行应用设计。14 年进入农银人寿,主持数据治

理与标准化及新核心模型设计工作。

内容简介:

根据农银人寿保险股份有限公司的业务特点,结合当前主流技术

和最佳行业实践,从数据的分布与存储、加工与流转、管控与应用等

方面对新核心业务系统进行数据架构规划,对架构的定位与目标、原

则与思路、整体规划过程进行详细阐述,其中还涉及 OLTP系统、ODS、

数据仓库与集市、数据交换平台的设计思路。此外,以新核心项目为

背景,对现有系统实施数据治理与标准化,并在新核心建设过程中应

用治理成果,从数据治理的策略原则、流程体系、方法论、组织结构、

管理工具、数据现状、分阶段实施与当前进展、元数据管理、主数据

管理、业务建模和数据建模过程等方面进行开创性实践和经验分享。

演讲课题:

大数据治理:数据处理的那些事

演讲嘉宾:

林景旭,崔旭

海量数据学院院长,海量数据技术总监

嘉宾简介:

60

林景旭:资深 oracle 工程师, 拥有 14 年

的 oracle数据库相关实施经验,精通性能调优、

故障诊断、迁移升级、技术交流、Exadata等;

曾屡次负责多个银行和保险公司的应用系统割

接,数据库升级,机房 迁移等重大项目; 崔旭:

Oracle 慕课联盟(OMOOCU)发起人,首创互联

网+的形式推广线上免费课程。从业 10年以上,资深 Oracle数据库

专家,51CTO认证讲师,在数据库领域有丰富的经验。为多家大中型

企业和多所国家 211 工程高等学校,提供过 Oracle 相关课程培训以

及技术分享活动。

内容简介:

数据同步、双活架构或者双业务中心有非常多的解决方案,如:

EMC VPLEX等,我们本次采用 OGG来实现。首先 OGG可以在极短的时

间内,可以完成数据的单向复制,我们通过 OGG轻松实现了全国 7,

8个城市,近 40多个节点的数据同步案例,平台包括 Linux,Unix,

Windows。更重要的是,在另一个案例中通过 OGG 我们搭建了双业务

中心,真正实现了业务在两端的同时进行,满足了企业的需求。

数据挖掘&BI

演讲课题:

城市移动数据知微探秘

演讲嘉宾:

陆旻

北京大学博士研究生

嘉宾简介:

61

现就读于信息科学技术学院,师从可视化与

可视分析实验室袁晓如研究员。研究方向为时空

数据的可视化与可视分析、人机交互,有多篇关

于城市轨迹数据可视分析工作发表于可视化领

域顶级期刊与重要会议。

内容简介:

基于大规模城市车辆轨迹数据,分析城市道路,及区域间的交通

流时空交通行为模式;并分析不同的因素如出行时间等,对多条道路

选择行为的影响。

演讲课题:

金融行业数据挖掘新挑战

演讲嘉宾:

虞力

新致云金融行业技术总监

嘉宾简介:

从 2004年开始从事金融行业 IT的架构、研

发工作,主要服务太平洋保险、太平保险等大型

金融客户。目前在新致软件从事新致云及数据平

台的研发、技术管理工作,专注于金融 IT 架构

领域。

内容简介:

大数据时代,金融行业传统数据挖掘面临何种挑战?金融行业如

何运用新型工具在数据时代挖掘自身的业务价值。

演讲课题:

62

有“屏”有据--阿里云数据可视化展示平台搭建分享

演讲嘉宾:

染熙

阿里云前端可视化工程师

嘉宾简介:

阿里云前端可视化工程师,负责 DataV组件

的架构、DataV可视化工具产品,以及数据产品

的研发和 2015年双十一的前端开发。专注于 pc

端 web数据可视化的架构,探索数据可视化自动

测试、新型的数据可视化等领域。

内容简介:

DataV数据可视化服务目前已经在阿里云大数据平台上正式发

布。在发布之前,该服务已经完成了对 2015年天猫双十一媒体大屏

项目的支持,并取得了相当可观的数据传播分享效果。数据可视化大

屏能最大程度的满足目前人们低成本理解数据、高效率挖掘数据的需

求,为多维海量数据协作分析挖掘的前期准备搭建了良好的平台,也

为更多行业在数据上云后能更快挖掘展现自身数据价值提供了机会。

本次的分享将以 2015双十一大屏幕为切入口,向大家介绍该平台搭

建的过程和最终的效果,并展望在此基础上向可视化分析场景进一步

深入的前景。

演讲课题:

深度学习在新闻推荐中的应用

演讲嘉宾:

鞠奇

前网易技术总监

嘉宾简介:

63

海归博士,前当当算法负责人,前网易数据

技术中心负责人,技术总监。主要从事大数据在

推荐,搜索和广告等应用领域的“精准”落地与

变现,对于业务数据和机器智能算法的融合有较

深经验。

内容简介:

随着深度学习(DL)的落地,文本语义(特别是长尾语义)挖掘

在自然语言处理(NLP)领域变得可行。本次分享正是应用深度学习

来挖掘新闻资讯的语义,更好刻画用户兴趣。分享的主要技术点涉及

文本语义空间生成及表示,语义增量聚类等,对关注深度学习落地

NLP领域感兴趣的同学会是一次很好的交流。

演讲课题:

OneData-数据模型设计与管理

演讲嘉宾:

王赛

阿里巴巴高级技术专家

嘉宾简介:

阿里巴巴-平台技术事业群-数据技术与产

品部,高级技术专家,近 10年数据研发经验,

专注于数据模型设计与管理领域。

内容简介:

OneData是一套大数据领域数据建模体系,它包括数据标准化定

义方法、数据开发流程、数据模型设计方法以及配套保障工具。阿里

巴巴数据技术与产品部基于此构建了阿里巴巴数据公共层,在技术上

64

有效地控制数据规模的无序增长,消除大量重复的数据和计算;另一

方面高效支撑基于数据的业务快速创新和发展。

演讲课题:

美团点评数据仓库开发模式演进

演讲嘉宾:

宋洪鑫

美团美团点评高级工程师

嘉宾简介:

2014年加入美团数据平台,专注数据仓库

开发解决方案领域。2011毕业于北京邮电大学

计算机系,曾加入阿里巴巴北京商家数据部,从

事数据实时计算工作。

内容简介:

美团过去几年,随着团购业务量的飞速发展,以及在多个业务方

向的横向扩展,之前由公司的数据组统一构建数据仓库开发数据的模

式,已经不能及时满足业务的需要。 使得数据仓库开发模式由单一

数据组到多业务组开发模式的转变, 在这个过程中我们遇到很多方

面的问题,包括资源隔离,权限控制,数据治理,以及开发平台等。

我们所经历了这个转变过程,相信很多公司也同样走过。 这里分享

下我们是如何探索解决诸多问题,完成这一演进的,希望可以给后续

需要做这个转变的公司一些参考经验。

65

大数据安全

演讲课题:

实时保护 Hadoop数据安全

演讲嘉宾:

苏良飞

eBay资深工程师

嘉宾简介:

曾工作于 sybase数据工具平台部,ebay云计

算平台,携程机票部门,目前在 ebay 大数据基础

设施部门,专注于大数据平台监控。Apache eagle

项目 committer。

内容简介:

Hadoop的数据安全成为了越来越热门的话题,apache eagle

(eagle.incubator.apache.org)项目是由 eBay发起并贡献给

apache社区的大数据安全方案。它提供了一个分布式的流式日志处

理引擎,可以通过分析 Hadoop/hbase的日志来找出敏感数据的非正

常访问,并集成了机器学习技术通过用户画像来自动分辨用户的异常

行为。本次主题着重介绍 apache eagle项目和 eagle在 ebay大数据

平台中的实际应用。

演讲课题:

大数据时代的敏感数据保护

演讲嘉宾:

闻建霞

杭州美创科技有限公司副总经理

嘉宾简介:

66

负责美创核心产品线技术研究与市场推广。

曾历任杭州美创科技有限公司项目部负责人、技

术总监等职务,拥有丰富的技术管理经验和市场

推广经验。毕业于浙江大学,电子与通信工程硕

士,从事数据安全产品研究和数据库运维管理十

余年,早期曾在电信运营商工作多年。通过多年的运营商、金融、医

疗、社保等行业应用经验积累,参与、开发了数据安全、数据容灾、

数据备份、大数据智能分析等多项数据产品,其参与研发的业务系统

在线割接已获得国家发明专利。

内容简介:

传统安全防御策略以保障业务安全为主体,关注业务的安全性与

连续性。由于业务的多变性和复杂性,信息安全防御只能基于广谱防

御和漏洞修复为主,由外而内的多层被动式防御体系,强调边界防御

和控制。现今,数据安全不同于业务安全,数据安全具有明确的防御

主体和访问特征,基于数据泄露的高风险性,数据安全防御以保护数

据不被泄露为主,由内而外的多层主动式防御体系,强调核心数据保

护和防御。美创科技通过多年的安全实践和数据认知,构建了以敏感

数据访问控制和核心机密保护为基础的安全防御体系。围绕核心数据

保护,通过建立两个基础、管好两类资产、区分两类应用、管好三类

人员,构建了由内而外的层层防御体系,全方位构建敏感数据保护解

决方案。

演讲课题:

大数据时代的网站安全

演讲嘉宾:

钱志强

世纪互联牛盾云安全技术总监

67

嘉宾简介:

在出任世纪互联牛盾云安全技术总监之前,

曾先后担任昆仑万维有限责任公司游戏主程、软

通科技技术总监等职务。在互联网安全、软件、

游戏、大数据等行业及领域积累了丰富的实战经

验和全面的服务能力。

内容简介:

如何利用大数据进行网站安全的检测以及预警? 如何保护网站

的信息安全以及网站攻击防护?

演讲课题:

大数据安全之系统最佳实践--法网恢恢,疏而不漏

演讲嘉宾:

王军旺

苏宁云商 IT总部技术总监

嘉宾简介:

负责苏宁易购系统安全相关工作。曾任中

兴通讯高级工程师、规划工程师,负责安全事

件的应急响应及安全产品规划设计工作。现于

苏宁云商主导从安全检测,安全监控,安全防

御全流程的安全产品规划工作及安全事件的

应急响应工作,尤其在大数据安全分析方面具

有深入研究和丰富实际经验。

内容简介:

各大电商平台的安全防御体系一直处在不断建设和完善的路止,

安全工作也从事后的安全事件应急响应到"大海捞针"式的入侵发现,

走到了如今的准实时入侵拦截,为此提供基础支撑及决策的大数据安

68

全平台也从幕后走到了台前,甚至成为了互联网公司安全防御最基础

最坚固的一座城堡。 通过对平台拦截的多起安全事件进行分析,很

容易的分析出黑帽子的攻击行为,攻击性质,以及攻击目的;最重要

的是把各种攻击包括 0DAY攻击拦截于无形。

演讲大纲:

(1) 电商平台安全防御体系建设;

(2) 黑帽如何绕过各种防御体系;

(3) 大数据安全分析平台;

(4) 安全分析平台主动保障系统安全;

(5) 大数据平台的未来趋势;

演讲课题:

大数据下的攻防

演讲嘉宾:

邓焕

北京白帽汇联合创始人&安全负责人

嘉宾简介:

前 360 安全研究员,现白帽汇联合创始人&

安全负责人 目前主要负责安全研究,威胁分析

等。

内容简介:

主要分享介绍新型数据库的一些攻击防范手法,当下各大企业开

始部署运用大数据技术,然而一些新的攻击技术也被暴露了出来,在

我们之前的一些捕获样本中,甚至还有攻击者针对性的在进行全网扫

描利用攻击。

69

大数据行业应用及探索

演讲课题:

经管之家用户日志分析

演讲嘉宾:

曹正凤

北京大数据协会理事

嘉宾简介:

统计学博士,北京大数据协会理事,首发

集团智慧交通大数据中心技术总监。致力于大

数据分析前沿领域研究,主持人大经济论坛基

于 Hadoop架构的论坛主题推荐系统项目,参与

国家社科基金项目《基于大数据整合的空气质

量测度方法研究》,发表多篇论文,且发表的

EI核心收录论文受到多次检索。

内容简介:

介绍日志分析的相关知识,以及经管之家现在的日志管理现状,

设计并实现适合经管之家的基于 Hadoop 架构的大数据日志分析系

统,手动编写日志分析 MapReduce 程序,实现从零起步到 Hadoop 架

构,直到实际的大数据分析真实案例的飞跃。

演讲课题:

新一代数据分析利器助力业务创新

演讲嘉宾:

陈赟

IBM 资深大数据架构师

嘉宾简介:

70

曾任 IBM 大中华区政府行业首席架构师,

在电信、金融、零售等领域对大数据、数据库、

数据仓库和 BI 有深刻的理解和丰富的实战经

验,精通大数据分析涉及的主要技术,包括

Hadoop、Spark、流数据、数据挖掘、BI分析、

数据仓库、数据建模和主数据管理等,擅长业

务分析,能够把复杂的业务需求转化为 IT 实现的技术要求,丰富的

IT 架构经验,擅长通过 IT 架构方法论(TOGAF 和 IBM 方法论),对项

目进行全方位的设计,包括需求分析、用例分析、组件模型、方案纵

览、非功能性需求分析、架构决策等。

内容简介:

从大数据的角度出发,介绍如何针对行业(金融、电信等行业)

日益发展的数据分析需求,采用先进的 IBM数据分析平台和工具,提

升业务的创新能力,实现业务价值的持续增长。通过案例分享和产品

介绍,从实际应用的角度,解密大数据分析的实施方法论和步骤。演

讲内容包括客户 360度视图的建设、实时数据的分析、自助式分析趋

势以及数据挖掘应用场景等。

演讲课题:

人才大数据驱动的人力资源革新

演讲嘉宾:

单艺

猎聘网首席数据官

嘉宾简介:

71

负责机器学习技术和产品研发、商业数

据分析以及大数据基础设施建设。他的主要

兴趣在于数据挖掘和分析。他具有 15年的

数据挖掘和系统研发经验。之前,他担任

Omni-Dimension Inc(毕肯互动)和 WPP

Group/奥美 ITOP 24/7 Networks 的 CTO职

务,负责数据驱动的互联网广告优化技术和

精准广告网络的研发;还曾经担任空中网悟空搜索副总裁和美国

Yahoo!网页搜索资深工程师,从事大规模搜索技术和文本挖掘技术

的研发。单艺毕业于清华大学和美国 University of Arizona,获得

了管理信息系统专业的学士和硕士学位。

内容简介:

“21世纪什么最贵?人才!”这句经典的电影台词道出了人才

的重要性。随着互联网和移动 APP的兴起,大部分企业和求职者的招

聘求职过程都已经从线下转为线上。线上化的招聘活动不断产生海量

的人才数据,例如简历、职位描述和求职招聘行为记录。以猎聘为例,

每天我们可以收集到上亿条各种各样的数据。这构成了我们人才大数

据的基础。有了这些数据之后,我们能够做哪些有价值的事情?我们

将从大数据应用的角度出发,介绍猎聘如何运用机器学习和数据分析

的方法进行职位推荐、人才推荐、职场社交推荐和行业人才趋势分析。

同时,也将讨论人才大数据应用和研究的广阔未来发展空间和面临的

种种挑战。

演讲课题:

数字化驱动业务革命

演讲嘉宾:

戎鹏

72

甲骨文大学技术培训部北方区经理

嘉宾简介:

在甲骨文长期从事 IT产业发展研究,甲骨

文技术推广和企业人才资源顾问等工作技术和

文本挖掘技术的研发。单艺毕业于清华大学和

美国 University of Arizona,获得了管理信

息系统专业的学士和硕士学位。

内容简介:

行业正在面临变革,数字化正在构建新的秩序。Oracle如何利

用大数据引领行业变革

演讲课题:

大数据挖掘私有云解决方案

演讲嘉宾:

曾令英

思迈特数据工程师

嘉宾简介:

曾就职于腾讯,期间参与基础大数据平台、

高性能存储系统等多项研发和管理工作。目前主

要负责大数据产品的研发, 负责 Hadoop、Spark

平台的优化和数据挖掘算法的分布式研究。期间

负责电信、电网、银行、证券等多个行业数据挖

掘项目,具有丰富的数据挖掘经验.

内容简介:

73

经过多年的发展,企业积累了大量的运营数据,如何从海量数据

快速挖掘有益的数据价值成为企业较为关心的问题。本演讲探讨大数

据挖掘私有云解决方案。演讲覆盖大数据挖掘模式、指标库、标签库

等内容,用以帮助企业快速从数据中获取商业信息。

推荐系统架构及算法

演讲课题:

基于 Zookeeper+MHA 的 MySQL高可用架构设计

演讲嘉宾:

刘世勇

链家网 DBA

嘉宾简介:

2011年毕业于四川大学,先后混迹于华为、

网易,2015年 1月加入链家网,目前主要负责

链家网 oracle和 mysql数据库的运维,包括数

据库架构设计,DB性能调优和 SQL优化,DB自

动化运维平台的构建等工作。

内容简介:

对常用的 MHA+VIP mysql高可用架构进行改造和优化。利用

zookeeper提供命名服务(name service),MHA进行主从切换时发

布变更消息,应用服务器实时订阅变更消息,更新本地命名映射,实

现 mysql高可用的目的。适合专场:数据库架构设计、数据库自动运

维、我的 DBA之路。

演讲课题:

打造全方位的数据库自动化、自助化平台

74

演讲嘉宾:

李京生

京东技术总监

嘉宾简介:

从事互联网运维管理 16年,京东开源数

据库运营部总监,全面负责京东开源数据库相

关工作。2005~2011任百度首席 DBA,推动百

度数据库技术持续发展;2011年底加入京东,

积极发展京东数据库技术,进行技术创新,带

领团队平稳护航 2012~2015年 8次 6.18、11.11

大促。致力于电商数据库设计、优化、多中心多活交易、分布式数据

库开发、超大规模下数据库运维自动化、自助化工作。个人荣获京东

最佳舵手、优秀总监、优秀个人、金牌讲师等多项奖项。

内容简介:

数据库运维自动化程度一直是衡量 DBA管理水平的重要指标,由

DBA在管理平台上进行各种数据库工作。随着自动化的发展,在京东

又设臵了新的指标“研发自助化”,即有大量数据库工作可由产品线

研发工程师自助化的在数据库管理平台上一键化的操作而不是 DBA

操作,研发可实时了解到数据库性能、运行情况等。这对数据库管理

平台带来全新的要求和挑战,需要极高的安全控制、权限控制、功能

完善、严谨的回滚控制等,从研发使用、DBA管理双重角度去完善。

在京东,超大数据库集群规模,不同业务体系下的不同数据库架构,

多种数据库共存,超大规模数据库迁移改造,多中心多写交易要求数

据库管理平台具备更多的功能和更高的自动化程度。 本次会介绍京

东商城如何解决以上问题,实现自动化、自助化的数据库管理平台。

75

涉及自动化部署、自动化切换、监控智能分析、故障自愈、性能优化

处理、Docker下运维管理等。

演讲课题:

饿了么数据库发布上线操作最佳实践

演讲嘉宾:

程炎岭

饿了么技术运营 DA团队负责人

嘉宾简介:

多年金融,互联网资深 DBA背景,曾担任互

联网 o2o公司数据库架构师兼一线运维团队管理

职位。

内容简介:

饿了么 edwm(Eleme Database Wrokflow Management)是我们

自主研发的一套 DB上线流程管理工具,通过统一的设计工具将上线

SQL带入流程,经过 DA review以及 DBA 审核最终把操作变更到线上,

支持多种环境,同时使用 eless发布系统来提供调度,解决 DB发布

与应用发布的依赖问题。面向人群:本次演讲主要面向互联网服务后

端开发人员,架构师,DBA等对数据库变更操作感兴趣的同学。

演讲课题:

基于 Pacemaker+MHA 的 MySQL HA 方案实践

演讲嘉宾:

陈华军

苏宁云商 IT总部资深技术经理

76

嘉宾简介:

苏宁云商 IT总部资深技术经理,之前长期从

事数据库产品的开发和维护工作,期间向

PostgreSQL社区贡献多件 Patch,并参与和协调

PostgreSQL中文手册的翻译。现于苏宁云商 IT

总部从事 MySQL RDS项目的开发等。

内容简介:

介绍苏宁易购 MySQL RDS的 HA实现方案及使用效果,主要包括

如下内容:

(1) 苏宁易购 RDS HA方案的选型;

(2) 基于 Pacemaker+MHA 实现 MySQL HA的原理;

(3) 如何做到零数据丢失;

(4) 如何防止双写和数据不一致;

(5) 方案开发过程中所遇到过的问题;

演讲课题:

利用 docker构建自动化运维平台

演讲嘉宾:

黄智凯

Garena公司 DBA

嘉宾简介:

来自新加坡最大的互联网公司 Garena,曾就

职于新浪和奇虎 360,DBA背景成长的他同时一直

致力于运维平台自动化的建设和创新。

77

内容简介:

在 Garena,我们利用 Docker swarm + compose 作为基础搭建了

一套私有云系统。起初只是给Web项目使用,开发通过Gitlab webhook

直接部署代码,网站上线后整套代码发布不需要运维干预,实现全自

动化。独立的 Consul监控来实现容器自我恢复机制,做到 Swarm宿

主机宕机服务自愈。后期平台运行稳定我们逐步扩展到运行

Redis/Memcached等轻量级缓存服务,并编写脚本直接从 Consul中

Template配臵至硬件负载均衡 F5,实现高可用,整个部署过程不超

过一分钟,大大提高了运维的效率。重点介绍平台建设使用 Docker

swarm和 compose结合作为容器编排工具,内部搭建了自己的 Docker

registry,Jenkins作为 Web管理平台,任务会运行后端写好的

Ansible任务。NoSQL运维是后期引入的,带来的收益很明显,就是

服务部署不依赖之前的 LVS。

一是节约了机器,直接使用 F5来替代 LVS服务器,同时也不用

额外维护这些服务器。

二是 HA在 F5这一层实现,基本上也是 0运维。故障恢复的时候

只需要重新启动一个新容器,刷新 F5配臵,这些任务都已经脚本化,

所以对于运维来说也容易了很多。

人工智能

演讲课题:

Petuum:一个新型的分布式大数据机器学习平台

演讲嘉宾:

朱军

清华大学计算机系副教授

嘉宾简介:

78

智能技术与系统国家重点实验室教学副

主任、卡内基梅隆大学兼职副教授。主要从事

机器学习、贝叶斯统计等基础理论、高效算法

及相关应用研究,在国际重要期刊与会议

JMLR、PAMI、ICML、NIPS等发表学术论文 70

余篇。受邀担任人工智能与模式识别顶级杂志

IEEE TPAMI的编委,担任机器学习国际大会

ICML2014地区联合主席, 担任 ICML (2014, 2015, 2016)、NIPS

(2013, 2015)、UAI (2014, 2015)、IJCAI2015、AAAI2016等国际

会议的领域主席。获微软学者、中国计算机学会优秀博士论文奖、中

国计算机学会青年科学家奖、国家优秀青年基金、中创软件人才奖等,

入选 IEEE Intelligent Systems杂志评选的“AI’s 10 to Watch”、

国家“万人计划”青年拔尖人才、及清华大学 221基础研究人才计划。

内容简介:

在机器学习是从大数据中提取有价值信息的关键技术。和传统的

计算不同,面向机器学习的计算具有显著的特性,这些特性在已有的

分布式平台上通常没有很好地被利用。在这个报告中,我们将介绍

Petuum,一个面向大数据机器学习的新型分布式平台,Petuum基于

对机器学习算法特性的总结,在系统层面和算法层面进行了全新的设

计和实现,在性能上获得了显著提升,为大数据机器学习提供了一个

通用的引擎平台。

演讲课题:

大数据机器学习新方法

演讲嘉宾:

张文生

中国科学院自动化研究所副总工程师

79

嘉宾简介:

中国科学院大学机器学习首席教授。2001

年博士毕业于中科院自动化 所,2002年起任中

国科学院大学教授、博士生导师,目前兼任中国

自动化学会智能控制专业委员会副主任、中国电

子学会云计算专 委会委员、中国计算机学会人

工智能与模式识别专业委员会委员、国家重大科技专项专家组成员等

职。

内容简介:

从发现逻辑(传统人工智能、关注规则和知识)和统计(强调数

据特别是小样本说话)存在的不足,探索大数据的结 构和统计新学

习理论、算法与实例,主要涵盖包括气象大数据精准降雨估计(国家

气象局)、城市群环境动态监测(环保部任务)。

演讲课题:

智能驾驶对人工智能的挑战

演讲嘉宾:

周鑫

驭势科技联合创始人兼首席产品官

嘉宾简介:

驭势科技(北京)有限公司联合创始人兼首

席产品官。主要关注智能驾驶领域嵌入式高性能

计算软硬件架构、平台设计、人工智能技术应用,

负责智能驾驶软硬件产品设计、产品实施和人工

智能技术产品化。 参与创立驭势前,曾先后担任

英特尔中国研究院数据经济实验室研究总监和中国英特尔物联技术

研究院首席架构师兼项目总监。负责主持大数据方面的研究,工作重

80

点为大数据分布式平台、数据隐私安全和工业大数据分析技术,并曾

领导实时视频大数据实时处理平台和一体机相关技术方向。英特尔工

作期间,在 X86/Xscale微架构、众核架构、数据并行编程、片上系

统(SoC)软硬件综合开发、大数据平台架构等方面,他发表了多篇

学术论文,有 10多项美国专利、国际专利、中国专利。

内容简介:

当下,智能驾驶或者无人驾驶作为一个重要应用方向、方兴未艾。

驭势科技作为一个高科技初创企业,以开发智能驾驶关键技术为己

任,正在进行人工智能方面的积极探索。本次演讲主旨是分享和讨论

在感知技术、规划控制技术、高层决策技术等具体方向上、人工智能

技术应用的难点和创新点。

演讲课题:

在线学习在广告系统中的应用

演讲嘉宾:

王兴星

美团高级技术专家

嘉宾简介:

81

目前任职于美团外卖技术部数据组,高级

技术专家,负责外卖变现相关技术工作。加入

美团前,任职于搜狗广告技术部,担任资深研

究员,负责搜狗 PC、无线联盟检索、排序等算

法。所研发的特征框架、训练系统应用于搜狗

联盟广告、DSP等多个产品线。曾获商业技术部

犀牛、MVP等奖项。也是数据挖掘爱好者,曾获百度电影推荐大赛第

一名、品友互动 RTB算法竞赛 Offline/Online第一名,KDDCUP2012

全球第三名等奖项。

内容简介:

互联网广告是最常见流量变现手段,是数据量最大的应用场景之

一,本演讲将阐述在线学习在此过程中如果提高效率和效果。

演讲课题:

基于大数据的查询意图识别及应用

演讲嘉宾:

叶祺

搜狗搜索广告研发部高级研究员

嘉宾简介:

2011年博士研究生毕业于北京邮电大学计

算机系,毕业后即加盟搜狗广告研发团队。在

搜狗从事搜索广告相关策略研究多年,目前在

搜狗负责搜索广告的召回与相关性研究的工作

与主要策略技术支持。 对于搜索引擎广告中涉

及的相关核心技术有较深的理解。在自然语言处理以及大规模数据挖

掘的算法设计和实现方面,尤其是在实际系统的工程实践中算法的应

用上有较丰富的经验。

82

内容简介:

当前的搜索广告主要基于关键字匹配的搜索模式。由于用户输入

的查询往往较短,具有特征稀疏与表意不明确等特征,基于关键字匹

配的搜索模式主要关注于字面匹配的广告,而忽略了对用户真实搜索

意图的识别。在各类实际搜索应用中,查询意图识别一直是一个极为

核心的研究问题。为了解决上百万细粒度的查询意图的挖掘与识别问

题,搜狗搜索广告团队提出了一系列算法并将其实现于一个实际的线

上系统——“星辰系统”中。该系统具有非常高的意图推断准确性与

较高的覆盖率。

83

参会总结与感想

重庆双体系软件技术教师代永亮参会总结

2016中国数据库技术大会于 5月 12-14日在北京国际会议中心

隆重举行。此次大会以“数据定义未来”为主题,开设了 2个主会场

和 25个专场论坛,涵盖“数据库架构设计”、“数据加速技术”、

“实时计算与流计算”、“SAP技术交流”、“数据库性能优化”、

“大数据应用及实践”、“数据架构&治理”、“数据挖掘&BI”、“大

数据行业应用及探索”、“大数据安全”、“人工智能”等和数据密

切相关的内容。大会规格之高、技术之专业、干货之多着实让人烧脑,

下面是我参与此次大会的总结。

一、DT时代气息浓烈

马云曾经在一次演讲中说道:“人类正从 IT时代走向 DT(Data

Technology)时代”。DT以服务大众、激发生产力为主,数据才是

核心资源。以前我们所关注的更多是企业业务流程的复杂性和实现

性,所有的数据都是围绕着业务流程来跑,数据本身的价值并没有多

大的体现。让数据创造价值,通过分析数据之间关联来产生更多的潜

在的关系,让数据更好地服务于大众。DT时代下,各种数据的获取、

存储就显得非常重要,任何企业想要在后期的竞争中取得一席之地,

数据或许是关键的一环。反观高校,信息化建设首要任务就是设计一

套合理的数据架构,将数据标准落地,并严格执行下去。尽可能地将

学生、教师及其相关的各类数据最大化的保存下来,以方便后期数据

分析,更好地服务于高校的发展。

二、数据库厂商加速转型

随着大数据的推广和应用,互联网企业的快速发展,分布式开源

数据库厂商越来越多的占据了风头,特别是基于 Hadoop/Spark等推

84

出的一系列数据库架构和解决方案。传统数据库厂商如 SAP、Oracle

也在加速转型,提出了自己的一套整体解决方案,特别是 IAAS、PASS

和 SAAS全方位支持。Oracle在行列式共存解决方案,利用内存、芯

片硬件加速上的速度提升;SAP HANA混合云的处理方式,以及内存

计算加速和数据挖掘上的优势。各种技术的解决方案和具体的算法实

现已然占据了主流,而很多的算法是大学中所教授和研究的基础算法

的衍生和创新,所以很多理论的东西在企业中早已进行了诸多的实

践,如果能够将具体理论的东西和这些实践的案例结合起来,更能够

提高教师的科研水平和产出价值。

三、虚拟化+弹性云已成必然

云计算的发展趋势越来越明显,越来越多的企业将应用迁移到云

上,通过购买云计算能力、云存储能力来降低企业的总体成本。同时

为了满足企业核心数据的安全,混合云模式也越来越普遍,即核心应

用或者数据部署在企业私有云中,公共的应用和数据部署在公有云

中。互联网企业的需求往往是不确定的,有时候需要大量的计算和存

储资源,有时候只需要少量的资源,例如在线秒杀等业务场景,所以

弹性存储、自动为应用分配资源是关键,其中虚拟化技术是基础,为

资源的后期扩展提供了简易的解决方案。建立一套可扩展、易维护的

虚拟化平台是信息化发展的前提,目前市场上已经有成熟的虚拟化软

件,通过将各种硬件资源虚拟化后,可以更好地分配给各个应用使用。

四、大数据应用已在身边

此次大会中有很多专题都是针对大数据的具体应用,例如对大数

据的预测分析、基于图数据库的大数据应用、百度时空大数据上的研

究和应用等。可以说利用大数据存储、分析到应用,大数据的整条生

态链已经非常完善,利用数据说话的能力已经越来越明显和有效。前

网易总监鞠奇展示了深度学习在新闻推荐中的应用,用户对于新闻的

85

关注热点和频度,如何有效的分析新闻和进行推荐,里面涉及的数据

关联关系是非常有意思的。

五、数据安全仍是热点话题

大数据时代下,数据的安全尤为重要。数据安全的范围包括数据

本身的安全、存储平台的安全、应用系统处理的安全,任何一个环节

发生问题都有可能对数据造成破坏。所以我们看到,有专门做数据库

安全的厂商,核心聚焦在数据脱敏、数据审计和权限分离上;有专门

做应用安全的,在上层对网站应用的架构进行保护,防止各类攻击;

有专门做网络安全的,防止数据传输过程中的窃取和篡改。

六、数据价值和隐私的思考

大数据时代的来临,虽然给企业带来了更多的创新业务模式,给

个人带来了更为优惠和便利的操作,但是当每个人的日常生活的小数

据全部汇聚为大数据时,数据隐私的问题就显得很突出。例如,通过

个人消费的明细、足迹的点滴可以让用户被动浏览和接受大量广告的

轰炸,更为重要的一点是,数据厂商可以很轻松的去预测每个人每天

将要做的事情和习惯,这个带来的影响就非常巨大,同时在法律方面

也存在保护个人隐私数据的漏洞,因为单个数据是正常的,而基于大

量数据的分析和预测的结果就非常可怕了。

通过这三天的参会,我对于当前行业内数据库发展的方向有了一

个很好的认识,同时对于很多的技术也有了自己的理解。归结于学校,

我觉得可以从这次大会中借鉴到的一些经验和发展方向:

1.制定好全校的信息数据标准,并且所有部门都严格按照这个标

准来治理数据。

2.适当去发展和组建虚拟化平台,为弹性分配资源做好准备。

3.做好数据备份和容灾的各项措施,保存和恢复所有的数据。

4.研究相关开源分布式存储和计算的框架,结合科研力量,为后

期的信息化建设做好铺垫。

86

重庆双体系 代永亮

二〇一六年五月十九日

重庆双体系项目助理周婷婷参会总结

随着大数据影响力的不断扩张以及其相关技术的深入发展,大数

据从互联网领域向其他行业急速蔓延,行业、金融、政府等领域爆发

大数据风潮,大数据对传统行业的影响越来越深重。作为国内数据库

与大数据领域最大规模的技术盛宴,2016年 5月 12日-14日,第七

届中国数据库技术大会(DTCC 2016)在北京国际会议中心正式拉开帷

幕。非常荣幸能够作为双体系教师代表参加此次大会,此次大会让我

开拓了眼界,收获颇丰。

作为国内数据库与大数据领域最大规模的技术盛宴,DTCC已经

成功举办了六次了。据了解本届是大会创办以来,规模最大,参会人

次,参展合作伙伴最多的一次盛会,云集了来自五湖四海的 5000余

名 IT精英,相聚在这里,共话数据库技术发展潮流,共赴大数据浪

潮之巅。会议为期三天,共设两个主会场,25个分会场,超过 1000

平米的展区,为广大数据库技术从业者、大数据从业者、互联网人士

及行业相关人士提供最具价值的分享、交流平台。

大会首日,盛拓传媒 CEO高颖睿出席大会致开幕辞。高颖睿指出,

随着大数据影响力的不断提升以及其相关技术的深入发展,大数据从

互联网领域向其他行业急速蔓延,并终将在不久的将来以数字驱动转

型,促进产业跨界升级。而数字驱动转型离不开对大数据发展趋势的

洞察和实践,为了更广泛、深入的聚焦大数据,进而引领行业变革,

本届大会重篇幅的设定了覆盖技术趋势、行业实践、生态系统等在内

87

的多个大数据专场。

众所周知,云计算已经成为产业和行业发展的主流技术体系,云

数据库伴随着云计算技术的成熟而迅速发展,并且越来越受到产业的

关注.越来越多的云服务供应商提供了一系列服务让用户轻松完成数

据库的扩展,将用户从繁琐的数据库硬件定制中解放出来。大会开设

了云端数据库专场,与大家共话云端数据库的发展。

在 12日上午的主会场,来自甲骨文公司副总裁吴承杨首先登场,

为我们带来了《Oracle 数据库技术创新与市场领导力》的精彩演讲,

吴承杨以“我们还活着”幽默开场,同时霸气的展示 Oracle在数据

库市场的绝对领导者地位和强大竞争力。吴承杨还特意回顾了 Oracle

数据库技术在过去 30多年的发展,特别是近 15年的技术进步和产品

创新的历程,从中就能找到清晰的答案。

在 12日下午的柏睿数据库技术专场,来自柏睿数据的高级数据

工程师莫明勋、柏睿数据华东区总经理杜正浩、柏睿售前工程师牛和

明为参会者带来关于流数据库在物联网时代应用及深度学习库与大

数据统计方面的探讨。当今世界是一个信息化的世界,我们生活中无

论是生活、工作、学习都离不开信息系统的支撑,因此,数据库的重

要性毋庸臵疑。随着云计算和大数据时代的到来,传统数据库面临前

所未有的挑战,在性能和成本的双重压之下,数据库亟需寻找突破之

路。一时间,针不同应用的各种新型数据库孕育而生,而敢于吃螃蟹

的各个企业,也收获了不错的成效并积累了丰富的实战经验。

2016年 5月 13日,虽然这是大会的第二天,但可以看到参会人

员的热情依然未减。这是来北京的第二天,就已经很清晰的感受到了

北京的拥堵和快节奏生活,北京的拥挤想必让很多上班族苦不堪言,

无论是地铁、公交还是私家车、顺风车,早晚高峰都很拥挤。如果出

行前可以提前知道道路拥堵情况,进而选择合适的路线,岂不是会节

约很多时间?今天下午的数据库大会上北京大学在读博士生陆旻所

88

在实验室根据往年出租车的行驶轨迹数据运用路径抽取算法对多路

径行为分析可视化,分析不同路段不同时间点的路况。对交通拥堵传

播,道路交通时空模式,多路径选择行为知微探秘,根据各个路段的

路况简单分析人们的出行行为。日后出行便可以提前预测好各个时间

点各个路段的畅通性选择最佳出行路线。也可以察觉路段拥堵源头,

从源头治理,避免拥堵。此举无疑是给在北京工作的上班族带来了福

利,也减轻了他们的压力。

5月 14日,也是数据库大会的最后一天,北京天空乌云密布,

雷鸣细雨,可是会场的人数却未减少。为了能够学到更多的知识,所

以我们几个选择了分开听课,也是为了回去之后能够更好地把数据库

大会所学分享给双体系的学员,所以,我选择了听“我的 DBA进阶之

路“。一开场就深深的被主讲人的问题给吸引住了:“不想当哲学家

的 DBA不是好架构师”,这句话是一名从业二十余年的老 DBA的开场

独白。

为什么说不想当哲学家的 DBA不是好架构师呢?白鳝(徐戟)从

DBA的进阶之路说起。DBA成长之路,大致分为四个阶段,分别为:

入门阶段、进阶阶段、高手阶段、超越阶段;与之相对应的 DNA晋级

特征是根据现象分析问题、根据指标分析问题、根据基线分析问题、

根据容量分析问题;当然,在不同阶段的 DBA面对数据库故障,考虑

问题的核心与应对问题的解决办法也不同。DBA最终之路,会有相当

多的一部分人成为架构师。然而,一名好的架构师,最重要的就是学

会妥协、辩证问题、考虑问题全面,故而称之“哲学家”。

通过参加此次数据库大会,让我了解到 IT这个行业的前景无可

限量,双体系的学员们若想快速提升自己的能力,就需要边看书边实

践,多参与项目,敢于挑战自己能力之外的项目。另外,还需要进行

群体学习,相互监督,相互学习,提高学习效率,提升学习质量。提

升能力没有捷径,勤奋是必要条件。同时也很感谢学校以及双体系给

89

了我这次机会,让我收获良多。

重庆双体系 周婷婷

二〇一六年五月十九日

重庆双体系十期学员唐伟参会总结

很幸运的能参与此次 2016中国数据库技术大会,真的看到了很

多数据库产业的顶尖公司,看到了数据库行业的顶尖人才,看到了数

据库行业的精彩分享。我想这不仅仅是在参会的几天能刺激到自己,

还很大程度上开阔了自己数据库产业的视野以及软件行业的视野,希

望自己向更高的高度努力。

一、关于技术视野

快:以前从未考虑过会接触、见识到一秒钟扫描上亿行数据的数

据库,这不仅仅是在数据库软件技术上的革新,也是硬件上的改变,

因为行业前沿已经在 CPU的处理上做了为数据库扫描加速的硬件技

术支持。

90

广:作为一个物联网工程专业的学生来说,接触过的 RDBMS关系

型数据库管理系统也就 Mysql、Oracle、Sql Server,接触安卓后再

接触了一种叫 Sqlite3的关系型数据库管理系统,也就听说过一些像

NoSQL类似的非关系型数据库,这次大会不仅仅听到在像 Orecle

Datanase 12c在关系型数据库上的革新,还听到了前所未闻的

PostgreSQL、NewSQL。不仅仅是听说这些数据库管理系统的名词,还

有很多他们这些 DBA、架构师、CTO等大牛在处理相关问题的技术点,

如 Sharding分表技术等等。

大数据:对于这些企业,不仅仅是有先进的数据库和高效的数据

库管理技术,在当前这种高并发的时代,大数据是不得不谈的话题。

听到了很多 Hadoop,MapReduce等众多关于数据处理、编程相关的东

西。我深深的被猎聘网的 CDO首席数据官的一场“大数据”讲座吸引,

他们大数据上对应聘者分析、猎头分析、职位匹配及推荐上,和其他

会场都会提到的一点是在数学建模上的问题,如何建立合适的模型,

如何自适应问题。就像在“利用推荐引擎实现电商个性化动态创意”

会场中讲到的如何给用户既有创意又适合用户的推荐一样,这些都好

有意思。

二、关于人文视野

谦逊:从甲骨文公司副总裁吴承杨先生作为第一天主会场的第一

个主讲人开始,我就深深的感受到这些大牛们好谦逊,讲的东西不但

专业,同时还透露一种亲切感。这也是以后自己需要不断完善的地方。

专注:技术很多时候无法量化,不要去和别人做无谓的“比拼”,

坚持、专注自己的学习,就像和研究学术一样,研究技术也需要专注。

恩墨学院院长侯圣文提到子衿技术团队首席架构师的徐戟,说他有个

称号是“没有起不来的数据库”,简直好厉害,后面听到徐戟本人来

讲关于他的“DBA职场进阶之路”,居然让我意外的是技术人才讲到

了哲学问题,“不想当哲学家的 DBA不是好架构师”,我被感染到了。

91

很多演讲分享者都提到了一个点:“10000小时理论”,在一个行业

深入研究 10000小时,不是专家就是高级专家,非常赞同这个观点。

能证明这点的是很多这次数据库技术大会的主讲人在这个行业也就

研究了 4、5年,这个了我们很多学习动力,在学习的道路上也需要

更加专注。

坚持分享:侯圣文院长就提到在学习的过程中真的要多分享,这

也是自己一直在做的事情,我也觉得分享能巩固自己的知识之外还能

给自己带来快乐,还能让你结识到更多要好的朋友。

此次数据库技术大会我想很多技术知识点自己虽然不能很直接

的习得,我想这也是必然的事情。很多技术大牛不是像上课一样给你

讲具体的知识点,而是在短短的四十分钟给你分享他认为工作中或者

是人生中最宝贵的经验、技术难点等等重要信息。我想这比 40分钟

仔细给你讲一个知识点更有价值,这就和授人以渔和授人以鱼类似,

我们要的肯定是“渔”。

再次感谢那些分享给我们双体师生“渔”的前辈们,我们也尽可

能的将这些技术、人文去分享给移通人、双体人以及每一位周边的朋

友们,坚持分享。

重庆双体系 唐伟

二〇一六年五月十九日

92

山西双体系软件技术教师刘金良参会总结

“人类正从 IT 时代走向 DT 时代”2014 年三月在北京举行的一

场大数据产业推介会上,阿里巴巴集团创始人马云在主题演讲中发表

了他的这一最新观点。DT(Data technology)时代,它是以服务大众、

激发生产力为主的技术。DT是数据处理技术(Data Technology)的

英文缩写。IT是以自我控制、自我管理为主,而 DT是以服务大众、

激发生产力为主的技术。IT和 DT之间不是技术的差异,实际上是思

想观念层面的差异。

2016 年 5 月 12 日--5 月 14 日在北京国家会议中心如期举行的

第七届数据库技术大会向我们展示了众多厂商是如何面对 DT 时代的

到来的。以 oracle 为代表的众多数据库厂商展示了他们的最新的数

据库技术。现在流行的内存数据库能最大限度的提高性能,相对于磁

盘,内存的数据读写速度要高出几个数量级,将数据保存在内存中相

比从磁盘上访问能够极大地提高应用的性能。通过内存数据库,数据

的搜索数据能达到每秒以亿级别来搜索,这在磁盘数据库是不能做到

的。DT 时代就是以云计算为技术基础,通过大数据分析来给客户提

供服务的一个过程。而大数据虽然不仅仅是数据量大就可以,还包括

类型庞大的数据才能提供大数据服务。面对量庞大的数据,高性能的

数据库检索支撑必不可少。而当今兴起的内存数据库的高性能检索就

能很好的提供服务。

经过多年的发展,由国外数据库独大的情况也在慢慢改变,在 5

月 13日,由南大通用开发的新一代国产高新能数据库 GBASE发布了,

经过国内多个大型项目多年的使用,GBASE已经能很好的满足大数据、

高并发的检验。国内数据库厂商在当今数据库技术高速发展的今天能

去得这样的成就,我国的数据库研发人员当然付出了艰辛的探索。作

为内存数据库,GBASE也能满足很高的检索要求,在某些方面的性能

93

超过了 oracle 等主流数据库。客户的认可让国产数据库有了进一步

发展的信心。相信经过不懈的努力,中国自己的数据库必将有更大的

发展。

在当今云计算为基础的数据服务技术时代,各种云层出不穷。各

大数据库厂商也在将服务重点发展为云服务。甲骨文已经正式提出转

变为云公司。云计算与大数据到底是什么,它们的关系是什么?它们

其实是统一的整体,云计算是技术层面的概念,而大数据是应用层面

的概念。以云计算为基础,结合各类数据,将原来的信息孤岛变为实

实在在的服务,才是时代发展的需要。

当然,技术进步了,我们所需要的服务也在转变,当今信息化需

要的就是各种各样大量的数据融合能给我们提供的数据服务。而且好

像我们的生活中也无处不体现大数据给我们带来的好处。但是在数据

融合的过程中我们又面临着一些问题,也就是大数据的风险。首先就

是个人信息,现在各种广告满天飞,我们的个人信息在网络上肆意无

序的扩散就是数据融合后给我们带来的风险。再一个就是数据的实用

性,随着数据量的越来越庞大,我们要想从海量的数据中或得有用的

信息,就变的越来越难,当然这也是云计算要解决的问题。现在我们

有一个疑问就是,我们真的做到大数据了么?世界那么大,人类无法

统计的数据量更是庞大。我们如何去面对更加庞大的未知数据,我觉

得才是我们更需要考虑的事,毕竟我们对世界的认知我觉得菜刚刚开

始。这就是大数据的局限性。

DT 时代到来了,DT 时代的一个非常重要的特征是体验,就是感

受。我们以前一直强调的是服务,服务做到一定程度,发现了很多的

问题。而客户需要的不仅仅是服务,而是体验。其实体验就是精准服

务,精准就需要云计算与大数据的支撑。利弊之间我们要平衡,在平

衡的过程中就是新的 DT服务的发展。展望为了,我们的生活在改变,

对数据的需求也在改变,我们对数据的认识也在改变。数据改变未来,

94

数据库技术随着数据的变化也会不断的进步!

山西双体系 刘金良

二〇一六年五月十九日

山西双体系职场能力教师陈江会参会总结

为期三天的 2016 第七届中国数据库技术大会于 2016 年 5 月 12

日至 14 日在北京国际会议中心召开,此次大会以“数据定义未来”

为主题,邀请众多知名的国内行业知名专家,共同探讨了 MySQL,

NoSQL、Oracle、缓存技术、云端数据库、智能数据平台、大数据待

领域的热点话题与技术,为众多数据库、大数据从业人员,广大互联

网及行业人士提供极具价值的交流学习平台。

作为双体系教师,非常荣幸能有机会参加如此高端的技术交流大

会,感谢各位领导提供这样的机会让我可以接触到现代前沿的技术,

了解技术发展趋势。

虽然对技术本身因为知识方面的欠缺难以理解,但也有自己的感

悟:

一、机会

DT 不仅仅是技术的提升,而是思想的革命。把大数据产业作为

创新驱动的引领性产业,是实现经济发展和生态保护双赢的唯一选

择。安全是大数据的生命线。以大数据技术对抗大数据平台安全威胁

是大数据成功的必由之路,大数据是社会变革的工具,是改变世界的

战略高地。对于大数据,人们的已知远不如未知,更大的发展和变革

在未来。从 IT时代到 DT时代,大数据开启了一个重大的时代转型和

95

新常态节点。大数据及以大数据为核心的产业价值链正在影响和主导

新的经济范式和国家战略,并为推进中国国家治理体系和治理能力现

代化提供强劲的动力。

永洪科技的董事长何春涛讲到,DT 时代的到来是一个风口,未

来的每一个人都是数据分析员,都需要具有数据分析的能力,是每一

个人的日常工作。

这是一个时代,这是一个风口,我们能抓住这个机会,投身这个

风口吗?很明显,我们还需要探索,我们还需要创新,我们还需要努

力奋斗。

二、舞台

第一场会议的时候,我坐在第一排的嘉宾席,可以很清楚地看到

每一个嘉宾,听得很清楚,也看得很明白。看到每一个大 V在台上自

如地演讲,心中莫名地有些失落。舞台那么大,那么耀眼,站在舞台

上有一个人,那个人不是我。

在家里,我是户主,是家里的顶梁柱,没有我,我的家就没了;

在部门,我是部门负责人,对部门有一定的影响力,没有我,部门会

散乱;在双体,我是一个职场老师,双体系有我的印迹,双体的成绩

有我一份看得到的功劳,没有我,双体可能会需要一周或一个月的调

整,当新老师上岗,一切又正常了;在学校,我是一个老师,给七八

百学生上课,没有我,学校会立即调整,不会有什么影响;在北京,

我就像空气一样,没有人能感觉到我的存在,有没有我都一样。我多

么希望像台上的大 V一样拥有全国范围内的舞台和影响力。可那样不

现实,我不得不思考一个问题:我的影响到底能有多大?我的舞台能

有多大?

三、实力

三天的时间,我参加了至少十场演讲,除第一天的主持人外,许

多演讲者的着装是休闲装,T恤、牛仔被好像是他们的标配,从现代

96

礼仪的角度看,好像不对。为什么?

因为他们已经不需要靠着装来打造自己的形象了,他们有足够的

自信站在那个舞台上,最终的原因应该是---实力。

对比自己,我的实力有多大?我可以在部门耀武扬威,我可以在

大院课堂上谆谆教导,我可以在太原开个茶话会,偶尔,我也可以在

某个高校或企业做个讲座或培训。更高的,更想要的呢?我做不到。

为什么?实力不够。那怎么办?老骥伏枥,志在千里,拼呗!

风起了,这是一个美好的时代,社会为我们每个人提供了成就个

人的机会,也为每个人提供了施展抱负的舞台。我在哪里?

我是一个舞者,我希望不远的将来,我能在山西职业咨询这个舞

台上尽情地挥洒起舞!!!

山西双体系 陈江会

二〇一六年五月十九日

山西双体系六期学生张天浪参会总结

为期三天的 2016数据库技术大会于 2016年 5月 12日至 14日在

北京国际会议中心召开,此次大会以“数据定义未来”为主题,有众

多的国内行业专家参加。作为双体系的学生,非常荣幸能够参加这样

高端的数据库技术交流大会,觉得很多东西很实用,虽然说,很多东

西听起来比较有困难,但是觉得对自己还是有很大帮助的。

这两天的技术大会我参加了涉及 Oracle 以及 MySQL 数据库优化

的所有场次,可以说是场场很精彩,场场有收获。有的比较精专,有

的比较全面,但都是来自实际的案例,讲的都是一些企业在应用数据

库碰到棘手问题时案例,以及解决问题的思路,数据库未来的发展趋

势和它现在的面临的问题。没有广告商的广告,没有吹捧的成分,我

现在用的轻量级数据库 SQLite 也能运用相应的知识,所以这次大会

的介绍对我的技术也是一个帮助,总之,从这里我了解了国内大型数

97

据库的状况和顶尖数据库专家的水准。特别值得一提的是云和恩墨的

盖国强老师的讲解,PPT就不是一般的水准,相信参加会议的人都有

同感,讲的 Oracle数据库的优化是从代码字段开始讲解,简单清楚,

十分敬佩老师。

两天的会议很快就过去了,也学到了很多的知识。我有一个想法,

一年之内把关于 SQLite 数据库涉及安卓的所有东西都弄清楚,听讲

座是学习,问别人问题也是学习,我这次大会没问什么问题,主要是

怕问题太初级浪费大家时间,如果有下次,一定向专家请教一些有质

量的问题,争取在三五年后在大会上分享自己的经验和想法,这个很

难,因为首先得成为顶尖专家。

现在从 IT时代进入了 DT时代,不仅仅是技术上的竞争,还是得

思想上的竞争,对于大数据,人们知道的远远不如不知道的多,所以,

变革在未来,永宏科技的董事长何春涛老师讲到,DT 时代的到来是

一个风口,未来的每一个人都可能是 DBA,那么它是一个让你提升的

机会,既可以创造你未来的奇迹,也可以毁灭你的将来,何去何从,

我们应该自己把握机会,抓住机会让自己变得更加完美。

在大会中见到了很多在数据库方面有特大成就的人,他们在舞台

上凯凯而谈,英姿飒爽,他们凭的不是一张嘴,而是他们心中的梦想,

大脑中的知识,他们凭的是自己实力,有实力走遍天下,没实力寸步

难行,在当今社会一定要掌握好属于自己的技能,充分发挥自己的聪

明才智,以自己的实力战胜和你竞争的每一个人,创造属于自己的一

片天。当然我们也要对比自己的实力,从自己的不足出发,查漏补缺。

充实自己。

这次大会举办的很成功,希望每年都能举办类似于这种会议的

Java会议,那么我肯定每年都参加。

山西双体系 张天浪

二〇一六年五月十九日