
会员
Spark大数据分析实战
更新时间:2021-03-26 22:19:13 最新章节:9.5 案例分析:使用GraphX计算社交网络中粉丝的平均年龄
书籍简介
本书作为Spark的入门书,从Spark核心编程语言Scala讲起,涵盖当前Spark主流的开发组件。以实操为主,深入讲解每一个操作步骤,包括SparkRDD离线数据处理、SparkSQL快速结构化数据处理、SparkStreaming实时数据处理,同时包括案例讲解、源码剖析、常用Shell命令和JavaAPI详解。即使没有任何Spark基础的读者也可以对照书中的步骤成功搭建属于自己的Spark集群,是一本真正的实操指南书籍。本书可作为大数据开发人员的随身手册,也可作为Spark新手入门的指导书籍,以及大数据从业者的参考用书。
品牌:清华大学
上架时间:2020-06-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
张伟洋
同类热门书
最新上架
- 会员《MySQL从入门到精通(第3版)》从初学者角度出发,通过通俗易懂的语言和丰富多彩的实例,详细介绍了MySQL开发需要掌握的各方面技术。全书共分为4篇22章,包括数据库基础,初识MySQL,使用MySQL图形化管理工具,数据库操作,存储引擎及数据类型,数据表操作,MySQL基础,表数据的增、删、改操作,数据查询,常用函数,索引,视图,数据完整性约束,存储过程与存储函数,触发器,事务,事件,备份与恢计算机14万字
- 会员《企业级大数据项目实战:用户搜索行为分析系统从0到1》基于真实业务场景,以项目导向为主线,从0到1全面介绍企业级大数据用户搜索行为分析系统的搭建过程。全书共6章,第1章讲解项目需求与架构设计,详细阐述项目数据流与系统架构;第2章介绍大数据项目开发环境配置,手把手带领读者配置操作系统、Hadoop集群与相关工具,为后续项目实施打下基础;第3~5章逐步实现项目需求,第3章讲解用户行为数据采集模块的开发计算机9万字
- 会员MySQL数据库是目前全球流行的数据库之一。《MySQL8.0从入门到实战》从入门到实战,系统全面、由浅入深地介绍MySQL数据库应用的各个方面。全书分为8个部分,共18章。第1部分(第1~3章)介绍MySQL的基础知识,包括初识MySQL、数据库设计和数据类型;第2部分(第4~6章)介绍MySQL的基本操作,包括SQL基础操作、MySQL连接查询和数据复制、MySQL基础函数;第3部分(第7、8计算机9.7万字
- 会员本书是《数据库原理——GaussDB技术及应用》一书配套的辅助教材。全书共分3部分:第一部分为实验指导,共有13个综合实验,每一个实验都是根据教学目标而设计,详细讲述了每一个实验的实验目的、实验任务及实验步骤,从而培养学生掌握关系数据库管理软件技术与应用的技能;第二部分为习题集,是根据主教材各章节内容编写的习题及习题答案,内容广泛,有填空、选择、简答、设计及实验题等多种形式,利求通过对这些习题的训计算机6.9万字
- 会员数据科学的关键技术包括数据存储计算、数据治理、结构化数据分析、语音分析、视觉分析、文本分析和知识图谱等方面。本书的重点是详细介绍文本分析和知识图谱方面的技术。文本分析技术主要包括文本预训练模型、多语种文本分析、文本情感分析、文本机器翻译、文本智能纠错、NL2SQL问答以及ChatGPT大语言模型等。知识图谱技术主要包括知识图谱构建和知识图谱问答等。本书将理论介绍和实践相结合,详细阐述各个技术主题的计算机21.6万字
- 会员本书是一本介绍分布式数据库基础内容与应用的大数据专业类图书,力求培养读者对分布式数据库的应用技能。本书共11章,采用原理+代码实例+综合案例的编写形式,清晰明了地介绍分布式数据库的原理、基础应用、进阶应用及主流工具的使用方法、应用场景,以理实结合为编写要求,让读者能够轻松学习和掌握分布式数据库的内容。本书可以作为高等院校计算机、网络技术等相关专业的教材,也可以作为数据库相关工作的从业人员的参考用书计算机14万字
- 会员《数据分析实践:专业知识和职场技巧》从初学者的角度出发,讲解了进阶为高级数据分析师所需的知识和技能,其中既包括数据分析岗位的介绍、发展现状及未来趋势,也包括实际工作中各环节的方法策略、实战案例,还包括职场中的困惑解答及面试指导。阅读本书,并基于本书进一步拓展所需要的知识能,可以帮助读者形成一套成系统、可实战的数据分析方法论。计算机19.6万字
- 会员时序数据库是一种新型技术,主要用于工业互联网软件建设中。近年来,伴随着物联网技术在智能制造、交通、能源、智慧城市等领域的发展,时序数据库也发展迅速,成为搭建应用的必备数据库之一。《深入理解InfluxDB》从InfluxDB的安装开始,一步步详细介绍InfluxDB的功能及原理,带领读者深入理解以InfluxDB为代表的时序数据库。计算机7.6万字
- 会员本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现计算机7.1万字
同类书籍最近更新
- 会员《数字媒体交互设计(初级)——Web产品交互设计方法与案例》针对Web产品交互设计新人,通过案例深入浅出地讲解了Web产品交互设计的思维、方法与技巧。共12章,主要讲述了Web产品交互设计的要素、流程、工具和规范,Web项目管理及协作方法,Web产品交互创意的梳理方法,Web产品流程图、原型图的制作方法,以及图标设计、组件设计、界面设计、图像处理、运营设计等内容,并辅以Web项目实战案例,带领读者数据库8.2万字
- 会员这是一部从企业架构视角系统讲解企业级数据架构的著作,包含数据架构的原理、方法和实践。本书拟分为四个部分共17个章节来系统性的阐述数据架构相关内容。数据库19.5万字
- 会员Thisbookfollowsatutorial-basedapproachandispackedwithexamplesinacompactandconciseformat.Ifyouhaveeverwantedtocreatephotosandimagesthatgobeyondsimplepointandshootresult数据库2.1万字
- 会员本书以小象学院git项目方式管理。感谢姜冰钰、陈超、冼茂源等每一位内容贡献者,感谢他们花费大量时间,将自己对Spark的理解加上在实际工作、学习过程中的体会,融汇成丰富的内容。与企业不断涌现的对大数据技术的需求相比,大数据人才还存在很大缺口,对大数据技术充满期许的新人正在源源不断地加入这个领域。在小象学院的教学实践过程中,我们发现,一本能完整系统地介绍Spark各模块原理并兼顾使用实战的书,对于初数据库9.4万字
- 会员本书涉及云数据中心网络很多块的内容,主要包括传统技术、商用SDN方案、开源SDN方案以及相关的学术论文,覆盖了目前绝大部分的主流技术以及一些其他较为新颖的技术,是目前市面上少数能够切入SDN某一个具体行业应用场景,并对相关技术和产品进行系统性介绍的书籍之一。数据库33.6万字