本PPT来自SparksummitEUROPE2017(其他ppt资料正在整理中,请关注本公众号iteblog_hadoop,或https://www.iteblog.com)
ApacheSpark不管是在ETL、呆板学习还是数据堆栈等方面都是很不错的工具。但是真正想充实利用好Spark必要你相识数据存储、文件格式以及查询优化等工作。本演讲作者将先容其多年来利用Spark的履历以及最佳实践,信托会对各人有资助。
本次分享的视频如下(由于公众号的限定,只能上传20MB之内的视频,必要高清的视频请到https://www.youtube.com/watch?v=iwQel6JHMpA下载,大概直接接洽我)
我要评论