mongodb应用场景及实例 如何学习“大数据”方面的知识?

[更新]
·
·
分类:互联网
3134 阅读

mongodb应用场景及实例

如何学习“大数据”方面的知识?

如何学习“大数据”方面的知识?

大数据这个名词对于圈子里的同行是非常熟悉的,都知道大数据是个很牛逼的代名词,首先大数据的概念是指在一定时间范围内用常规软件工具进行捕捉,管理和处理的数据集合,是需要新处理模式才能具有更强的决策力,洞察发现力和流程优化能力的海量,高增长率和多样化的信息资产。大数据解释起来是这么回事,可能外行人听起来丈二和尚摸不着头脑,那么就需要自己多花时间去补充这方面的知识,要了解和学习一门技术,就得把这门技术的前和后都了解清楚,基于我个人的观点,对于大数据的学习,最基本的大数据组件Hadoop Spark这个是必须掌握的基础,后面延伸的Hive,HBase等组件,尽然是对数据的处理,那么就少不了和数据库打交道,Sql语句那就是最基本的数据库语言,对于这类都是高级编程语言,那么还要掌握一门编程语言,目前市面上都是推荐Java和Python,如果是我推荐的话,偏向于Python,这个是针对零基础的朋友,关于Python我这里不多加介绍了,对于大数据技术的学习上面只是介绍了几个必学的组件,学起来肯定是困难的,学成之后就会封神了,哈哈!在学习过程中一定要沉静下心来学习,不能浮躁,多问多实操!理论基础要扎实然后结合项目来实战自己所掌握的理论,相辅相成,一定会有成。

有关于DBA书单的推荐吗?

其实在不同的阶段,不同的书会对你有不同的影响,这取决于这阶段你需要什么,能接受什么。
无论什么样的书,这个阶段最能让你得到提高的,就是好的书。好的书我觉得应该买回来,对于做笔记翻页都比较方便,而且能对作者的尊重。所以一般我看电子书看到好的,就算看完了,也会买回一本。
外国原版的书都比较贵,有一些讲OWI等待事件的,索引的也比较好,以后再推荐。
下面这些我认为是很值得推荐的中文书籍。
韩国一哥们写的《海量数据解决方案》,站在Oracle数据库的角度,抽象出了数据库存取数据的本质,是很值得看的。量变导致质变,海量数据情况下很多你平常不注意的地方也得注意起来了。
冬瓜头的《大话存储》,尽管里面有一些关于门派的话会让人摸不着北,但是里面关于各类存储以及现在的云计算等话题,都是说得透透彻的。而且看完后,会发现自己对网络模型也重温了一遍。
鸟哥的Linux当然是Linux入门级必备的啦,讲得详细,但是有些啰嗦,呵呵。
《教你如何成为10gOCP》,也是国内的一本现在已经绝版的书,讲Oracle的本质有些讲得挺好的,比如讲审计,buffer cache等就比很多书讲得好,作者是Oracle之前一位OCP讲师。
瑞士一哥们写的《ORACLE性能诊断艺术》,它未必能成为你入门的调优书籍,但必然会伴随你调优技能的成长,你会发现你时不时地需要翻翻这本书,并且越看越懂。
《高性能sql引擎剖析》,这本被老盖认为是十年磨一剑的作品,我认为的确是很好的调优参考书籍,里面关于执行计划每个操作的介绍、每个消耗都讲得很详细。
《PLSQL从入门到精通》是一本很好的PLSQL书,比起清华出版社那几本好很多,是数据库开发人员的傍身之物。
这些书当中也有一些是并不怎么推荐读者买的。
右上角那三本,清华大学出版社的,白皮红字的,感觉就是google翻译过来的,文笔非常不通畅,晦涩难懂,建议读者不要买清华大学出版社的。
三思笔记讲得比较偏,也不能成为参考手册,但如果要做跟数据导入导出迁移等的项目或任务时,可以用来参考。
老盖(盖国强)的书也看了不少,说实话,书的名气大于书的内容。除了一些摘取各种场景的案例可以作为茶余饭后看看外,并不一定那么有实用价值。而且有些书的排版、编辑也真是太随意了。
《让Oracle跑得更快》,这本书比较初级,适合初学者。但如果研究得深的朋友,就不适合看这本书了。
以前问人什么书最好,别人都会说是联机文档。其实也未必,联机文档就是产品说明书,大抵说明你怎么用它,而不是它怎么构造出来的。而且Oracle善于堆砌概念,本来是简单的一堆东西被它堆出高深的概念,比如RAC当中的SCAN就是这样。研究得深的朋友,肯定会觉得联机文档已经满足不了他们的需要了。更何况,Oracle有时就没想让你搞明白,毕竟是闭源的产品。