数据科学初步学习路线

目前来说,主要把数据科学的学习分为三个部分,一个是基于java搭建数据可视化平台,一个是利用python把常用的机器学习模型都实现一遍,一个是学习hadoop等大数据技术框架。

首先是关于数据可视化平台的搭建,个人认为这是一个较总和利用java的项目,首先是收集收据,利用数据库进行初步处理,然后利用java针对运算量较大的情况通过多线程进行处理,处理数据得到统计结果后,利用SSM框架,把结果传输到前端,前端利用这些数据,编写页面,利用echarts、D3.js等进行展示,完成整个数据平台的搭建,基本上,整个过程设计到数据库的基本操作、java的全面应用、前端的综合运用,但也不会过于深入。

经过第一阶段,主要是掌握了基础知识,为了进行高效的数据处理分析,数据结构和算法是必须深入学习的,这里暂时还没决定应该通过java还是python进行学习,或许可以先掌握了python的基础部分,再分析应该用哪种语言学习,不过目前来说通过java写模型也是完全没问题的,所以选择哪种语言应该不是大问题。

之后就是python的学习,主要还是从实现机器学习模型的角度入手,先熟悉怎么运用python,之后深入理解python在数据分析上的优点,把之前搭建的数据可视化平台通过python实现一遍,主要研究python是如何进行数据的处理和分析的。