U-SaaS《大数据》专业方向四门课程更新上线

来源:西普教育 作者:西妹 发布时间:2017-08-15 11:30:22 点击量:328
      感谢课程研发老师的辛勤努力,我们又有新的《大数据》方向的课程呈现给大家,到目前为止我们的《大数据》课程家族已经有包括:《数据仓库Hive开发基础》、《函数语言Scala开发基础》、《数据迁移sqoop开发基础》、《数据采集flume开发基础》、《R语言与数据挖掘》、《机器学习基础与应用》、《网络爬虫与文本分析实训》等并且持续更新中,敬请期待!
     本次更新的两门课程分别为:《大数据平台搭建》、《大数据应用开发》、《Spark开发基础》、《大数据技术原理》4门课程,下面为大家做一下导读:


大数据平台搭建

     大数据平台就是一个对大量数据进行存储、运算、展现作为目的的平台。 平台搭建要注意平台的稳定性和可扩展性,避免在存储和运算过程中数据的丢失等问题的发生。在本课程中学习如何快速、有效的搭建大数据所需的平台。主要内容包括Linux入门基础、Hadoop环境搭建、Zookeeper环境搭建等。 通过对大数据平台搭建的学习,使学生熟悉对Linux系统的操作,对大数据的平台搭建具有良好的兴趣,提高了学生的实践能力。
第一章 Linux入门基础
第二章 Hadoop环境搭建
第三章 Zookeeper环境搭建
第四章 Hbase环境搭建
第五章 Hive环境搭建
第六章 协作框架搭建


大数据应用开发
      如今都知道大数据的存在,大数据应用在各个领域,但是这数据具体是怎么进行统计和存储的呢?这是本课程的重点。 通过学习大数据应用开发我们会掌握:分布式存储HDFS技术,Hdfs技术的基础命令,Hdfs java api 操作文件创建、删除、上传、下载、追加内存、文件合并的熟练运用。分布式计算MapReduce技术,MapReduce技术的计算、天气和温度的分析、学生成绩的统计、排序、多数据处理、数据的分区等。协调服务Zookeeper技术中的节点创建和修改等。大数据协调框架技术的数据导入、迁移、查询、修改等第一章 Linux入门基础
第一章 分布式存储HDFS技术
第二章 分布式计算MapReduce技术
第三章 协调服务Zookeeper技术
第四章 大数据协调框架技术


Spark开发基础
   《spark开发基础》本课程介绍Spark是一种与 Hadoop相似的开源集群计算环境,主要介绍搭建spark集群、构建开发spark应用程序、数据加载成RDD的方式、Spark RDD常见算法。目标是让学生通过对spark集群环境的搭建,spark应用开发的构建,spark RDD的使用,以达到与实际工程应用相结合。本课程主旨是让学生更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
第一章 spark环境搭建
第二章 IDE开发环境搭建
第三章 Spark RDD

大数据技术原理
      本课程设计Hadoop核心技术、Hadoop协调框架技术、数据挖掘与数据爬取相关的章节,设计内容实验有hdfs的操作、map reduce的实现、Hive的操作使用、java的数据爬取等内容。 通过对大数据技术原理的学习,使学生熟悉对Linux系统的操作,对大数据的平台搭建具有良好的兴趣,提高了学生的实践能力。
第一章 Hadoop核心技术
第二章 Hadoop协调框架技术
第三章 数据挖掘与数据爬取