《4王宏志-哈工大的数据科学与大数据专业建设.pdf》由会员分享,可在线阅读,更多相关《4王宏志-哈工大的数据科学与大数据专业建设.pdf(26页珍藏版)》请在三个皮匠报告上搜索。
1、海量数据计算研究中心Massive Data Computing Lab HIT哈尔滨工业大学的数据科学与大数据技术专业建设哈尔滨工业大学 王宏志http:/ 人工处理规模大、变化快的数据难度越来越大l 大数据需要“沙里淘金”求解大数据计算问题的过程能行可计算否软件系统用计算机语言实现算法算法设计与分析可计算否?计算问题数据量资源约束时间约束面向大数据计算的算法与数据结构知识面向大数据计算的系统知识现实世界数据分析任务建模知识与能力“现实”到“模型”业务调研准备数据浏览数据定义模式模型评估变量选择计算参数数据驱动业务的逻辑思维能力“模型”到“算法”资源限制 内存不足 外存算法 空间亚线性算法
2、处理器计算能力不足 并行算法 实时性要求 问题计算复杂度下界难以满足要求 时间亚线性算法面向大数据计算的算法知识“好算法”与“好系统”面向大数据计算的分布式系统知识 面向大数据计算的数据管理知识 面向大数据计算的程序设计知识适合的大数据计算软硬件平台设计高效的大数据存取结构数据存储结构数据分布策略数据索引方法编写适用于大数据的“好程序”避免使用系统垃圾回收机制减少内存拷贝减少数据重分布次数减小重分布数据量专业区分度独特的学科基础和内涵大数据表达理论、大数据计算理论与技术、大数据应用基础理论不同于计算机科学与技术、软件工程等学科不仅要掌握计算方法和工具,还要认知数据本身的现象和规律、数据管理和处
3、理的基础理论、全生命周期的数据管理方法和系统等专门知识不同于商业智能和统计学不仅包含统计和商业智能的方法和模型,还包括算法设计与分析和计算系统的设计、研发、运维、评测、优化、应用等独特的专业课程设置突出数据科学基础课程教学裁剪传统计算机统类课程强调大数据管理与处理的全生命周期充分结合行业,突出实用性独特的能力要求数据密集型计算系统的设计、构建、运维及应用的能力数据密集型计算平台的开发及应用能力大数据理论、系统及应用的创新能力面向数据密集型问题,将现实问题抽象为数据计算模型的能力建立由多源异构数据到全面智能应用的建模及求解算法能力大数据开发项目的过程数据诉求需求模型架构算法系统稳定的系统从大数据
4、项目看大数据人才某智慧城市项目从数据和诉求到需求从需求到模型从需求到架构从模型和架构到算法回归算法 最小二乘 Lasso回归.分类算法 SVM 决策树 聚类算法 Kmeans DBSCAN.从算法到系统回归算法最小二乘Lasso回归.分类算法SVM决策树聚类算法KmeansDBSCAN.从系统到稳定运行的系统200202021培养目标 面向世界科技前沿和国家重大需求,瞄准数据科学与大数据技术的未来原创性、革命性、颠覆性、交叉性技术,秉承“规格严格、功夫到家”的校训,着力培养信念执著、品德优良、知识丰富、本领过硬、具有国际视野、引领未来发展的新时代杰出人才。以掌握迎接第四次
5、工业革命发展变化所需要的数据科学与大数据技术基础知识和专业技能为核心,注重能力培养和素质提高,培养基础宽厚、能力出众、德智体美劳全面发展的时代新人,具备良好的学术大师、工程巨匠、业界领袖、治国栋梁潜质。毕业五年的目标身心健康,具有正确的世界观、人生观与价值观,恪守工程伦理与职业道德规范,德智体美劳全面发展具备社会责任感、专业使命感,具有在数据科学、大数据技术及其相关交叉领域引领未来发展的潜力成为数据科学和大数据技术领域的助理教授、数据科学家、大数据工程师或系统架构师、数据科学和大数据技术领域的创业者和企业管理者、具备数据科学和大数据技术知识的社会管理者具备面向数据科学和大数据技术的计算思维和系
6、统思维能力,能够综合运用计算机软硬件、数学和数据科学与大数据技术等方面知识,能够对现实世界和信息化系统中的问题进行建模,面向实际应用设计高效的逻辑和物理数据结构,分析、设计、实现面向大数据的算法和计算系统并进行模型、算法和系统的评估具备较强的数据科学跨学科交叉创新能力或大数据计算相关的理论与工程创新能力具有国际视野、团队合作、项目管理、跨文化交流、终身学习能力更长远的目标毕业十五年左右的杰出人才培养目标为:成为大数据技术领域中在学术界有一定影响力科学研究人员、高水平系统研发人员、企事业单位管理者、以大数据关键技术为核心的创业者;生物、工业、金融等以数据为核心的重要领域中有影响力的数据科学家、企
7、事业单位管理者或以数据科学驱动交叉领域的创业者;具备数据科学和大数据技术相关知识的社会管理者。毕业三十年左右的杰出人才培养目标为:成为引领世界数据科学发展的学术大师,及运用大数据科技解决工业、经济、医疗、健康、能源、环境等重大问题与挑战,带领我国迈向世界强国并引领人类进步的工程巨匠、业界领袖、治国栋梁。课程体系基础能力培养课程学分学时大学计算机232高级语言程序设计348集合论与图论348数据结构与算法348专业解读116小计12科学理论培养数理逻辑与近世代数348形式语言与自动机232算法设计与分析232人工智能232小计8系统能力培养数字逻辑与数字系统设计232计算机系统348软件工程34
8、8计算机网络348操作系统348编译系统232小计16实践创新能力程序设计能力训练124软件设计与实践248计算机硬件设计与实践2专业实践248实习实训22周Pjbr项目开发1毕业设计10一学年小计20专业胜任力大数据计算基础348数据库系统348大数据分析348大数据挖掘348专业方向选修I348专业方向选修II348小计18专业课程体系现实世界模型大数据算法大数据计算系统大数据计算基础大数据分析大数据挖掘计算机科学与技术基座数据库系统计算理论机器学习专业实践大数据系统高级大数据管理基因组大数据分析生物大数据分析核心算法通用大数据技术方向生物大数据方向“大数据计算基础”脉络图大数据导论大数据
9、算法大数据数据结构大数据计算系统大数据管理系统大数据应用算法系统课堂授课实验与作业设计安装配置调优实现实验撰写报告“大数据计算基础”脉络图问题分析建模优化实现实验撰写报告课堂授课实验与作业大数据分析数据分析流程大数据分析性能优化领域大数据分析多元统计分析数据挖掘 数据库、机器学习、统计学、模式识别、人工智能以及高性能计算等技术的融合 大数据计算基础和大数据分析课程的总结与延伸1.数据挖掘概述2.数据特征分析与预处理(1)数据的类型(2)数据的统计特征3.关联规则挖掘4.分类算法5.聚类算法6.异常检测(3)数据预处理(4)缺失值的处理(5)数据可视化专业建设效果 2022年获批国家一流专业建设点 三门专业核心课程全部进入ACM数据科学示范课程 2021年和2022年蝉联软科中国大学排名第一名现实世界模型大数据算法大数据计算系统谢谢各位老师哈尔滨工业大学 王宏志http:/