(大一计算机实验报告总结)(大一计算机实验小结)

香港城市大学—数据科学学院

数据科学理科硕士

课程目标

该课程旨在培养数据分析的毕业生,以满足对高层次数据科学技能日益增长的需求,并培养毕业生将数据科学技术应用于组织决策中的知识发现和传播。它还旨在帮助数据分析专业人员提升他们的技术管理和开发技能,并为来自相关量化领域的学生提供一条坚实的道路,以迅速过渡到数据科学职业。

课程预期学习成果(PILOs)

在成功完成本课程后,学生应该能够。

应用适合于数据科学学科的科学和工程知识

理解当代技术的理论基础,并应用它们来管理、挖掘和分析跨学科的数据

理解计算工具,并使用数据驱动的思维来发现新的知识和解决具有复杂结构的现实世界问题

认识到对新兴和创新的数据科学技术和理念的需求,并参与到持续的学习中去

以书面、口头和视觉形式交流想法和发现,并在一个多元化的团队环境中工作

课程列表

核心选修课(15学分)

课程代码 课程名称 学分单位

SDSC5001 统计机器学习 I 3

本课程侧重于统计机器学习的理论基础和基本方法,涵盖机器学习的概率论和统计推断的关键概念和结果,回归和分类的经典和前沿方法和理论,以及核方法的理论基础。

SDSC5002 探索性数据分析和可视化 3

本课程的目标是向学生介绍总结数据的基本探索性技术和相关的视觉方法。探索性数据分析通常在正式建模开始前应用。它可以帮助制定假设并为开发更复杂的统计模型提供信息。该课程从介绍探索性数据分析中使用的基本图形技术开始,继续介绍探索性分析的典型统计方法,包括聚类和降维技术,使你能够对高维数据进行图形化显示,然后重点介绍广泛的数据类型的可视化技术和方法。将引入感知的原则来设计有效的数据可视化。学生将通过一系列的案例研究和实践项目,学习与现实世界数据打交道的技能。

SDSC5003 存储和检索数据 3

本课程提供关系型数据库的知识和Hadoop/Spark系统的介绍,包括设计关系型数据库的实体关系模型,数据库开发过程的原则,通过数据库检索和存储数据的结构查询语言,以及入门级的Hadoop/Spark内容。

SDSC6001 统计机器学习II 3

本课程侧重于无监督和有监督学习的理论基础和基本方法,包括支持向量机、正则化方法、主成分分析、聚类、核方法和深度学习方法,以及应用Python编程和实现上述算法和方法的学科。

SDSC6002 数据科学的研究项目 3

本课程为学生提供了充分的机会,在他/她独立处理数据分析问题的过程中展示创新能力和举措,发展整合和应用数据科学知识和数据分析技能的能力,并探索有关数据收集和管理的道德和隐私影响的考虑。该课程还作为一个平台,通过数据科学知识在学生中展示和分享对实际问题的新颖调查。

选修课(15学分)

课程代码 课程名称 学分单位

CS5285 电子商务的信息安全 3

该课程旨在提供对信息安全的理解,概述保护数据和系统的要求和手段,并且,这是电子商务系统设计中的一个基本特征。该课程还研究了一系列的信息安全考虑和设计问题,这些问题被纳入电子商务系统的设计、开发和管理中。

CS5487 机器学习。原则和实践 3

本课程的目标是让学生学习设计机器学习算法所需的基本知识。 机器学习算法允许计算机自动学习从经验数据中识别复杂的模式,如文本和网络文件、图像、视频、声音、传感器数据和数据库。 本课程旨在对机器学习有一个广泛的概述,重点是机器学习算法的基本设计、推导和实现。 在课程结束时,学生将掌握从第一原理设计和实现新的机器学习算法所需的基本知识。

CS6290 增强隐私的技术 3

在当今的数字化世界中,包含敏感个人信息的大量数据被不断收集。例如,医疗系统中的电子健康记录和无处不在的移动应用中的位置数据。我们如何保证所收集的用户数据不被滥用,隐私政策不被违反?我们如何在保护用户隐私的同时允许有效的数据共享和利用?当服务器不被完全信任时,我们如何仍能向用户提供理想的服务并尊重他们的隐私?

本课程旨在为学生提供信息安全和隐私方面的先进概念和新兴技术的最新进展。主题将被调整以反映最新的趋势和学生的兴趣。示范性的主题包括但不限于:云安全、加密货币和去中心化账本技术、机器学习和安全、数据匿名化和加密的数据库。学习活动包括讲座、小组项目、案例研究和辅导课程。

CS6493 自然语言处理 3

本课程介绍了自然语言处理的算法和技术,从文本处理的计算语言学到语言理解的信息提取。主题包括基于统计和神经的语言建模,词的表示,以及预训练的语言模型,如BERT和GPT。还将介绍基本和高级自然语言处理任务,如机器翻译、对话系统、问题回答、文本分类/标签/标记和知识图谱。

SDSC6003 贝叶斯数据分析 3

本课程的目的是让学生了解贝叶斯统计学,培养学生为实际数据分析问题建立贝叶斯模型的能力。学生将学习用马尔科夫链蒙特卡洛和其他软件(Matlab或R)中的数字方法实现贝叶斯模型,并解释结果。此外,他们将学习贝叶斯观点及其基础理论。

SDSC6004 智慧城市的数据分析 3

现代城市依赖于连接用户和基础设施的数据流。因此,数据科学技能对于智能城市的设计和运营至关重要。大量的数据,以及用于利用数据的统计分析和机器学习算法,有望大大改善关于如何维护和建设城市基础设施及其环境的决策。本课程讲授基本的、易于应用的数据分析、统计方法和机器学习算法,这些方法有助于利用在交通、环境、建筑和电网系统中通过人群感应和遥感技术获得的数据。该课程将分四个模块讲授:流动性和交通、建筑能源系统、极端事件和城市复原力、以及气候变化和环境变异。在整个课程中,学生将学会使用真实数据,通过基本的统计和机器学习技术来解决智能城市的应用问题。

SDSC6006学位论文 6

SDSC6007 动态编程和强化学习 3

该课程介绍了动态编程--不确定条件下顺序决策问题的基本模型和解决技术,以及强化学习--通过自主代理与世界的试错互动进行学习以做出接近最优的决策的框架。

该课程将涵盖以下与动态编程和强化学习相关的基础材料,包括马尔科夫决策过程、价值函数、蒙特卡洛估计、动态编程、时差学习和函数近似。本课程的目的是帮助学生对这些先进的优化和学习方法和算法有直观的了解,熟悉这些方法和算法的数学理论,并能够应用动态编程和强化学习技术来解决实际问题。

SDSC6008 实验设计和回归 3

本课程的目的是让学生了解实验设计和回归方法,培养他们设计和分析物理和计算机实验的能力,并让他们认识到这种系统方法的价值。将介绍物理和计算机实验的实验设计,如正交阵列和空间填充设计,学生将学习如何和何时使用这些设计。课程将培养学生对分析物理实验数据的基本回归技术的掌握,其中包括线性模型、最小二乘法、方差分析和模型选择方法,以及应用这些技术的能力。此外,学生将学习应用高斯过程模型来逼近计算机实验中的高度非线性函数关系。

SDSC6009 规模化的机器学习 3

本课程讲授为PB级的结构化和非结构化数据开发可扩展的机器学习管道所需的基本原则。课程涵盖了通过部署MapReduce并行计算在大数据下扩展机器学习过程的原则。此外,还将讨论并行计算环境(Spark)中机器学习算法的实践设计和开发。学生将使用MapReduce并行计算框架进行机器学习的工业应用和部署,包括广告、金融、医疗保健和搜索引擎等各个领域。

SDSC6011 数据科学的优化 3

本课程提供了一个在数据科学中应用的优化方法的介绍。 我们将介绍理论基础和优化的基本算法以及针对数据科学和机器学习应用中出现的实际问题的高级优化方法。课程内容包括凸分析,拉格朗日对偶理论,线性和非线性编程,圆锥编程,等等。

SDSC6012 时间序列和递归神经网络 3

在宏观经济学和其他商业、科学和工程领域,很多数据都是以时间序列数据集的形式出现。在本课程中,学生将学习用于分析此类数据的统计工具,并在统计软件R的帮助下将其应用于现实世界的数据。然后,介绍ARMA模型,以及模型的估计方法和预测的特性。还讲授了用于模拟误差方差变化的GARCH模型。课程的第二部分介绍了用于时间序列预测的递归神经网络。在整个课程中,将强调使用R软件的教学方法进行数据分析。

SDSC6013 金融工程和技术专题 3

技术创新正在颠覆性地改变消费者金融服务领域的金融服务业,包括移动支付、外汇、市场借贷、储蓄和投资、金融咨询(机器人顾问)和个性化保险。本课程旨在了解在支付、融资、投资和保险等领域推动这一变化的经济和技术力量。我们将首先回顾金融工程的基本概念和模型,然后围绕选定的工业应用案例,研究选定的学术论文,以了解基础经济学、技术和研究事项。该课程打算采用互动方式,包括课堂讨论、讲授案例、小组项目,以及可能的嘉宾演讲。

SDSC6014 网络生活和数据科学 3

本课程涵盖全球数百万人使用的日常网络应用和服务背后的基本技术,包括谷歌搜索、YouTube、手机服务和区块链。这些技术包括,但不限于,优化,算法,安全,数据分析和机器学习。还将讨论数据科学和相关学科如何实现和加强这些基本的网络应用和服务。

SDSC6015 随机优化和在线学习 3

随机优化在机器学习中起着至关重要的作用,在实践中,全批数据要么不可用,要么太大,无法处理。本课程介绍了该领域的理论基础和算法发展。主题将从基本的凸优化理论以及数值方法开始,然后我们将重点介绍随机优化的随机近似以及它在许多统计和机器学习模型中的各种加速,并辅以研究文献中的最新进展。对这些随机优化算法的基本理论理解也将被解释。上完这门课后,学生有了一些经典优化和概率理论的初步知识,有望进入机器学习的新优化世界,在过去的几十年里,这个世界已经取得了重大进展。

SDSC6016 预测分析和金融应用 3

本课程着重于预测分析法在金融数据中的应用。 我们将回顾经济和金融预测中使用的一些核心工具,包括预测回归、时间序列模型、变量和模型选择、预测组合、缩减方法和向量自回归。 我们将探讨如何应用这些工具来预测金融资产的回报,包括全球股票和商品,特别注意不同类型的预测--点预测、区间预测或密度预测。 我们还将介绍现代预测方法,如惩罚性回归和神经网络,以及它们在金融市场预测中的应用。 预计学生将获得如何将预测分析法应用于经济和金融问题的工作知识。

SDSC8007 深度学习 3

本课程为学生提供了深度学习的系统研究。主题包括浅层和深层神经网络,深层全连接和结构化神经网络,近似的普遍性,卷积和傅里叶变换,深层卷积神经网络,深层递归神经网络,梯度下降和随机梯度下降,反向传播和自动分化,深层学习算法的学习能力,深层神经网络结构的设计。

SDSC8008 数据驱动的运营研究 3

本课程为学生提供博士研究水平的方法及其在数据驱动的决策、风险管理和运营中的应用。选定的主题包括预测性和规定性分析,学习数据中的依赖关系和结构以进行状态估计和预测,在不确定条件下进行决策的分布式稳健优化,以及理解机器学习结果的可解释性方法。重点是将这些方法应用于电子商务平台、在线市场和金融市场中产生的实际问题。

SDSC8009 数据挖掘和知识发现 3

本课程将为学生提供挖掘各种类型复杂数据的高级算法,特别是图数据。课程将从表和图数据的经典数据挖掘方法开始,接下来将进入用深度学习算法进行数据驱动的系统建模。我们将回顾不同的模型架构和网络嵌入和图神经网络的学习算法。我们将进入最近流行的研究课题,包括自我监督学习,数据高效学习和社会公益的数据挖掘等。

SDSC8011 数据科学的社会基础 3

由于目前数据科学家使用的大部分数据都是由人类创造的或关于人类的,因此向数据科学的学生介绍人类数据背后的社会过程和机制是必要的,也是有帮助的。特别是,该课程侧重于引起人类数据中各种挑战和/或偏见的关键问题,如自我选择、社会欲望、认知限制、非独立性、背景效应、生态谬误等。这些问题的处理将与技术问题有内在联系,如抽样、测量误差、统计控制、因果推断等。在课程结束时,学生应该能够在现有的数据科学文献中识别潜在的人为错误或偏见,制定系统的方法来解决这些问题,并利用现实世界的数据实施一些建议的补救措施。

SDSC8013 分类数据分析的统计方法 3

在本课程中,学生将学习如何使用描述性和检验性统计、统计模型和统计推断来分析分类数据。主题包括使用几率和相对风险的统计推论、多向或然率表、分层分析的测试、几率和相对风险、离散数据的广义线性模型、名义和顺序反应的多类别Logit模型、匹配对的推论和对数线性模型。学生将学习这些方法可能被应用的地方,如何应用它们,以及如何正确解释结果。该课程对那些对分类数据分析感兴趣的人很有吸引力,例子是基于案例研究的。学生将学习分析分类数据的统计思维方式,该方法可应用于不同领域以解决类似问题。

SDSC8014 在线学习和优化 3

本课程涵盖了在线学习和优化的基础知识和应用。主题包括在线学习,在线凸优化,竞争分析,遗憾分析,在线梯度下降,和在线算法。其他选择性的主题包括预测的在线优化,稳健优化,在线随机优化,以及有反馈的在线优化。在线学习和社会系统中面对输入不确定性的优化的应用将被用来补充理论发展。学生应该了解凸优化、线性代数和微积分。

完整的硕士学位需要30个学分,只需完成授课课程;或授课课程加上论文项目。

备注。课程选修课将根据资源的可用性和足够的注册人数提供。

入学要求

申请人必须是工程、科学或其他相关学科的学位持有者,或其同等学历。

来自教学语言不是英语的院校的非本地考生应满足以下英语能力要求之一。

在托福考试(TOEFL)中取得59分(修订的纸质考试)或79分(网络考试)的成绩@#;或

国际英语语言测试系统(IELTS)的总分达到6.5分;或

大学英语六级考试(CET6)中至少取得450分的分数;或

其他同等学历

@托福和雅思成绩被认为在两年内有效。申请人需提供在大学申请期开始前两年内获得的英语测试成绩。

# 申请人需要安排教育考试服务中心(ETS)将其托福成绩直接寄给大学。城大的托福机构代码为3401。

此文摘自学校官网Master of Science in Data Science (MSDS) | School of Data Science (cityu.edu.hk)

声明:我要去上班所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者美国老李说留学所有,原文出处。若您的权利被侵害,请联系删除。

本文标题:(大一计算机实验报告总结)(大一计算机实验小结)
本文链接:https://www.51qsb.cn/article/m8a3q.html

(0)
打赏微信扫一扫微信扫一扫QQ扫一扫QQ扫一扫
上一篇2022-12-23
下一篇2022-12-24

你可能还想知道

发表回复

登录后才能评论