章节大纲
-
-
-
-
下载作业文件”ps4.pdf“,将答案按题号顺序 写在A4纸里,写上学号姓名。4月16号前,学委收集好交到工二413。
禁止抄袭,若发现将会严重影响课程成绩。
注意:卷积的计算公式中,padding是要乘2的,也就是在图像的左右上下加padding
-
抱歉各位同学,由于我的疏忽,第三次作业3,4两道题有些问题,现在将修改后的作业上传,同学们下载下来做就好
还是按顺序写在A4纸上,学委收好之后周五前交到工二413
禁止抄袭,否则取消成绩
-
-
补充评分说明:对于截图中字太小以至于用27寸大屏都要贴上去才能勉强看见的作业,都扣5分卷面分以告慰我发胀的眼睛和想yue的大脑。
下载作业文件后命名为“学号_姓名_ps1”,(建议用Jupyter Notebook)完成代码并运行。将代码及运行结果全部截图后按题号顺序放在一个word或pdf文档里提交,首张截图需包含带有学号姓名的文件名。禁止抄袭和直接复制粘贴。
-
平时成绩:6 次平时测验(选择题为主,实验课时先测验再做实验)、考勤:30%
6 次测试内容
test1 01020304讲 test2 0506 讲 test3 0708 讲 test4 09101112 讲 test5 3141516 讲 test6 1718192021 讲 期末及平时测验题库:https://talent.shixizhi.huawei.com/iexam/1365189427395223554/examInfo?examId=1592050502435512939&sxz-lang=zh_CN
Previous midterms are available: Without solutions: Spring 2013, Spring 2014, Spring 2015, Fall 2015, Spring 2016, Spring 2017, Spring 2019, Summer 2019, Spring 2020 Midterm A, Spring 2020 Midterm B, Spring 2021, Spring 2022, Spring 2023, Spring 2024. With solutions: Spring 2013, Spring 2014, Spring 2015, Fall 2015, Spring 2016, Spring 2017, Spring 2019, Summer 2019, Spring 2020 Midterm A, Spring 2020 Midterm B, Spring 2021, Spring 2022, Spring 2023, Spring 2024.
Previous final exams are available. Without solutions: Spring 2013, Spring 2014, Spring 2015, Fall 2015, Spring 2016, Spring 2017, Spring 2019, Spring 2020, Spring 2021, Spring 2022, Spring 2023, Spring 2024. With solutions: Spring 2013, Spring 2014, Spring 2015, Fall 2015, Spring 2016, Spring 2017, Spring 2019, Spring 2020, Spring 2021, Spring 2022, Spring 2023, Spring 2024.
平时成绩加分:新出或测试上述题库质量的题目,deepseek回答错误,截图发到论坛,每个题目平时成绩加5分;翻转课堂讲解moldelarts gallery AI ipynb代码,每次加5分(平时成绩100分加满为止)。
考勤每次缺席扣5分。
期末考试:70%
1.客观题15分:numpy题库3题 华为认证题库 或cs189客观题12题(会改成填空题)https://talent.shixizhi.huawei.com/iexam/1365189427395223554/examInfo?examId=1592050502435512939&sxz-lang=zh_CN
2.传统机器学习25分 模型评估、朴素贝叶斯、SVM、集成学习、PCA、K-Means
3.DNNCNN 20分 (传统机器学习的 梯度下降、逻辑回归、感知机通常合并在此考)
4.RNN 20分
5. Transformer 20分
题库:同平时测验(大题为主)
算法 模型假设 损失函数 优化方法 朴素贝叶斯 特征条件独立(给定类别下特征独立) 对数似然损失(最大似然估计) 极大似然估计(或EM算法处理缺失值) SVM 数据线性可分(或通过核函数映射到高维可分),最大化分类间隔 Hinge Loss + L2正则化项 拉格朗日对偶 + SMO(序列最小优化) 集成学习 - 随机森林:特征子集独立性
- GBDT:残差逐步拟合- 随机森林:基尼系数/信息增益
- GBDT:自定义损失(如平方损失、对数损失)- 随机森林:Bagging
- GBDT:梯度下降(加法模型)PCA 数据在低维线性子空间上方差最大 重构误差最小化(或协方差矩阵特征值最大化) 特征值分解(或SVD) K-Means 数据呈球形分布,簇内紧密 样本到簇心的平方距离和(SSE) EM算法(迭代更新簇心与样本分配) 逻辑回归 数据线性可分,通过sigmoid映射概率 交叉熵损失(对数损失) 梯度下降(或拟牛顿法) 感知机 数据线性可分 误分类点到超平面的距离和(近似Hinge Loss) 随机梯度下降(仅对误分类样本更新权重) DNN 多层非线性变换可拟合复杂函数 任务相关(如交叉熵、均方误差) 反向传播 + 梯度下降变体(如Adam、SGD) CNN 局部相关性、平移不变性(通过卷积核和池化) 任务相关(如交叉熵) 反向传播 + 梯度下降变体(如Adam) RNN 序列数据的时间依赖性(通过循环结构传递状态) 交叉熵(序列预测任务) BPTT(随时间反向传播)+ 梯度截断/Adam Transformer 全局依赖关系通过自注意力机制捕获 交叉熵(带掩码的序列预测任务) Adam优化器 + 学习率预热(如Noam调度) 实验课:代码及报告80% 实验课讲题\答辩10% 可选任务移植ipynb到modelarts AI Gallery 10%(必须LLM或Transformer相关,内容质量必须高于已有AI Gallery,推荐结合 Deepseek API )
-
-
- 1.1 机器学习概念的引出
- 1.2 机器学习的发展历史
- 1.3 机器学习与人工智能
- 1.4 为什么要深度学习?
-
该视频主要讲述了机器学习的定义和基本流程,以及如何从简单的线性分类器演变为深度学习的分类器。视频还介绍了深度学习的定义、特点、来历、应用领域和模型框架。深度学习是机器学习的分支,是实现机器学习的一种重要技术手段,其模型结构一般是含有多个隐藏层的多层神经网络。视频强调了深度学习的基础知识的重要性,包括数据集的拆分、模型的性能评价等内容。
-
-
-
阅读教材1
- 2.1 深度学习的硬件计算环境
- 2.2 深度学习的软件计算环境
- 2.3 数据集
阅读教材2
阅读教材3
- 1.1 机器学习 10
- 1.2 机器学习的分类 11
- 1.3 机器学习方法三要素 16
- 1.4 模型评估与模型选择 20
- 1.5 正则化与交叉验证 23
- 1.6 泛化能力 26
- 1.7 生成模型与判别模型 29
- 1.8 监督学习应用
-
本视频主要讲述了数据集及其拆分、有监督学习、验证集、机器学习算法和特征提取、模型评估等模块的相关内容。此外,还介绍了埃德康是一个开源的p发行版本,包含了多个科学包及其依赖项,以及最简单的训练集和测试集的拆分方法及流除法的不足之处,k折交叉验证相对于流出法的优势,超参数的概念,以及如何通过网格搜索和k折交叉验证来调整超参数,以优化模型性能。
-
阅读教材2
3. 线性神经网络
阅读教材3
2.1 感知机模型 42
2.2 感知机学习策略 43
2.3 感知机学习算法 46 -
阅读教材2
阅读教材3
6.1 逻辑斯谛回归模型 1026.2 最大熵模型 1076.3 模型学习的最优化算法 112 -
阅读教材3
7.1 线性可分支持向量机与硬间隔最大化 1207.2 线性支持向量机与软间隔最大化 1257.3 非线性支持向量机与核函数 1307.4 序列最小最优化算法 135 -
-
-
直接在答题区敲入题目代码,代码要能够完整运行并有正确的输出
【评分说明】成绩已出,单道题目分数在12分及以下的均为运行报错的,原本这些题目都判了0分,但看到成绩太过惨不忍睹所以全部都重新又判了一遍,我已尽力。如对成绩有异议请先将自己的代码复制粘贴运行之后再来找我讨论。
-
-
阅读教材3
4.1 朴素贝叶斯法的学习与分类 694.2 朴素贝叶斯法的参数估计 72 -
阅读教材3
5.1 决策树模型与学习 815.2 特征选择 865.3 决策树的生成 905.4 决策树的剪枝 935.5 CART算法 94补充
bagging&随机森林
-
阅读教材3
8.1 提升方法AdaBoost算法 1448.2 AdaBoost算法的训练误差分析 1488.3 AdaBoost算法的解释 1498.4 提升树 152 -
-
本次ex2实验例程和数据在 “ex2_classification.zip”提供。
实验平台的搭建参考实验1。
目录:
- 实验: 例程和数据
- ex2_report.docx :实验报告
- ex2_slices.pptx: 实验要求
- codelab相关配置流程.pdf
严禁分享、抄袭代码报告,若发现严重影响抄袭双方的课程成绩
4月2日之前,将报告和代码打包,备注学号+姓名,由学委同一收集并发到助教邮箱 752649416@qq.com,或提供百度网盘链接
-
-
本次ex3实验例程在 “ex3_dnn&cnn.zip”提供,数据集采用cifar10,下载方式见压缩包内的notebook。
目录:
1. mindspore_dnn_cifar10.ipynb dnn实验例程
2. mindspore_cnn_cifar10.ipynb cnn实验例程
3. ex3.pptx 实验要求
实验平台的搭建参考实验1
严禁分享、抄袭代码报告,若发现严重影响抄袭双方的课程成绩
4月19日之前,将报告和代码打包,备注学号+姓名,由学委同一收集并发到助教邮箱 gaoyichang2000@qq.com
-
- 9.1 卷积神经网络概述
- 9.2 LeNet-5
- 9.3 AlexNet
- 9.4 VGGNet 卷积神经网络
- 9.5 GoogLeNet 卷积神经网络
-
-
•Human knowledge: Local Attention, Big Bird•Clustering: Reformer•Learnable Pattern: Sinkforn•Representative key: Linformer•k,q first → v,k first: Linear Transformer, Performer•New framework: Synthesizer
-
-
大家把自己名字写到对应分组,尽量避免小组超出最多人数。
-
-
考试时间 预计6月11日上课时间
考试时长 1小时30分钟
大致分值分布:
1.客观题15分:numpy题库3题 华为认证题库12题(会改成填空题)https://talent.shixizhi.huawei.com/iexam/1365189427395223554/examInfo?examId=1592050502435512939&sxz-lang=zh_CN
2.传统机器学习25分 模型评估、朴素贝叶斯、SVM、集成学习、PCA、K-Means
3.DNNCNN 20分
4.RNN 20分
5. Transformer 20分
总计100分,其中考查后3次实验相关题目不少于20分,例如代码补全、搭建经典网络、实验报告中要求的相关操作实现等。