章节大纲
-
-
-
-
下载作业文件”ps4.pdf“,将答案按题号顺序 写在A4纸里,写上学号姓名。4月16号前,学委收集好交到工二413。
禁止抄袭,若发现将会严重影响课程成绩。
注意:卷积的计算公式中,padding是要乘2的,也就是在图像的左右上下加padding
-
抱歉各位同学,由于我的疏忽,第三次作业3,4两道题有些问题,现在将修改后的作业上传,同学们下载下来做就好
还是按顺序写在A4纸上,学委收好之后周五前交到工二413
禁止抄袭,否则取消成绩
-
-
补充评分说明:对于截图中字太小以至于用27寸大屏都要贴上去才能勉强看见的作业,都扣5分卷面分以告慰我发胀的眼睛和想yue的大脑。
下载作业文件后命名为“学号_姓名_ps1”,(建议用Jupyter Notebook)完成代码并运行。将代码及运行结果全部截图后按题号顺序放在一个word或pdf文档里提交,首张截图需包含带有学号姓名的文件名。禁止抄袭和直接复制粘贴。
-
平时成绩:30%,6 次平时测验(选择题为主,实验课时先测验再做实验)、考勤
6 次测试内容
test1 01020304讲 test2 0506 讲 test3 0708 讲 test4 091011121317讲 test5 141516 讲 test6 18192021 讲 Previous midterms are available: Without solutions: Spring 2013, Spring 2014, Spring 2015, Fall 2015, Spring 2016, Spring 2017, Spring 2019, Summer 2019, Spring 2020 Midterm A, Spring 2020 Midterm B, Spring 2021, Spring 2022, Spring 2023, Spring 2024. With solutions: Spring 2013, Spring 2014, Spring 2015, Fall 2015, Spring 2016, Spring 2017, Spring 2019, Summer 2019, Spring 2020 Midterm A, Spring 2020 Midterm B, Spring 2021, Spring 2022, Spring 2023, Spring 2024.
Previous final exams are available. Without solutions: Spring 2013, Spring 2014, Spring 2015, Fall 2015, Spring 2016, Spring 2017, Spring 2019, Spring 2020, Spring 2021, Spring 2022, Spring 2023, Spring 2024. With solutions: Spring 2013, Spring 2014, Spring 2015, Fall 2015, Spring 2016, Spring 2017, Spring 2019, Spring 2020, Spring 2021, Spring 2022, Spring 2023, Spring 2024.
平时成绩加分:新出或测试上述题库质量的题目,deepseek回答错误,截图发到论坛,每个题目平时成绩加5分;翻转课堂讲解moldelarts gallery AI ipynb代码,每次加5分(平时成绩100分加满为止)。
考勤每次缺席扣1分。
期末考试:70%
1.传统机器学习24分 模型评估、朴素贝叶斯、SVM、集成学习、PCA、K-Means
2.DNNCNN 24分 (传统机器学习的 梯度下降、逻辑回归、感知机通常合并在此考)
3.RNN 16分
4. Transformer 16分
5. 实验程序填空题 20分 考实验课中的 2 次实验程序,每次10 空,每空一分。
题库:同平时测验(大题为主)
算法 模型假设 损失函数 优化方法 朴素贝叶斯 特征条件独立(给定类别下特征独立) 对数似然损失(最大似然估计) 极大似然估计(或EM算法处理缺失值) SVM 数据线性可分(或通过核函数映射到高维可分),最大化分类间隔 Hinge Loss + L2正则化项 拉格朗日对偶 + SMO(序列最小优化) 集成学习 - 随机森林:特征子集独立性
- GBDT:残差逐步拟合- 随机森林:基尼系数/信息增益
- GBDT:自定义损失(如平方损失、对数损失)- 随机森林:Bagging
- GBDT:梯度下降(加法模型)PCA 数据在低维线性子空间上方差最大 重构误差最小化(或协方差矩阵特征值最大化) 特征值分解(或SVD) K-Means 数据呈球形分布,簇内紧密 样本到簇心的平方距离和(SSE) EM算法(迭代更新簇心与样本分配) 逻辑回归 数据线性可分,通过sigmoid映射概率 交叉熵损失(对数损失) 梯度下降(或拟牛顿法) 线性回归 数据成线性分布 平方误差 最小二乘/随机梯度下降 DNN 多层非线性变换可拟合复杂函数 任务相关(如交叉熵、均方误差) 反向传播 + 梯度下降变体(如Adam、SGD) CNN 局部相关性、平移不变性(通过卷积核和池化) 任务相关(如交叉熵) 反向传播 + 梯度下降变体(如Adam) RNN 序列数据的时间依赖性(通过循环结构传递状态) 交叉熵(序列预测任务) BPTT(随时间反向传播)+ 梯度截断/Adam Transformer 全局依赖关系通过自注意力机制捕获 交叉熵(带掩码的序列预测任务) Adam优化器 + 学习率预热(如Noam调度) 实验课:代码及报告80% 实验课讲题\答辩10% 可选任务移植ipynb到modelarts AI Gallery 10%(必须LLM或Transformer相关,内容质量必须高于已有AI Gallery,推荐结合 Deepseek API )
-
-
- 1.1 机器学习概念的引出
- 1.2 机器学习的发展历史
- 1.3 机器学习与人工智能
- 1.4 为什么要深度学习?
-
该视频主要讲述了机器学习的定义和基本流程,以及如何从简单的线性分类器演变为深度学习的分类器。视频还介绍了深度学习的定义、特点、来历、应用领域和模型框架。深度学习是机器学习的分支,是实现机器学习的一种重要技术手段,其模型结构一般是含有多个隐藏层的多层神经网络。视频强调了深度学习的基础知识的重要性,包括数据集的拆分、模型的性能评价等内容。
-
12 星(没有提示)考填空(去年都是从头写降低了难度),63 题中抽 40 题,每题 2分;三星题 34 题(没有提示)中抽 5 题考填空,每题 4分。三星题 34 题(没有提示)中抽 1 题考从头写的编程 10 分。总分 110 分,超过 100 分的按 100 分计。考试时间 90 分钟。
-
-
-
阅读教材1
- 2.1 深度学习的硬件计算环境
- 2.2 深度学习的软件计算环境
- 2.3 数据集
阅读教材2
阅读教材3
- 1.1 机器学习 10
- 1.2 机器学习的分类 11
- 1.3 机器学习方法三要素 16
- 1.4 模型评估与模型选择 20
- 1.5 正则化与交叉验证 23
- 1.6 泛化能力 26
- 1.7 生成模型与判别模型 29
- 1.8 监督学习应用
-
本视频主要讲述了数据集及其拆分、有监督学习、验证集、机器学习算法和特征提取、模型评估等模块的相关内容。此外,还介绍了埃德康是一个开源的p发行版本,包含了多个科学包及其依赖项,以及最简单的训练集和测试集的拆分方法及流除法的不足之处,k折交叉验证相对于流出法的优势,超参数的概念,以及如何通过网格搜索和k折交叉验证来调整超参数,以优化模型性能。
-
阅读教材2
3. 线性神经网络
阅读教材3
2.1 感知机模型 42
2.2 感知机学习策略 43
-
阅读教材2
阅读教材3
6.1 逻辑斯谛回归模型 1026.2 最大熵模型 1076.3 模型学习的最优化算法 112 -
阅读教材3
4.1 朴素贝叶斯法的学习与分类 694.2 朴素贝叶斯法的参数估计 72 -
阅读教材3
7.1 线性可分支持向量机与硬间隔最大化 1207.2 线性支持向量机与软间隔最大化 1257.3 非线性支持向量机与核函数 1307.4 序列最小最优化算法 135 -
阅读教材3
5.1 决策树模型与学习 815.2 特征选择 865.3 决策树的生成 905.4 决策树的剪枝 935.5 CART算法 94补充
bagging&随机森林
-
阅读教材3
8.1 提升方法AdaBoost算法 1448.2 AdaBoost算法的训练误差分析 1488.3 AdaBoost算法的解释 1498.4 提升树 152 -
阅读教材2
-
-
-
- 点击https://www.huaweicloud.com/product/modelarts.html 并登录
- 登录后,在页面中央大字 AI开发平台ModelArts,点击 控制台。
- 在控制台页面右侧点击 返回旧版
4.最后在旧版页面点击 codelab beta Free,“当前使用免费实例规格用于体验,72小时内没有使用,会释放资源,请注意文件备份。”
5. 通过点击剩余时间更新,可以在快要断开时将时间延长到 1 小时,因此这种免费模式,适合使用者一直在电脑前的简单任务。
6. 通过点击切换规格可以使用免费的 CPU 或 GPU 实例。
===================================================
7. 更新 python 3.9 和 mindspore 2.2.14 kernel(可选 如果是比较新的 代码运行需要这部)
在 ipynb 添加如下代码块
%%capture captured_output
!/home/ma-user/anaconda3/bin/conda create -n python-3.9.0 python=3.9.0 -y --override-channels --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
!/home/ma-user/anaconda3/envs/python-3.9.0/bin/pip install ipykernelimport json
import osdata = {
"display_name": "python-3.9.0",
"env": {
"PATH": "/home/ma-user/anaconda3/envs/python-3.9.0/bin:/home/ma-user/anaconda3/envs/python-3.7.10/bin:/modelarts/authoring/notebook-conda/bin:/opt/conda/bin:/usr/local/nvidia/bin:/usr/local/cuda/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/home/ma-user/modelarts/ma-cli/bin:/home/ma-user/modelarts/ma-cli/bin"
},
"language": "python",
"argv": [
"/home/ma-user/anaconda3/envs/python-3.9.0/bin/python",
"-m",
"ipykernel",
"-f",
"{connection_file}"
]
}if not os.path.exists("/home/ma-user/anaconda3/share/jupyter/kernels/python-3.9.0/"):
os.mkdir("/home/ma-user/anaconda3/share/jupyter/kernels/python-3.9.0/")with open('/home/ma-user/anaconda3/share/jupyter/kernels/python-3.9.0/kernel.json', 'w') as f:
json.dump(data, f, indent=4)注:以上代码运行完成后,需要重新设置kernel为python-3.9.0
8.安装MindSpore框架2.2.14
%%capture captured_output
!pip install https://ms-release.obs.cn-north-4.myhuaweicloud.com/2.2.14/MindSpore/unified/x86_64/mindspore-2.2.14-cp39-cp39-linux_x86_64.whl --trusted-host ms-release.obs.cn-north-4.myhuaweicloud.com -i https://pypi.tuna.tsinghua.edu.cn/simple
-
-
-
https://gitee.com/gdutcv/mlex02
实验课内完成 所有且通过老师/助教审查问答(每人一次代码重写机会,审查问答改进代码和报告任意次),删除任意 5 行左右代码,60 秒内可以重写,满分 100 分。120 秒内重写,95 分。超过 120 秒,按未能重写计算,88 分。课后 完成所有 85 分。未完成所有项目按比例扣分。
-
- 确保有权限:向老师确认自己已被添加到私有库的成员列表中,拥有访问权限。加入列表网址:见 qq 群 4 月 6 日 17 点55群消息
- 在老师给的该次实验网址点击 fork
3. 然后在自己 fork 后仓库获取 clone git 地址 并新建 312200xxxx 分支 (学号)
后续继续在 modelarts codelab 操作
- 点击 codelab 页面左侧Clone
2. 将该次实验室 git 网址录入对话框 并勾选下载仓库
3. 输入用户名(注册用的电话号码)密码
4. 按要求补全 ipynb 文件、撰写实验报告,过程可能持续数小时,期间记得每小时更新 codelab 剩余时间和
commit 主要工作并将更改 push 到你 fork 的远程仓库(记得选对学号分支)。下图 1track 所有更改 图 2commit 所有更改 图 3push 所有更改
5.
提交 Pull Request
下图红色箭头处写清楚 学号姓名
-
-
https://gitee.com/gdutcv/mlex03
实验课内完成 所有且通过老师/助教审查问答(每人一次代码重写机会,审查问答改进代码和报告任意次),删除任意 5 行左右代码,60 秒内可以重写,满分 100 分。120 秒内重写,95 分。超过 120 秒,按未能重写计算,88 分。课后 完成所有 85 分。未完成所有项目按比例扣分。
-
- 点击https://www.huaweicloud.com/product/modelarts.html 并登录
- 登录后,在页面中央大字 AI开发平台ModelArts,点击 控制台。
- 检查费用-》代金券余额,确保够做完实验,不要产生欠费。
- 余额无问题后开始创建 付费计算资源notebook
- 创建 付费notebook 详细说明及其他高级功能见官方手册https://support.huaweicloud.com/usermanual-standard-modelarts/devtool-modelarts_0004.html
- 推荐自动停止设为 3-8小时,实例选择7 元/每小时(不要选贵的钱不够!)的。
注意!!!!除了计算资源,云硬盘 EVS 也是收费的,做完实验所有数据上传 gitee 或本地硬盘后记得删除避免扣费!
-
from download import download
url = "https://mindspore-website.obs.cn-north-4.myhuaweicloud.com/notebook/datasets/cifar-10-binary.tar.gz"
download(url, "./datasets-cifar10-bin", kind="tar.gz", replace=True)
-
-
- 检查费用-》代金券余额,确保够做完实验,不要产生欠费,每次开始实验前要根据金额估算最迟停机时间!!!!!!!!!!!!!!!!!!
- 余额无问题后开始创建 付费计算资源notebook
1.notebook 创建时镜像选和实验 3 一样 7.6 每小时的
2. 建议你理解题目要求 编写的差不多后 再开实例。周四实验课充 70 元。周六早上充 60元。相当于各 8小时,总计 16 小时。请节约合理安排时间。
3. 先运行 installms221.ipynb然后切换 kernel 再开始实验 模板要求 mindspore2.2.1
https://gitee.com/gdutcv/mlex04
================以下是课程外的信息,供学有余力的同学参考=======================
4. 欢迎独立完成本次实验的同学 选物体检测为2026毕业设计题目;其他机器学习相关题目也可以联系
a)高空作业及安全带佩戴检测算法设计与实现https://aistudio.baidu.com/projectdetail/2385958
b)基于 gradio 的球类体育运动球检测系统设计与实现https://github.com/nttcom/WASB-SBDT
5. 欢迎大数据绩点排名前 6 的同学选择建筑物立面附件检测方向投稿 PRCV2025 (普通 sci 受审稿周期限制是否保研前能接受存在不确定性;其他选择 1.ccf-c 类会议,6 月上旬投稿, 有连续奋战 1 个月的打算;2.愿意承担 SCI OA 费用的也可以投稿 SCI)争取保研加分成绩,并继续以此为题毕设。
c)建筑物立面附件检测算法设计与实现 https://github.com/CVEO/BFA-YOLO -
https://gitee.com/gdutcv/mlex05
- 检查费用-》代金券余额,确保够做完实验,不要产生欠费,每次开始实验前要根据金额估算最迟停机时间!!!!!!!!!!!!!!!!!!
- 余额无问题后开始创建 付费计算资源notebook
1.notebook 创建时镜像选和实验 3 一样 7.6 每小时的
2. 建议你理解题目要求 编写的差不多后 再开实例。周四实验课充 70 元。周六早上充 60元。相当于各 8小时,总计 16 小时。请节约合理安排时间。
3. 先运行 installms211.ipynb然后切换 kernel 再开始实验 模板要求 mindspore2.1.1
-
•Human knowledge: Local Attention, Big Bird•Clustering: Reformer•Learnable Pattern: Sinkforn•Representative key: Linformer•k,q first → v,k first: Linear Transformer, Performer•New framework: Synthesizer
-
-
- PCA、K-means
- LLE
- T-SNE
- CNN explainer
- ZFnet
-
考试时间 预计6月11日上课时间
考试时长 1小时30分钟
大致分值分布:
1.客观题15分:numpy题库3题 华为认证题库12题(会改成填空题)https://talent.shixizhi.huawei.com/iexam/1365189427395223554/examInfo?examId=1592050502435512939&sxz-lang=zh_CN
2.传统机器学习25分 模型评估、朴素贝叶斯、SVM、集成学习、PCA、K-Means
3.DNNCNN 20分
4.RNN 20分
5. Transformer 20分
总计100分,其中考查后3次实验相关题目不少于20分,例如代码补全、搭建经典网络、实验报告中要求的相关操作实现等。