名称 描述
网页地址 用于大家评估是否采用华为云mindspore的实验要求说明
网页地址 华为云、作业、实验成绩查询
资源库文件 加分ex6实验指导:基于Mindspore-Ascend的llama7b模型推理与微调实验
参考教材&答疑方式时间 图书 教材1《深度学习基础》刘远超 (暂无电子版,本书虽然涵盖教材2和3的大部份内容,但是不够详细,建议以23为主学习)

《深度学习基础》刘远超 (暂无电子版) 《机器学习》周志华 《动手深度学习》李沐https://zh.d2l.ai/

资源库文件 教材2《动手深度学习》李沐https://zh.d2l.ai/ https://openi.pcl.ac.cn/mindspore-courses/d2l-mindspore

《深度学习基础》刘远超 (暂无电子版) 《机器学习》周志华 《动手深度学习》李沐https://zh.d2l.ai/

网页地址 《动手学深度学习》的MindSpore实现
资源库文件 教材3 李航《统计学习方法(第2版)》
网页地址 PythonDataScienceHandbook

PythonDataScienceHandbook 涵盖numpy matplotlib sklearn等实验需要掌握的内容

资源库文件 PythonDataScienceHandbook
网页地址 mindspore官方教程
资源库文件 赵鑫等《大语言模型》
第1讲 机器学习概述 资源库文件 课前线上资源:1.1机器学习的引出

该视频主要讲述了机器学习的定义和基本流程,以及如何从简单的线性分类器演变为深度学习的分类器。视频还介绍了深度学习的定义、特点、来历、应用领域和模型框架。深度学习是机器学习的分支,是实现机器学习的一种重要技术手段,其模型结构一般是含有多个隐藏层的多层神经网络。视频强调了深度学习的基础知识的重要性,包括数据集的拆分、模型的性能评价等内容。

网页地址 实验1Numpy考试题库

 

12 星(没有提示)考填空(去年都是从头写降低了难度),63 题中抽 40 题,每题 2分;三星题 34 题(没有提示)中抽 5 题考填空,每题 4分。三星题 34 题(没有提示)中抽 1 题考从头写的编程 10 分。总分 110 分,超过 100 分的按 100 分计。考试时间 90 分钟。

文件夹 本讲ppt
第2讲 机器学习的预备知识 文件 sklearn画PR曲线代码
资源库文件 翻转课堂:sklearn画PR曲线(黄子睿)


文件 sklearn文档向量化
资源库文件 翻转课堂:sklearn文档向量化(邓媚)
文件 sklearn量纲缩放
资源库文件 翻转课堂:sklearn量纲缩放(蔡诗彬)
资源库文件 nndl神经网络与深度学习,398页附录,复习相关数学知识
资源库文件 课前完成线上内容观看:数据集及其拆分

本视频主要讲述了数据集及其拆分、有监督学习、验证集、机器学习算法和特征提取、模型评估等模块的相关内容。此外,还介绍了埃德康是一个开源的p发行版本,包含了多个科学包及其依赖项,以及最简单的训练集和测试集的拆分方法及流除法的不足之处,k折交叉验证相对于流出法的优势,超参数的概念,以及如何通过网格搜索和k折交叉验证来调整超参数,以优化模型性能。

资源库文件 04课件
文件夹 课件
第3讲 线性回归 文件 课件 线性回归
第4讲 softmax 回归和 logist 回归 资源库文件 回归问题
文件 二次回归与线性回归的比较代码
资源库文件 复习:课中线上资源 二次回归与线性回归的比较.
网页地址 档首页> AI开发平台ModelArts> 开发环境> CodeLab

前4周实验平台华为云codelab说明文档

第5讲 贝叶斯分类器 资源库文件 贝叶斯课件
第6讲 SVM 资源库文件 SVM课件
第7讲 集成学习1 资源库文件 课前资源 信息熵
资源库文件 决策树课件
第8讲 集成学习2 资源库文件 翻转课堂 信息熵代码演示(庄晴慧)
文件 信息熵代码
资源库文件 集成学习课件
第9讲 多层感知机 1 文件 09 多层感知机 1
第10讲 多层感知机 2 资源库文件 课中线上资源 批次标准化BN
资源库文件 课中资源 激活函数 dropout
文件夹 10 多层感知机 2
实验1 numpy 考试 及 熟悉 华为免费算力codelab 使用 网页地址 档首页> AI开发平台ModelArts> 开发环境> CodeLab

前4周实验平台华为云codelab说明文档

网页地址 华为云modelarts 的免费算力 codelab 使用方式(更新安装 mindspore 方法)
  1. 点击https://www.huaweicloud.com/product/modelarts.html 并登录
  2. 登录后,在页面中央大字 AI开发平台ModelArts,点击 控制台。
  3. 在控制台页面右侧点击 返回旧版

  4.最后在旧版页面点击 codelab beta Free,“当前使用免费实例规格用于体验,72小时内没有使用,会释放资源,请注意文件备份。”

  5. 通过点击剩余时间更新,可以在快要断开时将时间延长到 1 小时,因此这种免费模式,适合使用者一直在电脑前的简单任务。

  6. 通过点击切换规格可以使用免费的 CPU 或 GPU 实例。

===================================================

7. 更新 python 3.9 和 mindspore 2.2.14 kernel(可选 如果是比较新的 代码运行需要这部)

在 ipynb 添加如下代码块

%%capture captured_output
!/home/ma-user/anaconda3/bin/conda create -n python-3.9.0 python=3.9.0 -y --override-channels --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
!/home/ma-user/anaconda3/envs/python-3.9.0/bin/pip install ipykernel

import json
import os

data = {
   "display_name": "python-3.9.0",
   "env": {
      "PATH": "/home/ma-user/anaconda3/envs/python-3.9.0/bin:/home/ma-user/anaconda3/envs/python-3.7.10/bin:/modelarts/authoring/notebook-conda/bin:/opt/conda/bin:/usr/local/nvidia/bin:/usr/local/cuda/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/home/ma-user/modelarts/ma-cli/bin:/home/ma-user/modelarts/ma-cli/bin"
   },
   "language": "python",
   "argv": [
      "/home/ma-user/anaconda3/envs/python-3.9.0/bin/python",
      "-m",
      "ipykernel",
      "-f",
      "{connection_file}"
   ]
}

if not os.path.exists("/home/ma-user/anaconda3/share/jupyter/kernels/python-3.9.0/"):
    os.mkdir("/home/ma-user/anaconda3/share/jupyter/kernels/python-3.9.0/")

with open('/home/ma-user/anaconda3/share/jupyter/kernels/python-3.9.0/kernel.json', 'w') as f:
    json.dump(data, f, indent=4)

网页地址 modelarts帮助文档
第11讲 深度学习计算 资源库文件 课前线上资源 感知机
资源库文件 课中资源 正向反向传播代码示例
网页地址 翻转课堂 mindspore自动微分代码演示

https://www.mindspore.cn/tutorials/zh-CN/r1.10/beginner/autograd.html

网页地址 mindspore自动微分 代码
网页地址 mindspore 训练DNN分类网络代码示例
资源库文件 11 课件 DNN BP
文件 一些 AI/ML 学习中重要却被忽视的问题
第12讲 卷积神经网络 网页地址 mindspore lenet代码
资源库文件 课前资源 卷积与卷积神经网络
资源库文件 课件12-1 卷积和池化
资源库文件 课件12-2 LeNet AlexNet VGG NiN
第13讲 卷积神经网络 2 资源库文件 课件13-1 Inception ResNet
第 14-1讲 循环神经网络 1 文件 RNN Seq2Seq 示例代码
第14-2讲 循环神经网络 2 网页地址 翻转课堂 RNN实现情感分类(李谕锋)
资源库文件 课前资源 循环神经网络
资源库文件 课件14 RNN
实验2 逻辑回归+xgboost(test02) 网页地址 版本控制(Git)
网页地址 实验 2 gitee 地址 按下方说明 fork

https://gitee.com/gdutcv/mlex02

实验课内完成 所有且通过老师/助教审查问答(每人一次代码重写机会,审查问答改进代码和报告任意次),删除任意 5 行左右代码,60 秒内可以重写,满分 100 分。120 秒内重写,95 分。超过 120 秒,按未能重写计算,88 分。课后 完成所有 85 分。未完成所有项目按比例扣分。

网页 使用 codelab 从 gitee 获取ex 完成 ex 后 提交PR

  1. 确保有权限:向老师确认自己已被添加到私有库的成员列表中,拥有访问权限。加入列表网址:见 qq 群 4 月 6 日 17 点55群消息
  2. 在老师给的该次实验网址点击 fork

     3. 然后在自己 fork 后仓库获取 clone git 地址 并新建 312200xxxx 分支 (学号)

后续继续在 modelarts codelab 操作

  1. 点击 codelab 页面左侧Clone

2. 将该次实验室 git 网址录入对话框 并勾选下载仓库

3. 输入用户名(注册用的电话号码)密码

4. 按要求补全 ipynb 文件、撰写实验报告,过程可能持续数小时,期间记得每小时更新 codelab 剩余时间和

commit 主要工作并将更改 push 到你 fork 的远程仓库(记得选对学号分支)。下图 1track 所有更改 图 2commit 所有更改 图 3push 所有更改

5. 

提交 Pull Request

下图红色箭头处写清楚 学号姓名

第16讲 现代循环神经网络 2 资源库文件 课前线上资源 词嵌入
资源库文件 课件16-1 现代循环神经网络
资源库文件 课件16-2 编码器解码器架构
资源库文件 课件 16-3 词嵌入
网页地址 图解词嵌入king - man + woman is queen; but why?
实验3 CNN(test03) 网页地址 实验 3 gitee 地址 按实验 2说明 fork

https://gitee.com/gdutcv/mlex03

实验课内完成 所有且通过老师/助教审查问答(每人一次代码重写机会,审查问答改进代码和报告任意次),删除任意 5 行左右代码,60 秒内可以重写,满分 100 分。120 秒内重写,95 分。超过 120 秒,按未能重写计算,88 分。课后 完成所有 85 分。未完成所有项目按比例扣分。

网页 使用 modelarts 付费GPU 资源 notebook
  1. 点击https://www.huaweicloud.com/product/modelarts.html 并登录
  2. 登录后,在页面中央大字 AI开发平台ModelArts,点击 控制台。
  3. 检查费用-》代金券余额,确保够做完实验,不要产生欠费。
  4. 余额无问题后开始创建 付费计算资源notebook
  5. 创建 付费notebook 详细说明及其他高级功能见官方手册https://support.huaweicloud.com/usermanual-standard-modelarts/devtool-modelarts_0004.html
  6. 推荐自动停止设为 3-8小时,实例选择7 元/每小时(不要选贵的钱不够!)的。

注意!!!!除了计算资源,云硬盘 EVS 也是收费的,做完实验所有数据上传 gitee 或本地硬盘后记得删除避免扣费!

网页 准研究生 无模板下载 cifar10

from download import download

url = "https://mindspore-website.obs.cn-north-4.myhuaweicloud.com/notebook/datasets/cifar-10-binary.tar.gz"

download(url, "./datasets-cifar10-bin", kind="tar.gz", replace=True)

网页地址 参考资料 mindspore图像数据加载与增强
网页地址 参考资料 sklearn TSNE用法
第17讲 计算机视觉 资源库文件 17 目标检测
第18讲 注意力机制 资源库文件 课件17-1 注意力机制概述
资源库文件 课件17-2 自注意力
网页地址 图解神经机器翻译模型(带有注意力机制的 Seq2seq 模型)
网页地址 使用注意力机制的seq2seq【动手学深度学习v2】
第19讲 Transformer 资源库文件 课件18-1 Transformer概述
资源库文件 课件18-2 Transformer
网页地址 图解Transformer
第20讲 ViT 及注意力机制改进 网页地址 反转课堂mindspore Vision Transformer图像分类 代码示例(丘锐))
资源库文件 课件19-1 vision transformer
资源库文件 课件19 注意力机制改进
实验 6 Seq2Seq(test06) 文件 代码文件
文件 实验要求
第 22讲 自然语言处理:预训练2 网页地址 使用BERT网络实现智能写诗
网页地址 图解GPT2
资源库文件 课件20 预训练模型
文件 绿联翻页笔程序

绿联翻页笔程序

第23讲 无监督学习:降维,深度学习可视化 网页地址 课前线上资源:降维方法小结和理解:PCA、LDA、MDS、ISOMAP、SNE、T-SNE、AutoEncoder
资源库文件 课中资源 CNN explainer
资源库文件 课中资源 卷积可视化ZFnet
资源库文件 15-1 课件PCA Kmeans
资源库文件 15-2课件 LLE T-SNE
第23讲 LLM 基础 网页地址 昇思MindSpore技术公开课大模型专题第二期
网页地址 mindspore ChatGLM2 微调示例
网页地址 本学期维护同学 chatglm notebook
资源库文件 大模型基础
网页 The Illustrated GPT-2 (Visualizing Transformer Language Models)