SDSC6015 Course Information
#sdsc6015 #course information English / 中文 Course Overview Course Code: SDSC6015 Course Name: Stochastic Optimization for Machine Learning Semester: 2025-26, Semester A Instructor: Dr. Lu Yu Email: lu.yu@cityu.edu.hk Office: LAU 16-279 Lecture Time: Thursday 19:00 – 21:50 Lecture Location: CMC Building, M3017 Office Hours: To Be Announced (TBA) Teaching Assistants: Xinnian Yang (xinniyang2-c@my.cityu.edu.hk) Zhiyou Wu (zhiyouwu2-c@my.cityu.edu.hk) Assessment Scheme Component We...
作业清单
#作业清单 5001 暂无 5002 HW-1 (03/10/2025 23:30) Project Proposal (29/10/2025 23:30) 5003 Assignment 1 (03/10/2025 24:00) 注意:大学关于学术不端和抄袭(作弊)的政策在本课程中将受到高度重视。所有提交内容必须是您自己的写作或代码。您不得让其他学生复制您的作品。讨论作业是可以的,例如理解相关概念。本作业为个人作业。请将您的作品打包为一个名为 A1-XXXX-YYYY.zip 的压缩文件上传,其中 XXXX 是您的姓名,YYYY 是您的学号。请确保压缩文件中包含所有文件。 第一部分:ER建模(50分) 提交由绘图程序绘制的图表(可使用任何您喜欢的程序,例如来自 实体关系模型工具 的 ER 绘图工具),不接受手绘图。如果您对某些设计选择不确定,可以添加解释说明。将您的图表和可选解释上传到一个名为 pdf 的 PDF 文件中。 绘制一个单一的 ER 图来表示以下规格说明: 一家银行企业需要存储客户(由 cid 标识,属性包括 cname)和账户(由 ai...
SDSC6015 Course 3-Faster Gradient Descent and Subgradient Descent
#sdsc6015 English / 中文 Review Click to expand Convex Optimization Problems The general form of a convex optimization problem is: minx∈Rdf(x)\min_{x \in \mathbb{R}^d} f(x) x∈Rdminf(x) where fff is a convex function, Rd\mathbb{R}^dRd is a convex set, and x∗x^*x∗ is its minimizer: x∗=argminx∈Rdf(x)x^* = \arg\min_{x \in \mathbb{R}^d} f(x) x∗=argx∈Rdminf(x) The update rule for Gradient Descent (GD) is: xk+1=xk−ηk+1∇f(xk)x_{k+1} = x_k - \eta_{k+1} \nabla f(x_k) xk+1=xk−ηk+1∇f(xk) xkx_kx...
SDSC6012 课程 3-理论与实现
#sdsc6012 English / 中文 时间序列基础理论 时间序列定义与性质 时间序列是按时间顺序排列的随机变量序列,记为 {Xt:t∈T}\{X_t: t \in T\}{Xt:t∈T},其中 TTT 为时间索引集。在实际应用中,TTT 通常为离散集合(如 T={0,1,2,…}T = \{0, 1, 2, \ldots\}T={0,1,2,…})。 核心概念:时间序列分析旨在揭示序列内部的动态依赖关系,并基于历史数据建立预测模型。 示例数据表 1234567891011121314import pandas as pddata = { 'Date': ['2023-01-01', '2023-01-02', '2023-01-03', '2023-01-04', '2023-01-05', '2023-01-06', '2023-01-07', '2023...
SDSC6015 课程 2-梯度下降与次梯度下降方法
#sdsc6015 English / 中文 回顾 - 凸函数与凸优化 点击展开 凸函数定义 回顾 函数 f:Rd→Rf: \mathbb{R}^d \to \mathbb{R}f:Rd→R 是凸函数当且仅当: 定义域 dom(f)\text{dom}(f)dom(f) 是凸集; 对所有 x,y∈dom(f)\mathbf{x}, \mathbf{y} \in \text{dom}(f)x,y∈dom(f) 和 λ∈[0,1]\lambda \in [0,1]λ∈[0,1],满足: f(λx+(1−λ)y)≤λf(x)+(1−λ)f(y)f(\lambda \mathbf{x} + (1-\lambda)\mathbf{y}) \leq \lambda f(\mathbf{x}) + (1-\lambda)f(\mathbf{y}) f(λx+(1−λ)y)≤λf(x)+(1−λ)f(y) 几何意义:函数图像上任意两点间的线段位于图像上方。 一阶凸性判定 回顾 若 fff 可微,则凸性等价于: f(y)≥f(x)+∇f(x)⊤(y−x),∀x...
SDSC6015 Course 2-Gradient Descent Method and Subgradient Method
#sdsc6015 English / Chinese Review - Convex Functions and Convex Optimization Review Definition of Convex Functions Review A function f:Rd→Rf: \mathbb{R}^d \to \mathbb{R}f:Rd→R is convex if and only if: Its domain dom(f)\text{dom}(f)dom(f) is a convex set; For all x,y∈dom(f)\mathbf{x}, \mathbf{y} \in \text{dom}(f)x,y∈dom(f) and λ∈[0,1]\lambda \in [0,1]λ∈[0,1], it satisfies: f(λx+(1−λ)y)≤λf(x)+(1−λ)f(y)f(\lambda \mathbf{x} + (1-\lambda)\mathbf{y}) \leq \lambda f(\mathbf{x}) + (1-\lam...
总课表
.timetable-container * { box-sizing: border-box; margin: 0; padding: 0; } .timetable-container { font-family: 'Segoe UI', Tahoma, Geneva, Verdana, sans-serif; line-height: 1.6; color: #333; max-width: 100%; overflow-x: auto; } .timetable-controls { display: flex; justify-content: center; margin-bottom: 20px; ...
SDSC5001 Course 3-Overview of Statistical Machine Learning
#sdsc5001 English / 中文 Comparison of Terminology Between Statistics and Machine Learning Statistics Machine Learning Classification/RegressionClusteringClassification/Regression with missing responses(Nonlinear) Dimensionality Reduction Supervised LearningUnsupervised LearningSemi-supervised LearningManifold Learning Covariates/Response VariablesSample/PopulationStatistical ModelMisclassification/Prediction Error Features/OutcomeTraining Set/Test SetLearnerGeneralization Error Mul...
SDSC5001 课程 3-统计机器学习概述
#sdsc5001 English / 中文 统计学与机器学习的术语对比 统计学 机器学习 分类/回归聚类含缺失响应的分类/回归(非线性)降维 监督学习无监督学习半监督学习流形学习 协变量/响应变量样本/总体统计模型误分类/预测误差 特征/结果训练集/测试集学习器泛化误差 多类逻辑函数截断线性函数 Softmax函数ReLU(线性整流单元) 关键说明:两个领域使用不同术语描述相似概念,但核心思想相通。例如统计学的"协变量"对应机器学习的"特征"。 实际应用案例 工资预测案例 任务:理解员工工资与多个因素之间的关联关系 数据来源:基于美国大西洋地区男性员工收集的数据集 垃圾邮件检测案例 任务:构建能够自动检测垃圾邮件的过滤器 数据表示: 观测值 make% address% … 总大写字母数 是否为垃圾邮件 1 0 0.64 … 278 1(是) 2 0.21 0.28 … 1028 1(是) 3 0 0 … 7 0(否) … … … … … … 4600 0.3 0 … 7...
SDSC5001 Course 2-Exploring Data
#sdsc5001 English / 中文 Data Definition Data is a collection of data objects and their attributes. Data objects are also called records, points, samples, entities, or instances. Attributes are properties or characteristics of objects, such as age, height, weight, education level, etc. Attributes are also called variables, fields, features. For example, a dataset about people might include attributes like ‘age’, ‘height’, etc. Data Types 1. Continuous Variable e.g., length, time, c...
