SDSC5002 Course 2-EDA
#sdsc5002 English / 中文 Data Fundamentals What is Data? Data are values obtained by measuring certain variables from individuals (people, objects, etc.). Types of Variables Categorical Variables (Qualitative) Examples: Gender, blood type, disease status If categories can be ordered, they are called ordinal categorical variables (e.g., course grades, COVID-19 severity) Numerical Variables (Quantitative) Examples: Height, weight, age, income, blood pressure Only numerical variables supp...
SDSC5002 课程 2-EDA
#sdsc5002 English / 中文 数据基础 什么是数据? 数据是从个体(人、物体等)中对某些变量进行测量所得到的值。 变量类型 分类变量(定性) 例如:性别、血型、疾病状态 若类别可排序,则称为有序分类变量(例如:课程等级、COVID-19严重程度) 数值变量(定量) 例如:身高、体重、年龄、收入、血压 只有数值变量支持算术运算 数据表结构 列(Columns):对应变量(Variables) 行(Rows):对应个体或观测值(Observations),数量通常记为 nnn Song Artist Genre Size(MB) Length(sec) My Friends D. Williams Alternative 3.83 247 Up the Road E. Clapton Rock 5.62 378 数据收集方法 观察法:直接观察或比较 测试与实验:使用工具(如软尺)测量 调查法: 问卷 访谈 电子邮件/电话 文档分析:如查阅医疗记录 📌 注意:问卷设计顺序可能影响回答...
SDSC6015 课程 1-课程介绍与随机优化初步
#sdsc6015 English / 中文 课程介绍与随机优化初步 主问题 / Main Problem 给定带标签训练数据 (x1,y1),…,(xn,yn)∈Rd×Y(x_1, y_1), \dots, (x_n, y_n) \in \mathbb{R}^d \times \mathcal{Y}(x1,y1),…,(xn,yn)∈Rd×Y, 寻找权重 θ\thetaθ 以最小化: minθf(θ)=1n∑i=1nℓ(θ,(xi,yi)),n 极大\min_{\theta} f(\theta) = \frac{1}{n} \sum_{i=1}^{n} \ell(\theta, (x_i, y_i)), \quad n \text{ 极大} θminf(θ)=n1i=1∑nℓ(θ,(xi,yi)),n 极大 目标:通过损失函数 ℓ\ellℓ 衡量模型预测误差,优化参数 θ\thetaθ。 补充说明 / Supplementary Notes 数学符号解释: θ∈Rm\theta \in \mathbb{R}^mθ∈Rm:待优化参数向量(例如...
SDSC6007 Course 3-Tutorial and HMM
#sdsc6007 English/ Chinese Tutorial 1 Problem Setting Dynamic System: xk+1=xk+uk+wkx_{k+1} = x_k + u_k + w_kxk+1=xk+uk+wk, k=0,1,2,3k = 0,1,2,3k=0,1,2,3 Initial State: x0=5x_0 = 5x0=5 Cost Function: ∑k=03(xk2+uk2)\sum_{k=0}^{3}(x_k^2 + u_k^2)∑k=03(xk2+uk2) State Space: Sk={0,1,2,3,4,5}S_k = \{0,1,2,3,4,5\}Sk={0,1,2,3,4,5} Control Constraints: Uk(xk)={u∣0≤xk+u≤5,u∈Z}U_k(x_k) = \{u \mid 0 \leq x_k + u \leq 5, u \in \mathbb{Z}\}Uk(xk)={u∣0≤xk+u≤5,u∈Z} Stochastic Disturban...
SDSC6007 Course 1-Introduction of Dynamic Programming Algorithm
#sdsc6007 English / 中文 Introduction The Discrete-Time Dynamic System The system has the form xk+1=fk(xk,uk,wk),k=0,1,...,N−1,x_{k + 1} = f_{k} (x_k, u_k, w_k ), k = 0, 1, . . . , N − 1, xk+1=fk(xk,uk,wk),k=0,1,...,N−1, where kkk : index of discrete time NNN : the horizon or number of times control is applied xkx_kxk : the state of the system, from the set of states Sk uku_kuk : the control/decision variable/action to be selected from the set Uk (xk ) at time k wkw_kwk : a ...
SDSC6007 课程 2-最短路径问题
#sdsc6007 English / 中文 简介 最短路径问题 (Shortest Path Problems) 问题定义 给定节点集合 {1,2,…,N,t}\{1,2,\dots,N,t\}{1,2,…,N,t}(ttt 为目标节点), aija_{ij}aij:从节点 iii 到 jjj 的路径成本(aij=∞a_{ij} = \inftyaij=∞ 表示无直接路径) 关键假设:所有环路成本非负(∀循环路径 i→j1→⋯→jk→i, 总成本≥0\forall \text{循环路径 } i \to j_1 \to \cdots \to j_k \to i,\ \text{总成本} \geq 0∀循环路径 i→j1→⋯→jk→i, 总成本≥0) 目标:寻找从任意节点 iii 到 ttt 的最小成本路径 非负环路假设的重要性 核心意义:确保最优解存在且路径长度有限 避免无限负成本: 若存在负成本循环 ∑cycleaij<0⇒总成本可无限降低\text{若存在负成本循环 } \sum_{\text{cycle}} a_{ij} < 0 ...
SDSC6015 课程信息
#sdsc6015 #course information English / 中文 课程概览 课程代码: SDSC6015 课程名称: 机器学习的随机优化 (STOCHASTIC OPTIMIZATION FOR MACHINE LEARNING) 学期: 2025-26 学年 第一学期 (Semester A) 授课教师: 余璐 博士 (Dr. Lu Yu) 邮箱: lu.yu@cityu.edu.hk 办公室: 刘鸣炜学术楼 16-279 室 (LAU 16-279) 授课时间: 周四 19:00 – 21:50 授课地点: 杨建文学术楼 M3017 室 (CMC Building, M3017) 答疑时间: 待公布 (TBA) 助教: 杨心念 (xinniyang2-c@my.cityu.edu.hk) 吴智友 (zhiyouwu2-c@my.cityu.edu.hk) 考核方式 组成部分 权重 详情 作业 30% 共3次作业,每次占10%。允许与最多2位同学讨论,但必须独立完成并写明协作者。逾期提交每日扣10%(最多延迟3天)。 ...
SDSC6012 Course Information
#sdsc6012 #course information English / 中文 Course Overview Course Code: SDSC6012 Course Name: Time Series and Recurrent Neural Networks Academic Year/Semester: 2024/25 Semester A Instructor: Prof. Linlin Wang Email: (To be announced) Office: (To be announced) Lecture Time: (To be announced) Consultation Hours: (To be announced) Teaching Mode: Face-to-face Tutor(s): (To be announced) Abstract In macroeconomics and other areas of business, science, and engineering, a significant amou...
SDSC6012 课程信息
#sdsc6012 #course information English / 中文 课程概览 课程代码: SDSC6012 课程名称: 时间序列与循环神经网络 (Time Series and Recurrent Neural Networks) 学年/学期: 2024/25 第一学期 授课教师: Prof 王琳琳 邮箱: (待公布) 办公室: (待公布) 授课时间: (待公布) 答疑时间: (待公布) 教学模式: 面授 助教: (待公布) 课程简介 在宏观经济学及商业、科学与工程的其他领域,大量数据以时间序列数据集的形式存在。本课程将使学生掌握分析此类数据的统计工具,并使用 R 软件将其应用于解决现实问题。学生将回顾基本的随机过程和时间序列概念,进而扩展至 ARMA 模型、估计方法、预测特性以及用于波动性建模的 GARCH 模型。课程还将介绍用于时间序列预测的循环神经网络。整个课程强调实践,使用 R 进行动手数据分析。 考核方式 组成部分 权重 详情 测验 (Test) 25% 评估对时间序列统计方法和循环神经网络的概念描述。闭卷。 作...
SDSC5003 Course Information
SDSC5003 Course Information #sdsc5003 #course information English / 中文 Course Overview Course Code: SDSC5003 Course Name: Introduction to Database Systems Semester: 2025/26 Academic Year, Semester 1 Instructors: Yu Yang (yuyang@cityu.edu.hk) Terence Chan (terenceChan@cityu.edu.hk) Teaching Model: Face-to-face Office Hours: To be announced (TBA) Teaching Assistant: Not specified Assessment Method Component Weight Details Individual Assignments 30% Multiple assignments focusing on ...
