我是一名应用统计专业的本科生,主要关注机器学习、自然语言处理与人工智能相关方向。统计学的学习使我对数据分析、模型构建与不确定性问题形成了持续兴趣,也促使我逐步将关注点延伸到数据驱动方法与智能模型的训练机制之中。
目前,我的学习重点主要集中在机器学习基础、大语言模型训练与微调,以及数据驱动方法在实际问题中的应用上。除自然语言处理相关内容外,我也接触过物理信息神经网络(PINN)方向的研究,对神经网络方法在复杂系统建模与科学计算中的应用保持关注。
在学习过程中,我更重视理论理解与技术实践之间的结合。一方面持续补充概率统计、优化方法与模型基础等相关知识,另一方面也通过具体实践加深对训练流程、实验设计与模型实现的理解。未来希望继续沿着人工智能与数据科学的交叉方向深入,逐步形成更稳定的研究兴趣与技术能力。
编程基础与数据分析
数值计算与数组操作
数据处理与分析
深度学习框架
深度学习 · PINN · 传染病建模
技术栈:PyTorch, PINN, MLP/LSTM/GRU
使用 PyTorch 搭建神经网络驱动的动力学学习框架,面向传染病传播过程中的状态演化与参数变化建模,将 MLP、LSTM、GRU 引入多舱室流行病系统的参数学习与状态预测任务
面向真实传染病时间序列数据,设计滑动时间窗口输入机制,分别实现适配 MLP 的扁平化输入与适配 LSTM/GRU 的序列输入,比较不同网络结构在疫情传播动态拟合与预测中的表现差异
结合流行病动力学先验,构建包含数据拟合损失、物理约束损失、初值约束、人口守恒约束在内的复合损失函数,提升模型训练稳定性、动力学一致性与预测结果的合理性
围绕传染病系统中的时变传播参数学习问题,设计神经网络参数化方案,支持多参数动态更新,并分析参数失活、梯度不稳定、预测退化等训练现象
在 COVID-19、mpox 等多组真实疫情时间序列数据上完成模型训练、误差分析与结构对比实验,评估 MLP、LSTM、GRU 在传染病时序拟合与短期预测任务中的适用性
独立完成模型调试与优化,解决时间窗口错配、张量维度不一致、矩阵乘法错误、参数塌缩、输出退化为直线等深度学习实现问题,并改进模型在真实疫情数据上的稳定性与可解释性
深度学习 · NLP · PyTorch
技术栈:PyTorch, NLP, LoRA, MPS
基于 MiniMind 复现并跑通小语言模型完整训练链路,完成预训练(Pretrain)、全参数监督微调(Full SFT)、LoRA 微调与推理验证
在 Apple Silicon Mac 环境下适配 PyTorch MPS,修改训练与推理脚本以兼容本地设备运行,解决 CUDA 逻辑写死带来的兼容问题
修复 tokenizer 加载、模型权重路径解析、checkpoint 保存与恢复、.pth 权重推理加载等关键工程问题
使用自定义小样本数据完成最小闭环验证,并进一步在原始大规模预训练数据集上完成训练实验
实现 base model、full SFT 与 LoRA adapter 的加载与对比测试,验证不同微调方式对领域回答风格与输出效果的影响