DS
EN
首页
教育背景
工作经历
论文与演讲
科研经历
项目经历
专业技能
沈大程
计算机科学博士生
热衷于AI、机器学习和NLP。目前在华盛顿州立大学攻读博士学位, 致力于构建解决现实问题的智能系统。
🔬
查看科研
💡
我的项目
🎓 教育背景
华盛顿州立大学三城分校
2026年1月 - 至今
计算机科学博士
南加州大学
2024年6月 - 2025年12月
计算机科学硕士
康涅狄格大学
2020年9月 - 2024年5月
计算机科学学士
院长荣誉名单 (Dean's List)
💼 工作经历
软件开发工程师
2023年7月 - 2023年8月
海科佳智能装备技术有限公司
维护Web服务器后端并优化数据库操作,确保数据完整性、安全性和系统稳定性。
开发并集成新的客户端UI功能到现有框架中,显著提升了整体系统功能和用户体验。
📄 论文、预印本与演讲
将量子能力集成到信息物理系统的Simplex启发架构 🔗
2026年3月
海报展示 — 第2届HAIQ研讨会,匹兹堡,宾夕法尼亚州
Tamim Ahmed、
沈大程
、Mengyu Liu和Monowar Hasan。海报展示于第2届HAIQ研讨会,匹兹堡,宾夕法尼亚州,2026年3月。
🔬 科研经历
LLM引导的电网N-1故障缓解
2026年1月 - 2026年4月
研究助理 / 博士研究员
设计了基于 LLM 引导的灾后电网恢复决策框架(满足 N-1 可靠性准则),旨在缓解紧急运行状态下的线路过载问题。
将 LLM 与基于 AC-OPF(交流最优潮流)的验证及运行时安全保障机制相结合,以生成、验证并优化稀疏的发电机重调度策略。
针对分布内和分布外(OOD)的故障场景,在 IEEE 标准电力系统上对该框架进行了评估,并与基于 OPF 及基于规则的基准模型进行了对比。
实验表明,该框架在满足安全约束的前提下提升了恢复成功率并降低了控制成本,验证了 LLM 辅助决策在信息物理电力系统中的可行性。
PyHazards:AI驱动的自然灾害预测框架 🔗
2025年9月 - 2026年1月
研究助理,南加州大学 FORTIS 实验室 (PI: Prof. Yue Zhao) 🔗
将基于 Transformer 的预测学习算法进行工程化开发,并集成至用于自然灾害预测的开源 Python 工具包 PyHazards 中。
开发可扩展的机器学习模块以处理复杂数据,并评估 Transformer 模型相对于各主流基线模型的预测性能。
与研究团队紧密协作,实现 AI 预测流程的标准化,显著提升了框架的整体准确性与可扩展性。
基于Claude 3.7的叙事比较分析
2025年3月 - 2025年6月
研究助理,南加州大学 FORTIS 实验室 (PI: Prof. Yue Zhao) 🔗
设计并实现了基于 Claude 3.7 Sonnet 的 LLM 自动化评估流程,在四个比较维度(冲突、独特、整体、重叠)上对208对叙事文本进行分析。
基于 Anthropic API 构建了高可扩展的 Prompt 推理系统,结合批量输出解析技术,将人工评估的工作量减少了 90% 以上。
将模型输出统一结构化为 JSON 与人类可读格式,为系统的跨模型分析及后续人工标注奠定基础。
与导师及研究团队协作完成数据集构建与叙事提取,并设计了相应的评估指标以降低 LLM 的比较偏差。
OEM Controls AS5传感器自动化角度测试 🔗
2023年8月 - 2024年5月
毕业设计项目负责人
领导为期一年的毕业设计项目,旨在实现 AS5 传感器系统的 QA(质量保证)自动化测试,显著提高了测试效率与可靠性。
在 Ubuntu 环境下开发基于 Python 的控制系统以驱动六轴机械臂,实现传感器校准与测试流程的自动化,并提供精确的"Pass/Fail"反馈及实时结果记录。
设计并实现了基于 API 的前后端无缝集成,以全自动校准解决方案成功取代了旧版客户端。
成功交付该项目,将人工测试时间缩短了 67%,校准精度提升了 26%,全面优化了系统的效率与可靠性。
📚 项目经历
基于迁移学习的不平衡垃圾分类 🔗
2025年1月 - 2025年5月
在包含9个类别的 RealWaste 数据集上,对 VGG16 的三种迁移学习策略进行了受控消融实验;采用 64/16/20 的分层数据划分,并设计了自定义分类头。
对比了冻结主干网络与微调 Block 5 的效果差异,以及逆频率类别权重与 RandomOverSampler 在处理长尾分布时的表现;采用代价敏感权重进行微调后,测试准确率从 60.6% 提升至 69.9%,Macro F1 分数提升了 10.3 个百分点。
基于混淆矩阵开展错误分析,精准定位了难以区分的细粒度边界(如塑料/金属、纸张/纸板),并提出了具有类别选择性的混合不平衡处理策略作为后续优化方向。
AI驱动智能出行助手设计 - FlySmart
2025年3月 - 2025年5月
主导需求工程项目,设计了一款 AI 驱动的航班预订助手。
开展利益相关者分析、问卷调查与深度访谈,推导出用户画像及同理心地图,并完成需求分类。
使用 Figma 创建并验证产品原型,涵盖航班搜索、签证管理、智能提醒及个性化 AI 聊天界面等核心功能。
采用敏捷开发(Agile)方法论,制定基于用户故事的待办列表(Backlog)和冲刺(Sprint)路线图,并通过可用性测试及原型验证进行正式评估。
基于Weaviate和RAG的语义检索与问答系统
2024年9月 - 2024年12月
使用 Weaviate 与 text2vec-transformers 构建语义搜索 Pipeline,通过 GraphQL 的 nearText 查询实现基于向量的品牌相似度检索。
使用 Streamlit 开发 PDF 问答聊天机器人,综合运用 PyPDFLoader、ChromaDB 与 Hugging Face Embeddings,在 RAG(检索增强生成)框架下实现基于文档的精准回答。
亚马逊办公产品评论大规模情感分析 🔗
2025年8月 - 2025年10月
完成 20万+ 评论文本的数据清洗与标准化(包含正则去除 HTML/URL、分词、停用词过滤及词形还原)。
训练基于 TF-IDF 特征的机器学习模型,包括 LinearSVC、逻辑回归和感知机。
复现并评估了两种 GloVe 词向量表示方法:100维的 Average Pooling 与 1000维的 Top-10 Token 拼接。
实验证明,100维的平均池化方法在未见评论数据集上展现出更强的泛化能力。
学生管理系统设计
2023年9月 - 2024年12月
参与团队协作项目,使用 Figma 设计产品交互模型并向利益相关者展示方案。
负责前后端代码开发,将 Figma 的设计原型成功转化为具备实际交互功能的产品。
完成网站的整体开发,并对所有核心功能进行了全面的系统测试。
点餐应用设计
2021年8月 - 2021年11月
使用 Java 构建具备完整业务逻辑的点餐应用,支持下单后自动生成包含菜品名称、单价及总价的发票。
担任小组组长,使用 GitHub 进行版本控制与团队协作,高效管理和合并各成员的代码提交。
撰写详尽的项目报告,并在课程中进行最终的成果展示。
🔧 专业技能
💻
编程语言
Python
C#
Java
C/C++
SQL
Bash/Shell
HTML
🤖
AI / ML / NLP
PyTorch
TensorFlow/Keras
scikit-learn
Hugging Face Transformers
Transfer Learning
RAG
Semantic Search
Prompt Engineering
NLTK
Gensim
🔬
研究领域
Cyber-Physical Systems
Reinforcement Learning
Time-Series Forecasting
🗄️
数据与数据库
NumPy
Pandas
MySQL
MongoDB
ChromaDB
Weaviate
GraphQL
Data Preprocessing
📐
软件工程
REST APIs
OOP Design Patterns
Modular Architecture
Agile (Scrum)
Git
🛠️
工具与平台
Linux/Ubuntu
Docker
AWS
Streamlit
Jupyter
Figma