沈大程

沈大程

计算机科学博士生

热衷于AI、Machine Learning和NLP。目前在华盛顿州立大学攻读博士学位, 致力于构建解决现实问题的智能系统。

🎓 教育背景

华盛顿州立大学三城分校 2026年1月 - 至今
计算机科学博士
南加州大学 2024年6月 - 2025年12月
计算机科学硕士
康涅狄格大学 2020年9月 - 2024年5月
计算机科学学士
院长荣誉名单

💼 工作经历

软件开发工程师 2023年7月 - 2023年8月
海科佳智能装备技术有限公司
  • 负责后端和服务器维护
  • 更新框架,优化用户界面和性能
  • 配置数据库权限和安全策略
  • 主导UI开发,用户满意度提升32%

🔬 科研经历

基于Claude 3.7的叙事比较分析 2025年3月 - 2025年8月
研究助理
  • 设计并自动化了基于Claude 3.7 Sonnet的LLM评估流程,对208对叙事在四个比较维度(冲突、独特、整体、重叠)进行分析
  • 使用Anthropic API构建可扩展的基于提示的推理系统,并进行批量输出解析,将人工评判工作量减少90%以上
  • 将模型响应结构化为JSON和人类可读格式,以实现系统性的跨模型分析和未来的人工标注
  • 与教授和研究团队合作进行数据集准备、叙事提取,以及设计减少LLM比较偏差的评估指标
OEM Controls AS5传感器自动化角度测试 2023年8月 - 2024年5月
毕业设计项目负责人
  • 领导为期一年的毕业设计项目,为AS5传感器系统自动化质量保证测试,显著提高了测试效率和可靠性
  • 在Ubuntu上开发基于Python的控制系统,操控六轴机械臂,自动化传感器校准和测试程序,提供精确的"通过/失败"反馈和实时结果记录
  • 设计并实现了使用API的无缝UI-后端集成,用全自动校准解决方案替代了之前的客户端版本
  • 成功交付项目,将手动测试时间减少67%,校准精度提高26%,整体提升了效率和可靠性

📚 项目经历

迁移学习实现垃圾分类 2025年1月 - 2025年5月
  • 使用Python、TensorFlow/Keras开发了九类垃圾图像分类器,采用80/20训练测试划分和20%训练内验证进行稳健的模型评估
  • 构建了图像预处理流程,应用数据增强技术(随机裁剪、缩放、旋转、翻转、对比度调整、平移)以减少过拟合
  • 通过冻结预训练骨干网络(ResNet50、ResNet101、EfficientNetB0、VGG16),添加自定义全连接层,包含ReLU、softmax、L2正则化、批归一化和20%的Dropout实现迁移学习
  • 使用精确率、召回率、AUC和F1分数在测试集上评估所有模型;确定VGG16表现最佳,达到最高准确率和泛化能力
AI驱动智能出行助手设计 - FlySmart 2025年3月 - 2025年5月
  • 主导需求工程项目,设计AI驱动的航班预订助手
  • 进行利益相关者分析、问卷调查和访谈,推导用户画像、同理心地图并分类需求
  • 使用Figma创建并验证原型,功能包括航班搜索、签证管理、智能提醒和个性化AI聊天界面
  • 应用敏捷方法论,使用故事驱动的待办列表、基于冲刺的开发路线图,通过可用性测试和原型验证进行正式验证
基于Weaviate和RAG的语义检索与问答系统 2024年9月 - 2024年12月
  • 使用Weaviate和text2vec-transformers构建语义搜索管道,通过GraphQL nearText查询实现基于向量的品牌相似度搜索
  • 使用Streamlit开发PDF问答聊天机器人,利用PyPDFLoader、ChromaDB和Hugging Face嵌入,在RAG框架中实现基于文档的响应生成
亚马逊办公产品评论大规模情感分析 2025年8月 - 2025年10月
  • 清洗和标准化20万+评论文本(正则表达式去除HTML/URL、分词、停用词过滤、词形还原)
  • 训练TF-IDF(一元+二元语法)机器学习模型,包括LinearSVC、逻辑回归和感知机
  • 复现并评估两种GloVe表示方法:100维平均池化与1000维前10词拼接
  • 证明100维平均池化在未见评论上具有更强的泛化能力
学生管理系统设计 2023年9月 - 2024年12月
  • 团队协作项目,使用Figma设计产品模型并向利益相关者展示方案
  • 开发并实现代码,将每个Figma设计功能转化为实际产品
  • 完成网站开发并全面测试所有功能
点餐应用设计 2021年8月 - 2021年11月
  • 使用Java构建点餐应用,可在下单后生成包含菜品名称、价格和总价的发票
  • 担任小组组长,使用GitHub分享和合并各成员完成的信息和代码部分
  • 完成项目报告并进行展示

🔧 专业技能

💻

编程语言

Python Java C C++ SQL HTML
🤖

AI / ML / NLP

Hugging Face Transformers RAG Transfer Learning LLM Prompting Semantic Search MapReduce Model Evaluation PyTorch NLTK Gensim scikit-learn
🗄️

Data & Databases

MySQL MongoDB ChromaDB Weaviate Web Crawling Data Preprocessing JSON Parsing
📐

Software Design

REST APIs Modular Architecture UML Agile (Scrum)
🛠️

Tools & Platforms

Git Docker Trello Figma Microsoft Office Suite AWS Streamlit Jupyter Lightroom Photoshop