王智刚
王智刚 avatar
Hello · 你好

王智刚 Wang Zhigang

阿里云 EMR · 基础研发工程师 · LLM / Agent / 大数据

自由的理想主义者 技能栈 博客

01 技能栈

没有银弹,只有趁手的工具

LLM / Agent Java 大数据 Python Kubernetes MySQL

  • 深入 LLM 应用开发,具备 Multi Agent 框架设计与实现经验,熟悉 RAG、Prompt 工程及模型微调(LoRA 等)。
  • 深耕 Java 技术栈,对多线程、并发编程和 JVM 调优有扎实的实践经验。
  • 熟悉大数据生态,有 ClickHouse、Kyuubi 等组件的使用和运维经验。
  • 熟悉 MySQL 与 Redis,具备 Python 和 Go 的项目开发经验。
  • 熟练使用 Docker 和 Kubernetes,能独立搭建和维护 CI/CD 流水线。
  • 以 Angular 为主力前端框架,能独立完成前端项目的开发与交付。

02 工作经历

阿里云

2025.06 - 今 (10 个月)

基础研发工程师

展开详情
EMR - EMR On ECS
技术栈

LLM, Multi Agent, RAG, Prompt Engineering, Java, Python, Big Data

工作内容
  • 大数据集群异常事件的自动化诊断与根因分析
  • Multi Agent 框架的架构设计与核心开发
  • 基于 Agent 框架的 EMR 智能诊断助手开发
  • LLM 在运维诊断场景下的工程化落地
工作成果
  • 主导设计并实现了 Multi Agent 协作框架,支撑多种诊断场景的智能化分析
  • 完成 EMR 智能诊断助手的开发与上线,提升集群异常的响应效率
  • 将实习期间的根因分析能力与 LLM 结合,实现从规则驱动到智能驱动的演进
  • 沉淀了 Agent 编排、工具调用、上下文管理等通用能力,提升了框架的可复用性

03 实习经历

阿里云

2024.05 - 2025.06 (13 个月)

后端开发工程师

展开详情
EMR - EMR On ECS
技术栈

Java, BigData, MySQL

工作内容
  • 大数据集群的异常事件自动化诊断和分析
工作成果
  • 根据产品需求文档,设计并开发后端接口和数据库表结构,与前端团队对接,完成后端开发
  • 使用 Guava Graph 构建了故障的传播图谱,并实现了根因传播树的提取和实例化
  • 基于注解和反射机制实现了事件映射和分析框架,显著减少代码重复,提升了系统的可扩展性和可维护性
  • 结合模板引擎实现字段级别的 Prompt 定制,并结合 LLM 实现自动生成根因分析报告
  • 独立负责并完成了 HOST 部分的根因分析

快手

2024.01 - 2024.05 (5 个月)

后端开发工程师

展开详情
算法引擎部 - 检索引擎组
技术栈

C++, Java, Python, Milvus, AspectJ, Redis, MySQL

工作内容
  • Milvus 集群中间件的可观测性优化和性能优化及新功能的设计与实现
  • 快手向量数据库删除功能的设计与开发
工作成果
  • 借助 AspectJ 和注解,对部分函数进行静态代理,无侵入的增强了整个系统的可观测性
  • 使用 AspectJ 和责任链模式实现动态请求过滤和限流,防止系统雪崩
  • 结合 Perf 数据,优化了部分热点函数,部分函数提升了 80 倍的性能
  • 基于无锁 Bitmap 实现向量数据库删除,百万级数据下搜索召回率 > 95%,latency < 5ms

爱奇艺

2020.10 - 2021.08 (10 个月)

算法 & 后端开发工程师

展开详情
智能平台部 - 身份识别组
技术栈

Python, Flask, MongoDB, 微信小程序

工作内容
  • 算法 SDK 的工程化及容器化
  • 微信小程序开发
  • 算法模型设计、开发与部署
工作成果
  • 独立完成爱奇艺 AI 小程序前后端的开发与部署,单日最大调用量 2W+ 次; 30 天积累 1W+ 用户
  • 重构了原有的后端代码,将不同的模块进行拆分解耦,完成算法服务的容器化
  • 深度参与了 2021 爱奇艺 AI 拜年活动的开发,负责部分原子服务的封装,测试通过并上线

04 教育经历

北京邮电大学

硕士

计算机技术

2022 - 2025

北京邮电大学

本科

计算机科学与技术

2018 - 2022

05 项目经历

做过的一些项目,有的还在,有的已经下线