何锦诚

MTS / PRODUCT

电话/微信:17712862516

邮箱:jacksonhe04@qq.com

个人照片

教育经历

东南大学(985) logo

东南大学(985)

南京|2022-09 ~ 2027-06

人工智能学院 | 人工智能 | 本科

实习经历

美团 logo

美团

核心本地商业|基础研发平台|基础技术部|云智能产品|云平台智能|产品经理
上海2025-12 ~ 2026-06

美团云计算产品团队负责云计算平台技术产品,支撑万亿级业务。团队核心产品 1024 Agent 基于 ReAct + 多 Agent 架构,是面向各业务团队开放的 AaaS 平台。基于 1024 的美团云智能客服,以技术文档、代码仓库及历史工单为语料,为全体员工提供云产品问题解答,提升产研工单处理效率;同时提供一站式智能客服解决方案,结合评估与观测能力,推动各业务场景 Agentic 化。

  1. Agent 评估体系建设:针对现有业务指标在时间维度上的分母波动问题,以及 Agent 在真实场景中效果难量化的痛点,牵头对齐团队对 Agent 评估 的统一认知,从典型 Bad Case 出发设计知识检索与工具调用等多维原子能力评估指标,主导构建覆盖 6 个核心业务场景、近 300 条标准样本的基准评估集,使评估结果与业务指标波动相关系数从 0.42 提升到 0.78,促进 10+ 业务线持续迭代运营。
  2. Agent Skills 建设:主导设计并上线 1024 Agent Skills 产品功能,有效提升多个业务的 Agent 拦截率;构建「业务 API → 统一鉴权中转 → 工作流 Skill 封装」的能力架构,并通过 Agent 前端逆向 CLI 化权限接口,实现「权限批量开通、移交、复制」等重点场景在 CatClaw 的落地,显著减少审批与人工操作成本。
  3. 路由模型微调:针对多 Agent 架构下路由准确率不足的问题,主导 Agent 路由微调方案设计与效果验证,通过构建训练数据收集机制与评估集样本,并结合场景拆分、数据清洗与模型微调持续优化路由策略,使复杂场景中路由正确命中比例由约 70% 提升至 81%,大幅降低用户投诉量。
  4. 渠道接入重构:针对原有接入流程规则复杂、运营维护成本高的问题,主导渠道接入流程与数据结构重构,重新设计接入流程并基于 NoCode 快速实现接入登记与后台管理平台,将业务接入步骤压缩约 70%,推动团队在 Q1 提前完成全年渠道接入覆盖率目标。
  5. 以客户为中心:负责智能客服 Agent 场景的外部业务合作与客户支持,推动金融、外卖、闪购、Keeta 等 100+ 业务线落地,深入理解 Agentic Loop 架构与工具调用机制,日常承担大量客户答疑与问题排查,累计解决权限配置、知识库检索、机器人路由等各类问题 100+,显著降低业务合作成本与人工支持压力,成为客户侧核心对接人
智谱 AI logo

智谱 AI

产品解决方案中心|产品组|大模型产品实习生
北京2025-08 ~ 2025-11

智谱企业级 MaaS(Model-as-a-Service)平台是面向全球企业的大模型全生命周期管理与服务平台,是智谱 IPO 招股书中的营收最大来源。覆盖模型部署、模型微调、模型评测、推理服务、集群管理等硬核功能,助力各企业快速构建新一代原生大模型平台。

  1. 模型路由调度:面向企业多模型调用中单点故障、资源浪费与场景适配困难的问题,主导设计平台 Model Router 能力,支持基于上下文、成本、稳定性的动态分发,实现多模型调度与统一管理。构建路由规则配置与发布流程,支持分级降本、A/B Test、故障切换等常见场景,显著提升推理服务稳定性资源利用率,完善平台在调度与 SLA 层的核心能力。
  2. 日志投递与挖掘:针对企业难以获取真实业务数据、日志排查效率低的问题,负责设计日志挖掘模块,实现模型推理的输入输出日志自动采集。推动构建「日志 → 数据集 → 模型训练/评测」的数据闭环,使企业可基于线上真实日志持续优化模型效果,加速模型迭代效率,提升平台数据资产价值。
  3. 可观测与用量统计:围绕企业在大模型应用中的成本黑盒与分账困难,设计并上线用量统计模块,提供 Token 消耗、API 调用量等核心指标的可视化能力。帮助企业业务团队实现成本管理调用监控,为企业成本核算、运维观测与业务决策提供数据支撑,强化平台的可观测性商业化能力。
  4. 平台交互规范统一:针对平台多场景下交互不一致、误操作成本高的问题,主导交互规范与 UI 重构,系统梳理 10+ 场景中的删除确认、错误提示、操作反馈逻辑,统一弹窗结构、文案规范、引导路径,形成平台级设计标准并推动前端组件库抽象。有效降低用户误删与排错成本,提升整体体验一致性与专业度,同时减少解决方案侧工单压力。
  5. 前沿方向调研:面向企业在 Agent 落地中的安全隔离、代码执行、并发与冷启动需求,开展 Agent InfraSandbox 技术预研,深度剖析 Manus、Lindy 等 Agent 产品的沙盒应用场景,并参考 E2B、AgentBay 等竞品的产品定位,输出调研报告并面向多部门汇报分享,为 Q4 开发者基础设施规划提供关键输入,推动智谱向 Agent 原生生态演进。

项目经历

东南大学 PALM 实验室研究生招生系统

https://github.com/JacksonHe04/palm-ams

面向国内顶尖 AI Lab 真实业务场景的 B 端产品,历时 8 个月深度主导需求分析、产品设计与开发迭代。通过与实验室导师和学生的持续沟通,构建完整的招生管理产品体系,目前申请数量达 2000+ 人次,较往年增长 71%,获得甲方高度认可。

  1. 需求分析与调研:深度挖掘实验室招生痛点,针对传统邮件申请方式效率低下的问题,进行产品需求分析与申请流程标准化,申请处理效率提升 60%。
  2. 权限体系设计:建立完整的用户画像体系,针对导师、学生设计差异化功能模块,通过权限管理与路由设计实现精细化的业务流程控制。
  3. 独立开发上线:独立完成从项目的前端页面开发、组件库构建、后端接口开发、数据库设计,到域名 DNS 解析、云服务器部署、Nginx 配置、SSL 证书申请与上线的全流程,极大锻炼了我的技术边界视野与 PMO 能力。
  4. 用户反馈收集迭代:建立用户反馈收集机制,通过沟通识别产品优化点,持续迭代产品功能,从功能层解决了 80% 以上的用户反馈问题。

关于我

  1. AI 先锋探索者:自 2022 年起持续跟踪并深度使用各种国内外大模型产品,对 Memory、Skills、Coding Agent、Self-improve 乃至多模态世界模型有深入理解,长期浸润在开源社区最新论文播客访谈中,极度关注 AI 产品的内部机制与商业模式。
  2. LLM 工程经验:作为人工智能专业,熟悉模型的预/后训练、Reward、Benchmark,拥有 Ollama本地部署 DeepSeek R1、Qwen 2.5 等大模型的经验;有基于 OneShot & FewShot 的 Batch 对比工程实践;完成过基于 LoRA SFT 的文本模型与音乐生成(Meta MusicGen)大模型微调且均开源。
  3. Agentic Engineering:作为东南大学信使计划开发工作室的核心成员,具备丰富的技术背景与前后端全栈开发经验,曾承接过多个校内外软件项目。同时,被开源浏览器 AI 插件仓库成功合并过新功能开发的 PR。熟悉 Claude Code、Codex 等工具生态,持续探索 AI 原生开发方式。
  4. 方向与目标:认可产品人在当今时代的价值,对互联网行业、人工智能产品化与商业化,尤其对 Agent 在具体环境的实际落地充满热情,目标成为中国大陆企业在 Agent + Evals/Skills 实现业务 Agentic 闭环的前沿布道者。