何锦诚

MTS / PRODUCT

电话/微信：17712862516

邮箱：jacksonhe04@qq.com

主页：https://www.inon.space

GitHub: https://github.com/JacksonHe04

教育经历

东南大学（985）

南京｜2022-09 ~ 2027-06

人工智能学院｜人工智能｜本科

实习经历

美团

核心本地商业｜基础研发平台｜基础技术部｜云智能产品｜云平台智能｜产品经理

上海｜2025-12 ~ 2026-06

美团云计算产品团队负责云计算平台技术产品，支撑万亿级业务。团队核心产品 1024 Agent 基于 ReAct + 多 Agent 架构，是面向各业务团队开放的 AaaS 平台。基于 1024 的美团云智能客服，以技术文档、代码仓库及历史工单为语料，为全体员工提供云产品问题解答，提升产研工单处理效率；同时提供一站式智能客服解决方案，结合评估与观测能力，推动各业务场景 Agentic 化。

Agent 评估体系建设：针对现有业务指标在时间维度上的分母波动问题，以及 Agent 在真实场景中效果难量化的痛点，牵头对齐团队对 Agent 评估 的统一认知，从典型 Bad Case 出发设计知识检索与工具调用等多维原子能力评估指标，主导构建覆盖 6 个核心业务场景、近 300 条标准样本的基准评估集，使评估结果与业务指标波动相关系数从 0.42 提升到 0.78，促进 10+ 业务线持续迭代运营。
Agent Skills 建设：主导设计并上线 1024 Agent Skills 产品功能，有效提升多个业务的 Agent 拦截率；构建「业务 API → 统一鉴权中转 → 工作流 Skill 封装」的能力架构，并通过 Agent 前端逆向 CLI 化权限接口，实现「权限批量开通、移交、复制」等重点场景在 CatClaw 的落地，显著减少审批与人工操作成本。
路由模型微调：针对多 Agent 架构下路由准确率不足的问题，主导 Agent 路由微调方案设计与效果验证，通过构建训练数据收集机制与评估集样本，并结合场景拆分、数据清洗与模型微调持续优化路由策略，使复杂场景中路由正确命中比例由约 70% 提升至 81%，大幅降低用户投诉量。
渠道接入重构：针对原有接入流程规则复杂、运营维护成本高的问题，主导渠道接入流程与数据结构重构，重新设计接入流程并基于 NoCode 快速实现接入登记与后台管理平台，将业务接入步骤压缩约 70%，推动团队在 Q1 提前完成全年渠道接入覆盖率目标。
以客户为中心：负责智能客服 Agent 场景的外部业务合作与客户支持，推动金融、外卖、闪购、Keeta 等 100+ 业务线落地，深入理解 Agentic Loop 架构与工具调用机制，日常承担大量客户答疑与问题排查，累计解决权限配置、知识库检索、机器人路由等各类问题 100+，显著降低业务合作成本与人工支持压力，成为客户侧核心对接人。

智谱 AI

产品解决方案中心｜产品组｜大模型产品实习生

北京｜2025-08 ~ 2025-11

智谱企业级 MaaS（Model-as-a-Service）平台是面向全球企业的大模型全生命周期管理与服务平台，是智谱 IPO 招股书中的营收最大来源。覆盖模型部署、模型微调、模型评测、推理服务、集群管理等硬核功能，助力各企业快速构建新一代原生大模型平台。

模型路由调度：面向企业多模型调用中单点故障、资源浪费与场景适配困难的问题，主导设计平台 Model Router 能力，支持基于上下文、成本、稳定性的动态分发，实现多模型调度与统一管理。构建路由规则配置与发布流程，支持分级降本、A/B Test、故障切换等常见场景，显著提升推理服务稳定性与资源利用率，完善平台在调度与 SLA 层的核心能力。
日志投递与挖掘：针对企业难以获取真实业务数据、日志排查效率低的问题，负责设计日志挖掘模块，实现模型推理的输入输出日志自动采集。推动构建「日志 → 数据集 → 模型训练/评测」的数据闭环，使企业可基于线上真实日志持续优化模型效果，加速模型迭代效率，提升平台数据资产价值。
可观测与用量统计：围绕企业在大模型应用中的成本黑盒与分账困难，设计并上线用量统计模块，提供 Token 消耗、API 调用量等核心指标的可视化能力。帮助企业业务团队实现成本管理与调用监控，为企业成本核算、运维观测与业务决策提供数据支撑，强化平台的可观测性与商业化能力。
平台交互规范统一：针对平台多场景下交互不一致、误操作成本高的问题，主导交互规范与 UI 重构，系统梳理 10+ 场景中的删除确认、错误提示、操作反馈逻辑，统一弹窗结构、文案规范、引导路径，形成平台级设计标准并推动前端组件库抽象。有效降低用户误删与排错成本，提升整体体验一致性与专业度，同时减少解决方案侧工单压力。
前沿方向调研：面向企业在 Agent 落地中的安全隔离、代码执行、并发与冷启动需求，开展 Agent Infra 与 Sandbox 技术预研，深度剖析 Manus、Lindy 等 Agent 产品的沙盒应用场景，并参考 E2B、AgentBay 等竞品的产品定位，输出调研报告并面向多部门汇报分享，为 Q4 开发者基础设施规划提供关键输入，推动智谱向 Agent 原生生态演进。

项目经历

东南大学 PALM 实验室研究生招生系统

https://github.com/JacksonHe04/palm-ams

面向国内顶尖 AI Lab 真实业务场景的 B 端产品，历时 8 个月深度主导需求分析、产品设计与开发迭代。通过与实验室导师和学生的持续沟通，构建完整的招生管理产品体系，目前申请数量达 2000+ 人次，较往年增长 71%，获得甲方高度认可。

需求分析与调研：深度挖掘实验室招生痛点，针对传统邮件申请方式效率低下的问题，进行产品需求分析与申请流程标准化，申请处理效率提升 60%。
权限体系设计：建立完整的用户画像体系，针对导师、学生设计差异化功能模块，通过权限管理与路由设计实现精细化的业务流程控制。
独立开发上线：独立完成从项目的前端页面开发、组件库构建、后端接口开发、数据库设计，到域名 DNS 解析、云服务器部署、Nginx 配置、SSL 证书申请与上线的全流程，极大锻炼了我的技术边界视野与 PMO 能力。
用户反馈收集迭代：建立用户反馈收集机制，通过沟通识别产品优化点，持续迭代产品功能，从功能层解决了 80% 以上的用户反馈问题。

关于我

AI 先锋探索者：自 2022 年起持续跟踪并深度使用各种国内外大模型产品，对 Memory、Skills、Coding Agent、Self-improve 乃至多模态与世界模型有深入理解，长期浸润在开源社区、最新论文、播客访谈中，极度关注 AI 产品的内部机制与商业模式。
LLM 工程经验：作为人工智能专业，熟悉模型的预/后训练、Reward、Benchmark，拥有 Ollama 在本地部署 DeepSeek R1、Qwen 2.5 等大模型的经验；有基于 OneShot & FewShot 的 Batch 对比工程实践；完成过基于 LoRA SFT 的文本模型与音乐生成（Meta MusicGen）大模型微调且均开源。
Agentic Engineering：作为东南大学信使计划开发工作室的核心成员，具备丰富的技术背景与前后端全栈开发经验，曾承接过多个校内外软件项目。同时，被开源浏览器 AI 插件仓库成功合并过新功能开发的 PR。熟悉 Claude Code、Codex 等工具生态，持续探索 AI 原生开发方式。
方向与目标：认可产品人在当今时代的价值，对互联网行业、人工智能产品化与商业化，尤其对 Agent 在具体环境的实际落地充满热情，目标成为中国大陆企业在 Agent + Evals/Skills 实现业务 Agentic 闭环的前沿布道者。