项目经历 | 朱美阳

长城汽车 · 智能座舱事业部小魏智能助手团队

小魏Agent旅游规划场景智能助手项目

AI训练师 · 全流程管控2026.01-2026.04（4个月）

小魏智能助手自驾出行需求占比超60%，需完成Agent全链路标注与数据优化，提升车载自驾场景服务能力。

个人职责

对接产品与算法团队，制定Agent思考对/行动对标注规范、工具调用审核标准、自驾场景业务规则，搭建7步逐轮审核标注流程

负责标注与质检团队的全流程培训，完成672轮试标数据生产与考核，对齐车载驾驶安全规范与自驾场景标注标准

全流程管控项目进度与质量，拆分4个项目阶段，制定14项自检清单，把控上下文连贯性、工具调用准确率、需求匹配度核心指标

完成全量标注数据的清洗、格式化与交付，基于高质量数据集完成小魏大模型自驾场景SFT微调，验证模型优化效果，完成最终上线验收

核心成果

全周期交付4480个完整Agent多轮会话（22400轮单轮对话数据），覆盖自驾行程规划、POI推荐、应急处置全场景

达成人均28轮/天的标注人效，所有批次数据合格率≥95%

推动模型车机原生工具调用准确率提升至98%，车主自驾需求理解匹配度提升15%，多轮对话上下文连贯性合规率100%

支撑五一自驾高峰专属版本全量上线

Agent工具调用自驾场景SFT微调

长城汽车 · 智能座舱事业部小魏智能助手团队

小魏智能助手TTS语音合成优化项目

AI训练师 · 全流程管控2025.10-2026.01（3个月）

小魏智能助手语音合成存在拼音标注错误、多音字处理偏差、声调不准确等问题，需构建标准化拼音标注数据集，提升TTS合成的自然度与准确性。

个人职责

对接算法需求，制定TTS拼音标注规范、多音字处理规则、声调校准标准，搭建全流程质检体系

负责标注团队的专项培训，完成810条试标数据生产与上岗考核，统一多音字、生僻词标注口径

管控项目全周期产能与质量，制定双检机制，重点把控拼音准确率、多音字准确率核心指标

完成全量数据的格式化交付，配合算法团队完成模型微调，针对bad case开展二次标注优化

核心成果

全周期交付2.7万条高质量拼音校对标注数据，标注一致性(IAA)≥96%，拼音准确率≥99%，多音字准确率≥98%

达成人均45条/天的标注人效，批次合格率100%

推动TTS合成自然度MOS值从3.8提升至4.1，导航播报多音字错误率下降90%

TTS拼音标注多音字声调校准

长城汽车 · 智能座舱事业部小魏智能助手团队

小魏智能助手ASR语音识别优化项目

AI训练师 · 全流程管控2025.07-2025.10（3个月）

小魏智能助手在台湾地区繁体中文、四川方言等多方言、车载多场景下的语音识别准确率不足，鲁棒性较差，需构建高质量ASR训练数据集。

个人职责

对接算法与产品需求，制定ASR语音转写标注规范、繁简体转换规则、方言有效性判断标准，完成标注体系搭建

负责10人标注团队+2人质检团队的岗前培训、标准对齐、产能管控，完成990条试标数据生产与考核

全流程管控数据质量，制定每日抽检、每周复盘机制，把控标注一致性(IAA)与转写准确率核心指标

完成全量数据清洗、脱敏、格式化，交付算法团队用于模型微调，同步完成模型迭代后的效果验证与bad case分析

核心成果

全周期交付3.3万条高质量语音转写标注数据，标注一致性(IAA)≥95%，转写准确率≥98%，有效数据占比≥90%

达成人均55条/天的标注人效，提前3天完成全量交付

推动台湾腔、四川方言场景识别准确率提升12%，车载普通话场景识别准确率提升5%

ASR语音转写方言识别团队管理

小米 · 人工智能部小爱同学团队

小爱同学文生图能力评测项目

质检岗2025.04-2025.06（3个月）

PC端小爱同学文生图功能正式上线，需在手机端全量落地前完成生成结果的质量、安全性、指令遵循度全维度评测，构建标准化多模态评测数据集。

个人职责

参与评测体系搭建，制定文生图评测标准、质检规范，完成450条试标数据的评测与标准对齐

负责10人标注团队的评测数据全量质检，把控评测一致性、违规样本检出率、数据准确率核心指标

每日输出质检报告，汇总高频错误，开展周度专项培训，管控批次合格率，完成不合格数据的返工跟进

完成全量评测数据的汇总、分类与格式化交付，输出评测分析报告，支撑模型迭代优化

核心成果

完成全量1.5万条图像评测数据的全量质检，达成人均25条/天的评测人效

评测一致性(Fleiss' Kappa)≥0.75，交付数据准确率≥95%，违规样本检出率100%

输出3份专项评测分析报告，定位模型指令遵循、安全性核心痛点，支撑3轮模型迭代优化

文生图多模态评测质检数据交付

小米 · 人工智能部小爱同学团队

小爱同学多轮对话优化项目

标注岗2025.02-2025.03（2个月）

基于单轮对话优化成果，重点解决多轮对话上下文遗忘、意图理解偏差、前后信息矛盾等核心问题，提升长程对话连贯性与任务型对话完成度。

个人职责

完成多轮对话标注规范学习与336条试标数据生产，通过专项考核，负责多轮对话的全链路标注、上下文一致性校验、优质对话改写工作

严格把控多轮对话的意图理解、前后信息匹配度，完成个人标注数据的全量自检，配合质检完成返工整改

协助培训新入职标注员，同步标注规范与易错点，助力团队产能爬坡

核心成果

个人累计完成16800条有效标注数据，达成人均140条/天的标注人效

个人交付数据准确率≥98%，零合规问题

助力团队完成6万条总产能交付，标注一致性(IAA)≥95%，上下文连贯性合规率100%

多轮对话上下文校验意图理解对话改写

小米 · 人工智能部小爱同学团队

小爱同学单轮对话优化项目

标注岗2024.12-2025.01（2个月）

小爱同学回复风格生硬，人性化交互能力不足，需构建优质单轮对话PR对数据集，提升单轮问答、情感交互、IoT控制等场景的模型表现。

个人职责

参与标注规范学习与1680条试标数据生产，通过上岗考核，严格遵循规范完成单轮对话的问答改写、句式转换、风格优化标注工作

严格执行自检流程，确保个人交付数据准确率达标，配合质检员完成不合格数据的返工整改

参与周度标注复盘，针对高频错误提出规范优化建议，协助统一团队标注口径

核心成果

个人累计完成11200条有效标注数据，达成人均140条/天的标注人效

个人交付数据准确率≥98%，零合规问题

助力团队完成5.6万条总产能交付，标注一致性(IAA)≥95%，改写回复合规率100%

单轮对话问答改写句式转换风格优化