AI
朱美阳
Training · Systems · Workflow
返回首页

项目经历

6个大模型核心项目全流程实操,覆盖消费级语音助手与车载智能交互两大核心赛道,按时间倒序排列。

长城汽车 · 智能座舱事业部 小魏智能助手团队

小魏Agent旅游规划场景智能助手项目

AI训练师 · 全流程管控2026.01-2026.04(4个月)

小魏智能助手自驾出行需求占比超60%,需完成Agent全链路标注与数据优化,提升车载自驾场景服务能力。

个人职责
对接产品与算法团队,制定Agent思考对/行动对标注规范、工具调用审核标准、自驾场景业务规则,搭建7步逐轮审核标注流程
负责标注与质检团队的全流程培训,完成672轮试标数据生产与考核,对齐车载驾驶安全规范与自驾场景标注标准
全流程管控项目进度与质量,拆分4个项目阶段,制定14项自检清单,把控上下文连贯性、工具调用准确率、需求匹配度核心指标
完成全量标注数据的清洗、格式化与交付,基于高质量数据集完成小魏大模型自驾场景SFT微调,验证模型优化效果,完成最终上线验收
核心成果
全周期交付4480个完整Agent多轮会话(22400轮单轮对话数据),覆盖自驾行程规划、POI推荐、应急处置全场景
达成人均28轮/天的标注人效,所有批次数据合格率≥95%
推动模型车机原生工具调用准确率提升至98%,车主自驾需求理解匹配度提升15%,多轮对话上下文连贯性合规率100%
支撑五一自驾高峰专属版本全量上线
Agent工具调用自驾场景SFT微调
长城汽车 · 智能座舱事业部 小魏智能助手团队

小魏智能助手TTS语音合成优化项目

AI训练师 · 全流程管控2025.10-2026.01(3个月)

小魏智能助手语音合成存在拼音标注错误、多音字处理偏差、声调不准确等问题,需构建标准化拼音标注数据集,提升TTS合成的自然度与准确性。

个人职责
对接算法需求,制定TTS拼音标注规范、多音字处理规则、声调校准标准,搭建全流程质检体系
负责标注团队的专项培训,完成810条试标数据生产与上岗考核,统一多音字、生僻词标注口径
管控项目全周期产能与质量,制定双检机制,重点把控拼音准确率、多音字准确率核心指标
完成全量数据的格式化交付,配合算法团队完成模型微调,针对bad case开展二次标注优化
核心成果
全周期交付2.7万条高质量拼音校对标注数据,标注一致性(IAA)≥96%,拼音准确率≥99%,多音字准确率≥98%
达成人均45条/天的标注人效,批次合格率100%
推动TTS合成自然度MOS值从3.8提升至4.1,导航播报多音字错误率下降90%
TTS拼音标注多音字声调校准
长城汽车 · 智能座舱事业部 小魏智能助手团队

小魏智能助手ASR语音识别优化项目

AI训练师 · 全流程管控2025.07-2025.10(3个月)

小魏智能助手在台湾地区繁体中文、四川方言等多方言、车载多场景下的语音识别准确率不足,鲁棒性较差,需构建高质量ASR训练数据集。

个人职责
对接算法与产品需求,制定ASR语音转写标注规范、繁简体转换规则、方言有效性判断标准,完成标注体系搭建
负责10人标注团队+2人质检团队的岗前培训、标准对齐、产能管控,完成990条试标数据生产与考核
全流程管控数据质量,制定每日抽检、每周复盘机制,把控标注一致性(IAA)与转写准确率核心指标
完成全量数据清洗、脱敏、格式化,交付算法团队用于模型微调,同步完成模型迭代后的效果验证与bad case分析
核心成果
全周期交付3.3万条高质量语音转写标注数据,标注一致性(IAA)≥95%,转写准确率≥98%,有效数据占比≥90%
达成人均55条/天的标注人效,提前3天完成全量交付
推动台湾腔、四川方言场景识别准确率提升12%,车载普通话场景识别准确率提升5%
ASR语音转写方言识别团队管理
小米 · 人工智能部 小爱同学团队

小爱同学文生图能力评测项目

质检岗2025.04-2025.06(3个月)

PC端小爱同学文生图功能正式上线,需在手机端全量落地前完成生成结果的质量、安全性、指令遵循度全维度评测,构建标准化多模态评测数据集。

个人职责
参与评测体系搭建,制定文生图评测标准、质检规范,完成450条试标数据的评测与标准对齐
负责10人标注团队的评测数据全量质检,把控评测一致性、违规样本检出率、数据准确率核心指标
每日输出质检报告,汇总高频错误,开展周度专项培训,管控批次合格率,完成不合格数据的返工跟进
完成全量评测数据的汇总、分类与格式化交付,输出评测分析报告,支撑模型迭代优化
核心成果
完成全量1.5万条图像评测数据的全量质检,达成人均25条/天的评测人效
评测一致性(Fleiss' Kappa)≥0.75,交付数据准确率≥95%,违规样本检出率100%
输出3份专项评测分析报告,定位模型指令遵循、安全性核心痛点,支撑3轮模型迭代优化
文生图多模态评测质检数据交付
小米 · 人工智能部 小爱同学团队

小爱同学多轮对话优化项目

标注岗2025.02-2025.03(2个月)

基于单轮对话优化成果,重点解决多轮对话上下文遗忘、意图理解偏差、前后信息矛盾等核心问题,提升长程对话连贯性与任务型对话完成度。

个人职责
完成多轮对话标注规范学习与336条试标数据生产,通过专项考核,负责多轮对话的全链路标注、上下文一致性校验、优质对话改写工作
严格把控多轮对话的意图理解、前后信息匹配度,完成个人标注数据的全量自检,配合质检完成返工整改
协助培训新入职标注员,同步标注规范与易错点,助力团队产能爬坡
核心成果
个人累计完成16800条有效标注数据,达成人均140条/天的标注人效
个人交付数据准确率≥98%,零合规问题
助力团队完成6万条总产能交付,标注一致性(IAA)≥95%,上下文连贯性合规率100%
多轮对话上下文校验意图理解对话改写
小米 · 人工智能部 小爱同学团队

小爱同学单轮对话优化项目

标注岗2024.12-2025.01(2个月)

小爱同学回复风格生硬,人性化交互能力不足,需构建优质单轮对话PR对数据集,提升单轮问答、情感交互、IoT控制等场景的模型表现。

个人职责
参与标注规范学习与1680条试标数据生产,通过上岗考核,严格遵循规范完成单轮对话的问答改写、句式转换、风格优化标注工作
严格执行自检流程,确保个人交付数据准确率达标,配合质检员完成不合格数据的返工整改
参与周度标注复盘,针对高频错误提出规范优化建议,协助统一团队标注口径
核心成果
个人累计完成11200条有效标注数据,达成人均140条/天的标注人效
个人交付数据准确率≥98%,零合规问题
助力团队完成5.6万条总产能交付,标注一致性(IAA)≥95%,改写回复合规率100%
单轮对话问答改写句式转换风格优化