期中答疑 AI产品经理热门问题答疑合集

你好，我是海丰。

到今天为止，我们的课程已经更新过半了。我非常开心看到很多同学一直在坚持留言，认真回答课后问题。不过，我也发现，不少同学已经慢慢掉队了，有的人是想要拿出大块的时间来学习，有的人是遇到问题之后没有解决，进度就停下了，总之是积累了很多的课程没有学习。

从今天开始，我们就进入期中周了。首先，我会整理出一些关注度比较高的课后问题，在这里进行统一的解答，其次，我还准备了一道问答题，通过解决它，希望能帮助你对前半程学过的知识进行梳理，查缺补漏。

我先给你准备一份学习指南：首先，关注度比较高的问题我分成了三类，分别是关于产品岗位、关于技术边界，以及关于项目流程的问题。你可以结合我下面的分类，直接去找对应的问题答案。如果你还有其他的疑问，也可以在留言区提问，我都会尽力解答。然后，你可以集中精力去做我留下的问答题，问答题的解决思路我会在周五进行更新，记得准时来看。

话不多说，直接进入今天的答疑吧！

关于产品岗位

问题1：如何快速建立对一个行业的结构认知？

想要快速对一个行业有整体的宏观认知，可以先从这个行业的产业链入手，了解这个产业中一个完整的价值创造过程是怎样的，行业里有哪些头尾部公司。获取这些产业认知内容的途径，我总结了一下，一般有3种方式：

通过咨询公司报告，如艾瑞咨询、易观智库、艾媒网等咨询公司的行业报告了解行业资讯和动态；
通过行业发展报告，如中国报告大厅、中国产业研究院等相关行业发展或投资调研报告；
行业上市公司财报，找行业内的上市公司，通过财报信息能全面的了解，行业的用户、商业、供应链、业务发展等信息。

问题2：为什么 AI 产品经理多分布在 B 端企业？

每个行业都会有“产品岗位”，所以产品经理必然是覆盖全行业的。但为了区分产品经理就职的主流方向，大部分 AI 产品经理活跃在 B 端，原因在于过去几年 AI 在 B 端的产业，更容易商业化。

不过，岗位需求也是随着行业发展而动态变化的，所以最近一两年，我们也能看到 AI 产品经理在 ToC 和 ToB 中的岗位逐渐多了起来，例如推荐系统产品经理，虽然岗位 Title 没有提到 AI，但是岗位能力就是一个 AI 产品经理的要求。

随着 AI 技术在各行业的不断落地，我认为，ToC 的 AI 产品经理势必会成为未来几年后的岗位主流。

问题3：没有 AI 项目环境，产品经理如何转型？

这个问题我发现还是很普遍的，所以我把它单独拿出来说，我认为可以通过三个步骤来学习。

第一步，夯实基础。 我建议你先完整地跟着课程节奏学习一遍，重点掌握 AI 产品经理的三大能力，掌握课程中算法和评估相关的知识点。

第二步，以教促学。 在你了解了课程中的内容后，要试着用自己的话把这些内容讲出来，让别人听懂，而这离不开“从学习到分享再到学习”的一个迭代过程。

第三步，落地实践。 如果所在团队中没有算法同学，那你可以试着在工作中提一些和 AI 相关小需求，这些需求是可以通过相对简单容易的传统机器学习算法来解决的，比如KNN、Naive Bayes，这是为了确保工程研发同学可以通过学习实现。

这样一来，通过研发同学的“踩坑”经历，你可以总结出他们在落地算法过程中对复杂问题的解决和效果反馈，再把它们补充到你的知识技能树中，积累经验。总之，我们要善于利用身边的资源，赋能于自己的业务，来帮助自己提升。

问题4：算法工程师如何转型 AI 产品经理？

对于想要转型产品经理的算法同学，我有2点建议。

首先，需要理解产品经理和技术人员的区别。产品经理需要的是知识的广度，需要打通上下游与横向部门，而技术人员更多的是要在技术领域深挖。

其次，需要突破技术思维的限制。比如，需要意识到，很多时候产品经理做一个产品更重要的是对业务有价值，而不是要追求技术的创新，或者技术的某些提升。就像有时候一个模型 KS 是 30 还是 40 对于业务没有明显的提升，我们就用去提升这些指标。

总之，产品经理决定做一个事情的出发点，是通过技术来实现业务价值，有时候技术如何做反而不重要。

在实际操作上，我建议这类同学可以多和产品经理沟通，看看他们是怎么做的，他们的思考路径是什么，当他们给你提需求的时候，他们考虑的问题都有哪些，来发现自己和产品经理之间的区别，让自己习惯按照产品的思维去思考。

问题5：测试工程师如何转型 AI 产品经理？

对于这个问题，我有些犹豫，我比较推荐测试工程师在测试领域深造，然后将技能发展到 AI 测试领域，这样你作为一个测试工程师会有得天独厚的优势。

作为一名 AI 测试工程师，需要掌握的知识有机器学习基础知识、Python 编程、大数据基础、模型测试。当然，如果还是想转型 AI 产品经理，那么我也建议你参考上一个问题“算法工程师如何转型 AI 产品经理”，很多的准备工作都是相通的。

关于技术边界

问题6：AI 产品经理需要什么样的数学基础？

数学基础是很多转型产品经理都关注的问题。我认为，一个相对完整的数学基础知识体系包括：线性代数、概率论、数理统计、运筹学（最优化方法）、信息论。

但这并不是说，产品经理需要从头开始啃数学基础知识，而是你需要有两方面的认知。

一方面，我们要清晰产品经理对于数学基础的掌握边界。与算法和研发相比，产品经理不需要建模，所以有数学基础不需要你究其原理，如数理统计中的统计推断方法，或运筹学中的最优化方法，你的价值在于利用技术服务业务而不是精通技术。

另一方面，对于想快速入门AI领域的产品经理来说，一定要本着知识的落地应用为学习原则，例如作为产品经理来说为什么要学习概率分布，你要知道它在工作中的作用是什么，其中一点是为了和算法同学同频沟通，另一个很重要原因是为了验收产品。

因此，在转型初期，我们大可以以目的为导向只掌握和工作相关的数学知识，等后面工作稳定下来了，再适当去拓展自己的技术边界。

问题7：什么是数据特征、样本，以及标签？

我们先来看它们具体的定义，你可以结合下面的表格一块来理解：

标签：标签就是预测的结果，比如表格中的性别：“男”、“女”；
特征：特征就是一系列的信息，可以作为人或事物特点的标识，用来描述标签；
样本：样本是数据实例、特征的集合。样本可以带标签，也可以不带标签。带标签的样本用于模型的训练，不带标签的样本用于模型的预测。

问题8：什么是特征归一化？

对特征进行归一化处理，是为了消除数据特征之间的量纲影响，让不同指标之间具有可比性。例如，分析一个人的身高和体重对健康的影响，如果使用米（m）和千克（kg）作为单位，那么身高特征会在 1.5 ~ 2.0m 的数据范围内，体重特征会在 50 ~ 100kg 的范围内，分析出来的结果显然会倾向于数值差别比较大的体重特征。

所以，为了得到更为准确的结果，我们需要对它们进行特征归一化处理，让每个指标处于同一数值量级。常用方法主要有两种：

线性函数归一化：归一化后特征值 = (原值 - 特征最小值) / (特征最大值 - 特征最小值)，在此方法的基础上，所有的特征值都会落在 [0, 1] 的区间里；
标准差正态分布：归一化后特征值 = 特征平均值 / 特征标准差，使用此方法，转换后的特征有负有正，而且它们的均值为 0。

关于项目流程

问题9：AI 产品 PRD 文档与传统产品 PRD 的不同

AI 产品 PRD 文档与传统产品 PRD 的不同主要有以下三方面的不同：

第一，模型输出。

即算法目标，你要解决的是一个分类问题还是一个回归问题（输出是一个概率还是一个连续值）。

如果是一个概率值，并且是用在分类场景中的，你还要确定是否需要进行二次加工，比如在做高潜用户预测，模型输出的是一个概率值，但这个概率值在业务场景无法使用，所以还需要映射成具体的用户等级。

第二，数据接入。

是否有数据依赖，注明已接入的数据，包括数据类型（Hive / MQ），数据量大小，更新频率，Hive表名及格式。

第三，验收标准。

除了如 KS、AUC 等强模型指标的确定。另外还要以目标为导向编写 PRD 的验收标准，不要拘泥形式。

举个例子，在推荐系统的排序环节中，产品经理要以目标为导向将模型的评估指标写到 PRD 中。如果产品是以提高 CTR（点击率）为目标，就可以使用 CTR 作为衡量排序模型的指标。但在电商场景中，还存在 CVR、GMV、UV 等多个核心指标，所以并不是一个 CTR 指标就能决定的。这个时候，产品经理就要根据业务目标来优化排序模型的验收标准，如果公司追求的是 GMV，只单纯提升 CTR ，在一定程度上只能代表着用户体验的提升。

但算法工程师对这些点的考虑就会相对比较少，因为他们只对模型负责，不对产品负责。因此，这正是产品经理体现个人 PRD 的价值的好时机。

问答题

假如，你现在是一家电商平台的产品经理，负责点评系统的产品设计，现在有一个需求是要通过计算将海量评论中的垃圾评论（如，打广告的情况）过滤出来，你会怎么思考和设计产品呢？

好了，以上就是我们这次期中答疑的全部内容。我也希望这是一次我们共同交流和讨论的时间，你可以在这节课后把你的疑问分享给我，我会尽力帮助你扫清疑问，好让你赶上进度，顺利进入下一段征程！

精选留言（10）

珊羽 👍（31） 💬（0）
看了一眼评论，我觉得大部分人都陷入了技术思维，我个人认为这个问题应该要从产品经理的视角来思考，从整个产品设计流程来看，模型选择只是其中的一部分，而不是产品经理关注的全部。 1、产品目标：过滤垃圾评论 2、具体需求：通过算法模型来找出垃圾评论，并过滤掉 3、算法（这部分可以与算法同学沟通）（1）定义目标变量：即是否垃圾评论（2）定义垃圾评论：即什么是垃圾评论，如广告？（3）算法选型：这个问题本质上是个分类问题，可以通过聚类算法对评论进行分类，找出垃圾评论（4）确定样本：选定一部分数据，如果是有监督的学习需进行标注，如果是无监督学习则不需要标注，这里要根据算法同学最终选定的模型来定（5）训练模型（6）验证模型 4、系统工程侧的开发任务：即模型的运用，模型上线后，工程侧的同学如何通过模型过滤垃圾评论 5、核心指标：即算法最终要达成的目标
2021-03-17

悠悠 👍（8） 💬（0）
1、用聚类算法将海量的评论进行分类； 2、对分类的评论进行标注，是否为垃圾评论； 3、用朴素贝叶斯训练模型。
2021-01-18

悠悠 👍（3） 💬（1）
期待后面的项目，希望能转成功
2021-01-18

王小玥 👍（2） 💬（0）
“产品经理决定做一个事情的出发点，是通过技术来实现业务价值，有时候技术如何做反而不重要” “产品经理需要的是知识的广度，需要打通上下游与横向部门” 这两句话说的深有感触。
2023-03-20

阿小 👍（1） 💬（0）
首先，业务需求沟通，1）明确垃圾评论的定义、是否有初步的分类想法，是否有关键词规则等；是否有数据标注？判定可容忍的误差范围等。2）过滤后是否需要处置？3）周期有多长？其次，明确业务的分类目标和项目周期后，和算法同学进行沟通，就实际数据情况、业务效果预期进行算法设计讨论、例如如果是有标注的二分类问题可以用TextCNN、无标注则考虑用K- Means等，当然文本类数据需要做命名实体识别等处理。同工程化产品研发的同学讨论实际分类后的处置实现，例如如果期望基于某个分类自动回复等。接着，在算法同学出来算法预研方案后制定产品计划，跟进产品、算法研发进度。最后，验收模型、产品，发版。
2021-04-07

BAYBREEZE 👍（1） 💬（0）
我看到这些算法，和数据挖掘的算法是一样的，让我差点把AI与数据挖掘搞混了。请问老师，机器学习和数据挖掘的区别是什么呢，都是一样的算法情况下，还有哪些区别？望回复
2021-01-21

Geek_27fa97 👍（0） 💬（0）
可以加您微信吗
2025-02-10

哈雷 👍（0） 💬（0）
1、核心需求：过滤垃圾评论 2、业务沟通（与业务小伙伴具体沟通）：哪些评论属于垃圾评论，确定需求边界 3、算法预研（与算法小伙伴具体沟通）：说清需求，需求边界，界定预期结果，算法选型。 4、数据清洗和样本选择（与算法小伙伴具体沟通，需业务部门配合）：根据需求，确定特征工程，并建立样本。 5、训练模型 6、验证模型 7、场景回归测试（a/b测试或人工测试） 8、发布上线 9、跟踪效果并迭代
2024-04-02

Pale Blue 👍（0） 💬（0）
假如，你现在是一家电商平台的产品经理，负责点评系统的产品设计，现在有一个需求是要通过计算将海量评论中的垃圾评论（如，打广告的情况）过滤出来，你会怎么思考和设计产品呢？ 1. 目标：过滤垃圾评论 2. 用算法模型过滤掉垃圾评论 3.实现步骤：（1）定义垃圾评论（2）数据处理阶段：针对评论文本数据进行处理，进行分词->计算词权重->去掉停用词(https://baike.baidu.com/item/tf-idf/8816134?fr=aladdin) （3）使用朴素贝叶斯分类器，并且进行训练（4）验证分类模型
2021-09-21

Yesss! 👍（0） 💬（0）
首先考虑的是：项目周期是否紧张、相关算法资源是否充足。我假设这里是以节省成本以最优法进行解释： 1、这是一个分类问题 2、可以用我学过的 k-means 算法进行分类。随意采取几个质心 - 计算每个数据点与质心的距离 -均值作为下一个质心的位置 - 新质心与老质心距离不再变化或小于某一个阈值。结束算法。筛选出文本聚类选择k-means原因：运算效率高、可解释性强、容易实现、大部分聚类都能解决 3、使用朴素贝叶斯算法（适合垃圾评论分类）-查看了悠悠的评论选择朴素贝叶碎算法原因：算法资源占用不高、构建模型快。评论属于互相独立性比较高的数据
2021-01-31