你好,我是海丰。
我们在看大厂或者独角兽企业招聘信息的时候,会发现他们最看重两方面:学历和经历。学历一般是看你的学校是不是名校,专业是不是对口。经历一般是看你是否在行业内的知名公司待过,有没有优秀的项目产出。这是我们进入知名互联网公司最基础的敲门砖。
那么,这是不是就意味着,普通院校出身、没有互联网大项目经验的同学就没有机会了呢?其实也不全是,这要靠一点点的“运气”,比如一些独角兽企业一直没有招到合适的人,业务老大急需要干活的人,而你又恰好在面试的时候表现很好,就很可能顺利拿到Offer。
不过,这种“运气”并不常有。因为产品经理入门的门槛比较低,所以很多企业会把招聘的门槛设在学历和经历这些硬性指标上。
看到这儿,你是不是有些气馁?难道我之前付出的努力全都白费了吗?当然不是。相比于传统产品经理,AI产品经理的处境可好太多了。 AI 产品经理有天然的稀缺性,还有专业技术加持,现阶段企业对 AI 产品经理的要求放得比较宽,毕竟目前这方面的人才还是太少了。
因此,如果你想抓住AI产品经理岗位现阶段的红利,顺利拿到Offer、进入大厂,除了要学好我们的专栏,夯实AI技术能力,面试环节也是必须要重视的。这节课,我就带你梳理一下AI产品经理面试的常见问题和应对策略。
面试官在考察候选人之前,事先都会对岗位进行定义,再决定问你哪些问题。虽然产品经理日常大多数情况下都在画原型、写文档,但面试官并不会考察这些,毕竟意义不大。
那么,在 AI 产品经理的面试过程中,面试官会从哪些角度,来观察考察候选人的哪些基本素质呢?接下来,请你把自己代入面试者的角色,和我一起来参加这场面试实战吧!
首先,欢迎你参加这次面试,请先做个自我介绍吧!说说你在上一家公司主要负责什么,你做过的最有价值的一件事是什么?
这几乎是所有面试的开场白,你一般都是怎么回答的呢?我发现经常会有面试者这么回答:“我做了大量调研工作,写了调研报告,然后画了原型图,最后产出了 PRD文档,经过评审敲定了最终的方案,然后是研发开发,产品上线之后效果还不错。”
类似这样的回答其实没有提供给我有效的信息,因为这样的工作流程不仅和其他人的一样,还没有具体的细节,体现不出来候选人的产品思维和设计能力,甚至还会让面试官感觉你的项目经历是造假的。
那我们该注意些什么呢?在介绍工作内容的时候,你要注意有逻辑、有数据、有价值。也就是说你要注意每件事情发生的前因后果,它们之间的逻辑关联,同时追求真实性,不造假。更重要的是,要更多地展示出自己对工作的认知,在讲流程化工作内容的基础上,提供一些有价值的内容,比如相关项目的数据表现等等。
下面是我给出的一个示例,你可以参考一下。
我在上一家公司主要负责的是旅游品类产品的设计,做了两个重点的项目,分别是用户留存模型和智慧营销模型。
在用户留存模型的项目中,我先基于现有留存数据和用户行为数据进行定量分析,又基于用户调研和访谈进行定性分析。然后,我对用户流失原因进行了判断,提出可能造成流失的原因,并提出了提升留存的备选方案。接着,我就和算法同学沟通各种方案的落地成本,最后进行了实验,确定各个方案的优先级,最终推进了用户留存模型产品的建设,它的数据表现是这样的……
接下来,请说说你们产品的主要竞品是谁?你认为的行业现状什么样?你对行业未来发展趋势的理解,以及你最喜欢的一款 AI 产品是什么?
这是面试官在考察一个 AI 产品经理除了作为产品功能设计者之外,对所负责产品行业的认知,是否具备一定的行业视野。一个卓越的产品经理一定是能快速讲清楚自己产品在行业中的份额、竞争力和不足,以及市场现状布局和未来走势等等。
想要回答好这些问题,你可以参考专栏第一篇章“知己知彼,AI和AI产品经理”里面的内容,别忘了一定要结合自己的行业现状。
接下来,就到了这次面试的第一个小高潮,你做过什么产品案例呢?如果我们最近遇到一个这样的问题,业务方希望我们通过 AI 预测有买花需求的用户,然后给他们发 push,你有什么好的想法吗?
这类产品案例问题一般都是招聘部门真实遇到过的问题,面试官并不会真的预期你能在几分钟给出一个完美的答案,他只是在考察你分析、拆解问题的能力,以及结构化思维逻辑的能力。
针对上面的问题,你会给出什么答案呢?如果是我作为面试官,我希望面试者能从项目建设的视角出发,思考和拆解各环节的工作,然后给出每个环节的工作内容、交付物,也就是如下的步骤:
基本上,这样的回答就可以让面试官满意了。但如果你是一名高级产品经理,我还建议你可以从业务经验出发,给出一些具有启发性的答案,这会是你的加分项。
最后,面试官会考察你一些 AI 技术问题,这和传统互联网公司的产品经理面试有很大的不同。
目前,人工智能领域的岗位细分还没有成熟,很多企业并不会设立 AI 产品这样的部门,面试官很多都是纯算法或数据出身的人,所以在考察你岗位能力的时候,很自然地就会考察你对技术掌握的深度和广度。
因此,你在准备AI产品经理面试的时候,也要对技术问题有所准备,具体来说就是你要能回答上来,算法工程师或者数据挖掘工程师的初级技术面试题。
面试官经常会问的技术问题有两类,分别是基础技术问题和算法问题。基础技术问题可能会问什么是特征清晰、数据变换、训练集、验证集、测试集?什么是过拟合、欠拟合、跨时间测试和回溯测试?机器学习的三大类应用场景是什么?算法类问题可能会问,逻辑回归和线性回归的区别是什么?什么是KNN、聚类分析、决策树模型等等。
如果你已经准备参加AI产品经理的面试了,那么我希望你能从 6 方面做好面试的准备,分别是行业知识、项目流程、基础技术、模型评估、经典算法,以及场景案例。我一共准备了20道典型的问题,把它们按照分类总结在了一张思维导图里,你可以利用它先来检测一下你各方面知识的掌握程度。
为了方便你进行验证,我把这些问题的考点、思路和参考答案都梳理在了下面,希望你能好好利用起来。
行业知识问题
问题1:你怎么看待 AI 或者人工智能行业?
考点:考察你对当前人工智能行业发展情况的了解,是否具有预判未来发展趋势和潜在机会的能力。
思路:首先,你需要从全局的角度分析你对 AI 行业现状的理解;其次,最好举一两个当前 AI 的新技术或者新应用来表达你在实时关注这个行业;最后,一定要给出你对这个行业独特的看法。
回答:我认为当前人工智能行业正在逐步从实验室走向工业界。从产业链条上看,AI 主要分为三层,最底层是芯片、云服务等组成的基础支撑层。中间是提供底层 AI 技术的技术层,比如商汤、依图等提供的图像识别技术。上层是应用层,也就是我们最常见的电商搜索推荐,教育行业的 AI 课程。
从应用场景上看,金融、安防、客服是我们目前应用十分广泛的领域。同时,其他行业也在逐步引入 AI 技术。比如好大夫在线,最近就分享了他们如何通过 AI 技术,来进行医学报告单结构化的工作。
在我看来,AI 现在的应用还远远不够,可能 3 年或 5 年之后,AI 必将成为一种基础设施,应用在各行各业,这就有点类似我们 10 年前讨论的移动互联网技术,现在绝大多数行业都离不开移动互联网,移动互联网技术已经成为了行业的基础建设了,那么 AI 大概率也会走上类似的道路。
问题2:对于业务场景,通过 AI 技术可以做哪些工作来提升用户体验?
考点:考察你对于业务场景的理解程度以及 AI 技术边界的了解。
思路:首先你需要问清楚对方的业务场景是什么,他的用户是谁,用户需要通过这个产品解决的问题是什么,然后再考虑目前的AI技术是不是可以有提升点。如果你对对方提供的业务场景不了解,也可以说你们公司或者你了解的某些业务场景,毕竟面试官不是为了套你的方案,而是为了考察你对于 AI 技术边界的了解,和你是不是具有发现需求的能力。
回答:我对您这边的业务还不太了解,不过我之前在一家线上旅游公司工作,我们的模式是直接根据用户搜索结果展示旅游产品列表。但其实我们可以根据每个商品的好评率,对其进行解析,形成一个简单的一句话评论展示在产品列表中,帮助用户进行选择,提高用户点击率。
问题3:现在市场上有哪些竞品公司,有什么优缺点?
考点:同问题 1,考察你人工智能行业发展现状的了解,以及基于你所处业务的同类 AI 竞品公司的分析能力。
思路:首先,你需要从全局的角度分析你对 AI 行业现状的理解;其次,针对你所处的行业来表达你们的产品技术和竞品的产品的定位、受众,以及优劣势等;最后,一定要给出你对所处行业独特的看法。
项目流程问题
问题4:你们的模型构建流程是怎么样的?
考点:考察你对 AI 项目构建过程的熟悉程度,类似于传统产品经理建设研发项目的过程。
思路:先回答 AI 项目从筹备到上线的全过程,比如分几个阶段,每一个阶段都有什么角色参与,每个角色需要做什么工作,他们的产出又都是什么。然后再回答 AI 产品经理的完整工作流程是什么,需要参与哪些阶段和具体的工作。
回答:具体的回答,你可以参考第 05 讲。
问题5:AI 产品经理和传统产品经理的区别是什么?
考点:考察候选人除了对通用的产品能力理解之外,是否熟悉 AI 行业、产业结构,是否了解实现目标的技术手段、算法等等。
回答:具体的回答你可以参考第 02 讲。
基础技术问题
问题6:什么是特征清洗、数据变换?
回答:数据清洗就是对数据进行清洗,去掉重复值、干扰数据,以及填充缺失值。
数据变换就是将数据处理成方便模型使用的数据形式。比如我们需要使用用户的身高作为模型特征,但是有的数据是用厘米作单位,有的数据会使用米作单位。这个时候,我们就需要使用归一化,把数据的单位统一成米或者厘米。归一化也是数据变换最主要的手段。
问题7:什么是训练集、验证集和测试集?- 回答:训练集是让机器学习的样本集合,用来拟合模型。验证集是模型训练过程中,用来对模型性能做初步的评估,用于模型参数调优。测试集是最终用来评估模型效果的。
问题8:什么是过拟合和欠拟合?
欠拟合就是偏差较大,指的是模型的预测结果和实际结果的偏差比较大,说白了就是模型预测不准。造成欠拟合的原因可能是特征少或者模型训练不足。过拟合就是方差偏大,指的是模型在一部分数据上表现好,在另一部分数据上表现差。造成过拟合的原因可能是特征过多而训练集不够。
问题9:什么是跨时间测试和回溯测试?
回答:跨时间测试也叫 OOT 测试,是测量模型在时间上的稳定性。回溯测试是用过去一段时间的真实数据构造出一个模拟的环境(回溯环境),让模型在历史的那段环境中运行,得到历史某个时间点的模型结果。
一般来说,跨时间测试是在模型上线之前就应该要做的事情。回溯测试是指模型已经存在并已经上线了,想要看模型在历史某个时间点的数据表现时候,进行的测试。
问题10:机器学习的三大类应用场景都是什么?
回答:三大类应用场景分别是分类问题、回归问题、聚类问题。
分类问题又可以分解成二分类问题和多分类问题。二分类问题的预测结果只有两个离散的值,如“是/否””1⁄0”。多分类问题的预测结果是多个离散的值,如“A、B、 C”。
回归问题的预测的结果是连续的值,如房价的预测、库存的预测。聚类问题是无监督学习,将相似的样本归类在一起,如细分客户、新闻聚类。
模型评估问题
问题11:你怎么评估模型的好坏?
考点:考察你模型评估指标的掌握程度,回答时要说明模型评估的三个部分:统计性、模型性能和模型稳定性。
回答:模型评估的好坏可以通过模型评估指标进行衡量,模型评估指标包括三部分,分别是统计性指标、模型性能指标和模型稳定性指标。
统计性指标指的就是模型输出结果的覆盖度、最大值、最小值、人群分布等指标。
模型的性能评价指标主要包括混淆矩阵、KS、AUC 等等。通过混淆矩阵,我们就可以得到一个模型的精确率、召回率这些指标,从而可以评估一个模型的区分能力,也可以计算得到TPR、FPR,从而计算出AUC、KS等相关指标。
回归模型的性能评价指标主要包括MAE(平均绝对误差)、MSE(均方误差)、RMSE(均方根误差)、R 方等。
模型的稳定性即判断模型输出结果,是否会随着时间推移而发生较大变化不再稳定的指标,主要使用PSI进行评估。
问题12:什么是 ROC 曲线?
回答:ROC 曲线是分类算法模型的一种评价标准,ROC 曲线的横坐标为假阳性率 FPR、纵坐标为真阳性率 TPR,计算公式为 FPR = FP / N,TRP = TP / P,其中 P 是真实的正样本数量, N 是真实的负样本数量,TP 是 P 个正样本中被分类器预测为正样本的个数,FP 是 N 个负样本中被分类器预测为负样本的个数。
以一个医院诊断病人为例,假设有 10 位疑似感染患者,其中 3 位很不幸诊断阳性(P = 3),另外 7 位诊断阴性(N = 7),对于诊断阳性的 3 位患者,其中有 2 位确实是真正的患者(TP = 2)。那么真阳性率 TPR = TP / P = 2/3,对于 7 位诊断阴性的患病者来说,也很不幸误诊了一位患者(FP = 1),那么假阴性率 FPR = FP / N = 1/7。
对于分类器来说,这组分类结果就对应 ROC 曲线上的一个点 (1⁄7, 2⁄3),最后,由分类器计算出来的多个点组成 ROC 曲线。
问题13:什么是 AUC ?
回答:AUC 指的是 ROC 曲线下的面积大小,它能够量化地反映出基于 ROC 曲线的模型性能,AUC 的取值一般在 0.5 ~ 1 之间,AUC 越大,说明分类器性能越好。
经典算法问题
问题14:逻辑回归相比于线性回归,有什么区别?
考点:考察候选人对于线性回归和逻辑回归的理解。
回答:首先,它们最主要的区别是:逻辑回归解决的是分类问题,预测属于某类的概率;线性回归解决的是回归问题,预测一个连续变量(如降水量,价格等)。
线性回归使用的是最小化平方误差损失函数,对偏离真实值越远的数据惩罚越严重,容易受到异常值影响。逻辑回归是一种减小预测范围的函数,它将预测值限定为[0,1]间,不容易受到异常值的影响。
问题15:你能介绍一下 KNN 的原理吗?
回答:KNN 核心原理可以理解为“近朱者赤近墨者黑”,即基于距离的一个简单分类算法。在数据量不多,并且特征都相对单一的业务场景下,很适合选择 KNN 算法(详细内容见 09 讲)。
问题16:你能介绍一下聚类分析吗?
回答:聚类分析属于无监督算法,是按照个体的特征将数据分类,让同一个类别内的个体之间具有较高的相似度,不同类别之间具有较大的差异性。
K-means 算法是机器学习领域中处理无监督学习最流行、经典的聚类分析方法之一。它是典型的基于距离的聚类算法,采用距离作为相似性的评价指标,待测样本点距离聚类中心的距离越近,它的相似度就越大(详细内容见第 15 讲) 。
问题17:你能介绍一下决策树模型吗?
回答:随机森林的原理可以理解为“三个臭皮匠赛过诸葛亮”,特点是具有树形结构,可解释性强,直观好理解,而且还可以从结果向上去追溯原因。采用决策树可以更方便地向老板、业务方,或者甲方去解释模型是什么。
比如在金融风控场景下,我们经常通过决策树判断用户的违约风险。决策树在预测用户违约案例上的核心思想是,先获取部分用户的历史数据,历史数据包括过去的信贷数据和还款结果,然后将贷款客户不断进行分类,直到某个节点的样本用户都是同一个类型为止。最后,再对决策树进行剪枝,简化树的复杂度(详细内容见 13 讲)。
场景案例问题
问题18:请举例说明如何设计一个推荐类的产品。
考点:考察候选人对推荐类产品的召回、排序、调整各阶段的理解。在回答推荐类产品设计问题时,要明确每个阶段的基本策略和工作内容,最好还要了解相关经典算法或模型,比如召回阶段的协同过滤,以及排序阶段的 CTR 预估(详细内容见第 23 讲)。
问题19:请举例说明如何设计一个预测类的产品。
考点:考察候选人对于预测类产品场景化的落地经验。
思路:首先,根据应用场景不同,这类需求可以分为分类任务和回归任务,比如用户复购模型预测就是分类任务,而酒店价格预测就是回归任务。
其次就是产品经理要站在业务场景下,阐述推进 AI 产品建设的全过程,从数据准备到模型构建,再到模型验收,以及部署上线,各环节产品经理需要参与的工作,以及工作内容和评价标准(详细内容见第 27 讲)。
问题20:请举例说明如何设计一个自然语言类的产品。
考点:考察候选人对于 NLP 的理解,这个问题面试官会基于具体的场景来考察候选人,比如,如何设计一个对用户评论分析挖掘的产品。
如果是基于这样的场景提问,候选人要先说明 NLP 能做什么,然后再回答其中涉及的具体工作,比如评论挖掘就会涉及用户情感分析、用户标签挖掘、用户评论相似度分析,以及评分质量打分等等(详细内容见第 29 讲)。
如果你真的参加了一场 AI 产品经理的面试,你觉得自己的核心竞争力是什么?
期待在留言区看到你的故事,我们下节课见!