大数据产品经理需要掌握的技能（必备的12个技能分享）

日期：2022-10-31 作者：info 移动：http://mip.ourb2b.com/news/242859.html

核心提示：AI大数据产品经理至少要会以下三个方面的技能。第一、懂数据懂数据首先是懂 1）数据工程的内容例如：采集、存储、清洗、分析、可视化。其次是懂 2）数据库的基本概念数据库和数据表，CURD操作：Create、Update、Read、Delete，关系型数据库，非关系型数据库等。 3）数据的结构例如：地铁数据，静态数据：线路、站点（不一定有时间戳，更新慢），动态数据：刷卡记录（必有时间戳，不...

AI大至少要会以下三个方面的技能。

第一、懂数据

懂数据首先是懂

1）数据工程的内容

例如：采集、存储、清洗、分析、可视化。

其次是懂

2）数据库的基本概念

数据库和数据表，CURD操作：Create、Update、Read、Delete，关系型数据库，非关系型数据库等。

3）数据的结构

例如：地铁数据，静态数据：线路、站点（不一定有时间戳，更新慢），动态数据：刷卡记录（必有时间戳，不断产生），数据存放有一定的规则。

4）数据的类型格式

TXT：纯文本

CSV：逗号分隔值

JSON：键值对

SQL：数据库文件等

第二、懂AI机器学习领域

AI的得以突破发展一方面是因为数据量的爆发式增长，另外一方面得益于机器学习，尤其是深度学习算法的发展。

1）什么是机器学习

研究如何通过计算的手段，利用经验来改善系统自身的性能，通俗来讲，让代码学着干活即为机器学习，而深度学习是机器学习的特例。

2）机器学习的种类

有监督学习：提供标签，分类、回归

无监督学习：无标签，聚类

增强学习：也称强化学习，马尔科夫决策过程（Markov Decision Processes，MDP）

主动学习：边学习边标注

迁移学习：从一个域（Domain）迁移（Transfer）到另一个域

集成学习：Ensemble，三个臭皮匠赛个诸葛亮，Boosting和Bagging

3）机器学习两大痛点

维度灾难：数据量和特征数

过拟合：模型泛化能力

4）机器学习的流程

预处理：数据重塑、缺失值处理（补全、统计为缺失特征）

特征工程：特征没做好，参数调到老。在已有的特征上生成新的特征，数值、类别

特征选择、降维：基于MIC、Pearson相关系数、正则化方法、模型，PCA、tSNE

训练模型、调参：单模型，多模型融合，集成

评估模型：正确率（Acurracy）、准确值（Pecision）、召回值（Recall）、F值、AUC

懂以上机器学习的相关内容视为入门了AI大经理。

第三、懂数据且能进行AI产品化应用以构建机器学习用户画像产品为例

什么叫懂数据处理且能够进行AI产品化应用呢，下面笔者LineLian一构建用户画像实现大数据机器学习推荐为例来讲综合运用数据、算法和算力的步骤。

（第一步）：建模

1）获取原始数据。例如用到的数据有用户访问系统的行为日志和用户的基本属性，通过采集日志数据，得到用户的行为信息；

2）对数据进行预处理，挖掘出事实标签。对用户数据进行过滤、清洗、简化表示，从用户的基本属性信息可以得到用户的编号、等级、名称、第一次登录时间等，这些信息属于事实标签；

3）分析用户行为信息，构建用户画像的模型标签。通过对用户的行为进行分析，得到用户访问页面和操作的规律，构建出用户的行为模型；

4）通过模型标签进行预测，完善用户画像。根据用户的行为模型可以预测出用户的操作行为。

（第二步）：多维度刻画用户画像

1）：自然属性，比如：用户注册时填写的姓名、性别、年龄、邮箱、电话、职业等。不同属性用户感兴趣的点不同，标签一般比较稳定。

2）：兴趣属性，行为偏好信息，不同时间偏好不同，随时而变！偏好标签挖掘算法有TF-IDF和BM25算法等

3）：地理信息，移动轨迹信息，不同区域用户访问不同服务器

4）：主机IP、MAC地址、不同浏览器等，通过IP地址可以找到用户所在的区域

5）：隐含属性指从用户的基本信息、行为信息等数据中发掘出用户信息中隐含的规律或偏好。例如从用户上线的频率计算出用户的活跃等级，活跃等级可以反映出用户对系统的粘性。

（第三步）：标签

MECE（Mutually Exclusive Collective Exhaustive）原则，即标签需要彼此独立且详尽无遗。

（1）用户需求和使用场景会不断的更新，所以标签体系是一个不断完善的过程，不可能一次性建立完成；

（2）不同领域的用户需求和业务场景不同，用户画像的标签系统也不同。关键是要从不同层面更透彻地分析特定领域用户的决策行为。建立标签系统时，应根据具体业务情况进行切实分析；

（3）根据具体需求合理划分标签的体系结构，一般需要让标签体系有结构框架，呈现出一定的层级关系便于标签管理，也可以增加标签间的联系。

标签体系结构三种：结构化、半结构化、非结构化

事实标签和模型标签举例对标题按体系划分

（第四步）映射用户画像

数据-用户标签映射

用户画像方法是数据-用户标签映射方法，它是以数据来驱动用户画像的生成。

(第五步) ：评估模型

产品经理怎么评估用户画像模型好坏呢？建议从以下几个方面

用户画像评估指标包括：准确性、覆盖范围、及时性、可解释性和可扩展性等。

（第六步）数据可视化

与用户交互过程可视化，数据可视化不仅是统计图表，基本上可以通过图形显示的任何数据、文本、原理、逻辑和法则都可以称为数据可视化。数据可视化具有交互、多维和可见特征。用户画像可视化后图如下所示：

(AI逆潮增长)

免责声明:大数据产品经理需要掌握的技能（必备的12个技能分享）来源于互联网,如有侵权请通知我们删除！
本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请通过网站留言/举报反馈，本站将立刻删除!

标签： 数据产品,数据产品经理

更多>同类行业

推荐图文

最新发布

网站首页 | 网站地图 | 网站留言 | RSS订阅 | 违规举报