新媒易动态
NEWS CENTER
NEWS CENTER
2024-01-12
为什么会出现标签?
有时分数据很简略,穷举很简略。
比方,冬奥会奖牌榜上(金牌)前三名分别是:挪威队(16枚)、德国(12枚)、我国(9枚)。
但有时分,数据许多,且咱们不想知道全部的细节。比方,只重视我国美国,这时分少废话,直接概括:我国队排前三,美国队不在前三。
许多时分,数据是离散的、无限的,或者说样本极大的时分,近乎无限。
比方,全国的的身高、体重,样本的数据就许多了,十几亿数据,怎样描绘呢?
「一览众山小」、「怎样吃都不胖」便是咱们很简略了解的描绘。
不同的标签,概括的粗细粒度不相同。
标签组合越多,概括的粒度就越细(和维度是相同的)。
许多事物,是能够被直接度量的。比方,一个板凳多长多宽多高、一个学期几个月几天、篮子里有几个鸡蛋。
可是,有的事物是没法直接度量的,比方颜值。
这时分,只能通过另外的事物去直接度量。而且,咱们要抽象和总结,去概括。
一个人很美丽,多美丽?粗暴地分两个标签:美丽,不美丽。
小李(莱昂纳多,电影《盗梦空间》的男主角)走在路上,碰到 100人, 99 人回头看他,美丽不?
另一个小李也走在路上,碰到 100个人, 1 人回头看 ta,美丽不?
多少人回头,是客观的,可是究竟漂不美丽,每个人心里都会有片面答案的。
标签也能够通过某些标签的基础上,持续划定更细区间的方式进行界说。
这个层面,标签和维度是类似的。
光讲概念,不结合数据产品的实践使用,也是没用的。所以在这个模块,我带着咱们从事务、技能两个视角来看更多的例子。
事务视角简略来说,便是给普通人描绘一件工作。咱们不要被我带坏了,问我什么是「事务」,不纠结哈。
比方,咱们看到某个新闻:A 集团本季度 GMV 增长率为 45%,发展缓慢。
公式版本:
GMV 增长率 = (本季度 GMV – 上季度 GMV) 上季度GMV
(后续用GMV代指 A 集团本季度GMV)
技能视角,则是给计算机描绘一件事。
比方,咱们要将刚刚说的规矩、共识,翻译成技能言语。
这儿,我给出伪代码版本(SQL什么的,我就不写了):gmv_growth = (cur_gmv – last_gmv )/ last_gmv 。
标签的技能界说,来源于标签的事务界说。
再来举例,标签和目标的关系。
当然,这儿的例子,仅仅是举例哈,没结合行业特性,也没说具体粒度和维度。
拿我非常了解的视频、直播来给咱们举例吧(这些例子都是虚拟的)。
随着硬件、互联网、移动网络、移动付出的发展,某视频网站 Dilidili 开端上线了。
D 站学习了其他的网站,上线的时分就开发了点赞、谈论、打赏服务。也对内容进行了划分:番剧、科技、娱乐、体育、资讯、时髦。
网站开端有了第一个UP主上传了视频,有了第一个观众,观众看完视频:留下了谈论,哇, 太实在了吧,太搞笑的吧,说的便是我吧。
数据分析师和产品司理,在上线的时分就制定了初版的目标体系,定了许多维度和目标,比方不同区域、不同品类、不同年龄段人群的观看时长、观看次数、观看人数、打赏人数等等。
大的视点,会分几个:内容供给(上传视频数、有效播放视频数、直播人数、次数等)、内容消费(观看停留时长等)、金钱消费(营收维度)
当然了,傍边的一些目标,产品司理们也会让 UP 主们在后台也能看到,以便调整自己的视频内容和方向。
后来为了精准地根据用户喜爱(用户观看前史、观看不同品类的时长、次数等目标),产品司理增加了新功能:UP主上传视频的时分能够带一些关键词,也便是给视频打标签。