网络社群发现算法挖掘bilibili视频流量数据可视化|附代码数据

2周前 (11-13 04:07)阅读1回复0
wsygfsj
wsygfsj
  • 管理员
  • 注册排名5
  • 经验值70025
  • 级别管理员
  • 主题14005
  • 回复0
楼主

全文链接:

最新研究表白,中国有超越7亿人在看看在线视频内容。Bilibili,被称为哔哩哔哩或简称为B站,是中国大陆第二个弹幕视频网站,更大的年轻人潮水文化娱乐社区,截至2020年3月31日的第一季度它已经拥有超越1.7亿的月度用户,反映了许多人认为的该行业令人目炫缭乱的将来 。

第1节

热门话题和分区

B站用户日渐成熟,二次元、和游戏成为支流分区;视频量排名前三的别离是生活类、游戏类。此中动画类的分区大多和鬼畜、动漫热门话题相关,那是B站的特色。

图表1

电子竞技和游戏区的相关的热点话题是游戏讲解,包罗讲解、实况等关键词。能够认为“电竞”、“短片”(动画)那几个分区是B站的强项,必然要重点存眷。

“短片·一分钟”(动画区的子分区)话题为第三话题,意味着有趣的短片遍及会遭到欢送。我们看到比来大品牌也有在动画区做短片了。

“东方”、“翻唱”那些特色小分区话题也值得存眷。

第2节

视频播放量和分区、话题

我们按照播放量总共分为332,332-925,925-2176,2176-6171,61715个区间。

图表2

播放量整体仍是大量的沉没视频,播放量小于332的到达了整体视频的45.6%,而播放量6171以上的只占到6.9%,根据“二八原则”,视频到达2176以上的播放量即到达B站视频现实效用的边界。

能够看到游戏分区的视频播放量差别明显,收集游戏在播放量小于925的区间最多,电子竞技在小于332的区间最多,播放量越高的区间,呈现越少。同时能够看到高播放量的游戏视频大多在混剪视频话题下。生活”和“游戏”两个区远远领先,占了大大都的流量,其它各区构成长尾。“生活”那个区占好比此之高,也是因为跟着B站内容逐步普通化,它里面曾经的小类酿成了大类,好比“美食”、“搞笑”如许的子分区现实上是大类。

第3节

从联系关系收集中发现Up主社团

颁发弹幕、投币、评论等,自己就有一种实时互动,完成实在其实在的、间接的互动。网站会按照用户的点击量停止视频选举,参与强烈热闹讨论的视频会呈现在主页,受寡能最快时间地看到页面。

图表3

通过那些信息,我们能够用收集社群发现算法发掘发现受欢送的视频up主类型。

通过关于当前时间段热门排名TOP100中弹幕停止阐发,将数据停止可视化处置,得到最热词汇,既能够晓得在那一时间段收集言论流行的大致趋向,掌握用户心里立场,加强受寡的互动反应。还能够激发用户关于弹幕文化的摸索的兴致。使得用户连结别致度,耽误软件寿命。

能够看出根本上播放量根本是长尾数据,有大量的小数值的数据,但是整体的均匀值受极值的影响较大。

从案例成果来看,所有的B站up主被大致分为4个类别。 类别1:该部门up主收躲数高于均匀值,遭到看寡的喜欢,但评论和投币较低,仍有潜力;该类别大部门为业余up主,处于生长期。 类别2:该部门播放量占了30%,是高播放量群体;与看寡的互动优良;收躲、投币和分享高;该类up主粉丝数目也大部门超越十万,可以供给高量量且不变的视频稿件,为该分区的高价值up主群体。 类别3:该类此外弹幕高于均匀值,证明与看寡的互动率高;评论、收躲优良。 类别4:该部门up主评论数高于均匀值,证明话题性也较高,但弹幕和投币、收躲较低,申明需要进步视频稿件的量量,创做契合看寡口味的视频。

本文章中的所有信息(包罗但不限于阐发、推测、建议、数据、图表等内容)仅供参考,拓端数据(tecdat)不因文章的全数或部门内容产生的或因本文章而引致的任何缺失承担任何责任。

点击文末 “阅读原文”

获取全文完全代码数据材料。

本文选自《bilibili视频流量数据潜看镜》。

点击题目查阅往期内容

数据看察“双十一”网购新常态数据解锁职场女性潜力数据视域下藏书楼话题感情阐发游记数据感知旅游目标地形象

数据类岗位需求的数据面数据度量消费贷款—消费者的考虑因素

已迁离北京外来生齿的数据画像数据探析期刊文章研究热点

疫情下的新闻数据看察

疫情下的在线教学数据看

机票折扣数据解密

数据掌握片子市场需求

掌握出租车行驶的数据脉搏

共享汽车数据印象

解读出租房市场的数据密码

0
回帖

网络社群发现算法挖掘bilibili视频流量数据可视化|附代码数据 期待您的回复!

取消