洪倍:怎么用大数据玩转数字媒体

18542-1412111F306207

洪倍:其实我们讲的整个数字媒体这个生态圈其实是目前大数据整个领域可能自发玩的最火的一个领域,而且我们讲运营商数据是给整个数字媒体提供非常好的基层业务的支撑,我们看整个数字媒体生态圈有什么样的角色分工,刚刚其实有讲到媒体,各种网站就是媒体,第二个提到广告,第三个就是受众,电信用户,移动用户,包括宽带的用户,也就是我们讲的访客,第四个当然是电商,那就是直销渠道。第四个是受众互动,第五个是广告推送。所以最后我们讲互联网生态圈就是五个维度上积累数据。这是我们看到的一个趋势,从1980年家里面开始普及电视,电视是单项的传播渠道,后来是互联网,首先是交互的,而且联结在一起,最后看到互联网方式越来越多了,从最开始互联网到移动概念,手机,PAD,最后大家发现又回到了原点,电视化了,上海电视通在数字电视领域已经耕耘很深。所以最后你会发现我们现在所有的受众移动盘,我们的媒体内容已经在抢占受众各种各样的时间,然后又产生各种各样的数据,这个数据让我们产生各种各样的有利于缠身各种各样的信息,所以它形成了非常好的互联网的闭环。
大家看到一个图,都在吃饭,都在玩手机。看微信,微博,包括朋友圈,公司圈,都在微信上进行沟通,所以这也是大量的数据。所以最后你会发现最近十年互联网包括移动互联网,你会发现最后死掉的是右下觉,活下来的都是黏度高的,黏度最高的是邮件活得很好,然后慢慢地新闻资讯,我们看到很多传统的纸媒,电视,都在转型,他们希望成为一个有观点的黏度状态。互联网营销方式也在改变,最早是砸大钱在电商栏目买一个好广告,投电视,慢慢地变成广告精准。还有买博士伦眼镜怎么样定义受众,同样我们看中国好声音怎么分受众,同样我们可以看到广告跟社交联动。怎么样联动?之前我们做了一个案例,一个汽车用户他有几百万的粉丝,这些用户以什么样的关系存在?以前是没有人知道的,我们用新的趋势就是显卡计算,我们知道整个人的关系网是一个什么样,是一个图,所以显卡天然的是用图计算,所以我们分析了,发现这样一个计算品牌的粉丝天然的报了18个团,里面有两个是僵尸粉的团,历史上他有两家公司加粉,一个是跟他有关系的明星代言人,被他邀请过参加试驾活动,被他邀请过参加拍摄的明星是一个粉丝团。另外一个是经销商。如果投广告的话,对这四个粉丝团不要投。所以我们剩下的可能应该是对内,剩下14个团去投广告,社交跟广告也在联动,所以这是大数据分析的比较有典型的案例。
我们再看互联网也在开始做专题活动,一些不同的季节不同的领域不同的产品做活动,他们通过数据挖掘去营销策划这个活动,明天就是双12,一个月前双11,双11就是电商平台的联动,怎么样提高转化率,我看亚信的同事提到,通过电商数据提高17%的转化率,意味着未来提高更大的170%的转化率。
这个是我们历史上跟客户做的非常经典的案例,一个是达标率,地域分布、拼刺控制、内容剧目定向。每个人看高八次以上,很多人会觉得非常烦,我相信大家看视频的时候前面几十秒广告很难受。同样的地域,是不是能够做广告,我们发现地域还是有差别,我们跟合作伙伴在考虑怎么样分析里面有多少因为路由的设置导致的错误。同样比如说这个地区没有4S店,他们就不要做广告销售。如果两个媒体用户重合度非常高的话,是不是另外一个小的媒体就可以替代掉,或者是补强的作用。
前面是媒体大数据的统计产生。这里面是微观的数据,比如说用户,我们看网站设计,从用户访问路径上来看是不是合理的,诉求是A,但是你的交互是B,所以我们通过路径方式也是一张图网,哪条路径是用户最喜欢的竖井,哪条路径是最容易实现用户购买的路径,这个是我们帮助客户提高转化效率的路径。同样的我们也发现有一个非常有趣的数据,看广告真的没有用吗?不是,我们在一些电信网站上发现看广告的用户,在看完广告后三天之后再回到电商平台购买的广告率是没有看广告的三倍。而且这个用户是忠实的老用户,而且他的流失率很低,这也是大数据挖掘出来非常有趣的一个现象。
当然这个可以未来跟很多运营商合作,运营商不会帮助虚假信息,怎么样判别?比如说亚信,可以非常方便地知道这是机器人,老是在播放,这是亚信和运营商知道的,机器人他不断地刷COOKIE,它是模拟的手段。
刚刚讲到异常数据甄别六大维度,我们看到运营商里面很多,我们作弊的时候最大的作弊就是机器人,被机器控制的人,或者叫机器人,运营商本身做安全的时候已经有了一定的模型。还有整个广告的行业更干净,让广告主愿意花更多的钱,同时为他产生更多的价值。
刚刚我们讲的都是一些冷冰冰的数字,我们发现更多的是实现价值,广告第一个是不是能够看到?在什么样的环境下被看到,视频广告跟普通原来我们看到横幅的广告最大的区别是什么?你会发现视频在空间上几乎独占,但是时间15秒,然后原来的小的按纽广告在空间不是独占,但是在时间上永远是独占。所以这两种得到的结果可能空间是存在的,但是效果完全不一样。
还有提到了副媒体。还有音频广告,最近有很多的APP开始抢到了耳朵了,眼睛已经抢了,所以一些听音乐的软件开始做了,像司马拉雅,FM,他们也是开始做广告的方式,包括今天早上看到的新闻Google已经在美国把户外的液晶屏成功可以实时定价进行投放,当然它会参照很多的参数比如说地理位置,人流量,以及周边的广告交互情况定不同的情况。
最最传统微观的就是调研,调研是什么,我们拿样本去统计,做统计指标来映射,这个我觉得是比较有趣的东西。怎么样建立更好的样本,我们讲样本最大的问题还是甄别真和假。我们认为运营商的数据天然的有人和数据,人和的分布,甚至是套餐使用情况,消费者的简单统计可以做简单的消费行为,当然简单统计之后要处理敏感数据。我们过去怎么得到这个人的收入的,现在你还用问吗,运营商发现每个月20号发短信工资已发18500,运营商完全可以知道,但是他不知道是谁。过去说你有每年看过这样的广告?这个时候有一个悖论,这次看广告是不算看广告呢?只有通过真实的监测数据,我们为广告提供看过多少次,在哪个媒体看,看的是哪个形式,通过这样的采集过程中,我们采集了200万的样本库,接下来我们会跟运营商做得更准确,覆盖更广,因为现在手机有9个月到12个月的换机周期,我们通过匿名方法把它关联起来提供一些样本的持久度。
这个是我们实际在我们这个行业里面给广告主做的品牌价值的指标,这些指标其实通过调研的方法计算出来的,当调研样本比较大的时候它其实就是一个比较大的数据量的统计了,我们有一个数据库有一个分支是几万个样本库,那个样本库差不多有十几万份,那个东西也是非常庞大的,我们看到它是非常款的一张表,分析起来需要一些工作。
这个是所有媒体对比的实时的案例。时间关系我就不讲了。
我们回到社交化,移动化,这里面有几个东西跟运营商非常有关系,运营商也都在做的,WIFI,移动,电信联通都在做的WIFI接入,最近央视又报道不要介WIFI,可能信息会被偷盗。但是用了wifi它是个网关,隐私都可以提取到。然后我们可以通过一个特定的渠道代码优惠券到使用优惠券的转化率,这个是不是够准确。同样我们设了两个条件,针对平时消费运动品的同学去卖隐性眼镜和平时去火锅的隐性眼镜,通过短信发出去的优惠券和刷卡发出去的优惠券不一样。这是直观的转化通路。同样我们广告在过去很硬,现在慢慢软化,过去说APPG内制虚拟道具,比如说某某可乐的运动表情,会搭配运动产品让用户使用,目的就是积累用户的行为,我可以针对你用户的使用记录,刚刚我们看到用户的画像。所以同样运营商我相信可以做很多这样的事情。
刚刚我们讲的是一些实际应用场景,我们的方法论。其实我这里不太想提的大家非常熟悉的东西,比如HADOOP,比如数据关联分析,数据建模,数据挖掘。你看这里面提的东西都是分析,你会发现内部舆情很重要,我们跟内部有一个共识就是广告费是一个数字,但是它前面是一个符号,正还是负很重要,如果你最近都是负面,大家看到广告结果,这就是被某个电视台曝过光的品牌。所以我们花了很多力气去做了这样一个实验室,专门做舆情分析,分几个部分,谁在哪个场合说了什么样的话跟哪个品牌有关系,表示怎么样。我们新浪微博是我们最大的合作伙伴。爬完舆情之后做情感分析,情感分析我们鉴定规则引擎,能够快速定论调主题。过去怎么做情感分析,比如某某对象很好,但是另一个牌子就有点差了,请问这句话过去情感判断判断出来什么?中性,因为有一个好字有一个差字,但是我们的引擎里面两个品牌,A品牌好,B品牌差,所以它要被拆解开,因为我们做跟传统相关的内容。同样一条好的消息或者是一条坏的消息,怎么样被转发的,转发到了多少人,它是不是覆盖到你的粉丝。最后你可以统计出一个你是好事传千里还是坏事传千里,这个取决于你最后是正还是负。大家都知道可乐,两年多都是在可乐瓶上打标签,可乐这两年瓶子是我们做的,我们把粉丝挑出300个热词,喜欢什么样的歌,喜欢什么样的自称,他们把30个比较高大上的正面的词,然后大家可以超市里面购买小清新的可乐瓶。然后他们给王力宏送了一箱可乐,王力宏自发地收到一瓶可乐,然后称为我的歌声王力宏,我用一箱可乐的成本换了几十万次的转发成功。也就是我们讲营销不仅仅是广告,很有趣,但是你要依靠数据。
这个当然是回到了最后我们讲的PRE的引擎,我们讲到了营销是广告,还有一个O字,广告主有自己的阵地,自己的网站,自己的商店,这些广告主都是自己的OD,这些OD本身没有什么流量,我们需要赚流量,刚刚讲的社交,有多少人愿意分享你,有多少人愿意晒单,它其实愿意跟你的官方网站带流,当然这里面可以唯一打标识。PC互联网COOKIE是很好的标识,运营商将来的ID是不是可以成为运营商的数字标识。如果一个家庭有多个上网帐号,多个上网帐号,你可以知道这个家庭是可以跟哪个手机绑定。通过这个标识可以在任何环境下面找到定向,因为通过标识可以分析他行为的大概画像。行为画像是有很多很多侧面,比如说这个是HQ1,回到讲人的侧面,很多数据源都能够画出一个人的侧面,但是怎么画出一个更全的侧面?这是我们今天和运营商讨论的层面。我们怎么把这些侧面融合起来,广告主自己也有一部分,因为你有可能买了广告主的东西。我们把只有这些全部融合起来,能够在对的时间,在对的场合,找到对的人说对的话。最近双11淘宝的话,会发现你搜索的东西还没买的话,会在微博和其他场合到处看到淘宝关于这部分的广告。那时候你会觉得淘宝怎么还聪明,后来多了你可能会反感。这时候你会发现如果我们能够把这些标签全部打成ID之后,有这么多的广告形式,可能都跟你的需求有关系,这个时候当然有的人很害怕,我没有隐私了,我的世界被探知了,但是你有的时候又觉得我的生活很便利,我出去的时候可能要叫车吧,这个时候会觉得有个社会小助手不断的在提醒你。
当然这个是我们广告主怎么样跟电视和互联网跨起来,未来数字化是更好的跨,当然有曲线模型和数据模型,也是基于我们很多经验挖掘,做到很好的整合。今年我们做了非常有趣的模型,叫做赞助模型。我们通过这个评估大数据的建模方法,让赞助的东西也变得更加精准,可以被评估。
所以最后我们回到说整合营销,我们讲生态链里面你会发现一个词其实很重要,刚刚我提到的,对的时间,对的地点,找对的人,说对的话。任何一个操作都是准的,同样你还能预估,我应该花多少钱,买什么样的媒体,我在电商网站怎么样备货,我产品应该怎么样设计,我针对不同的人群开发新的产品。
这是我们讲的双闭环的结果,这是广告主,你会发现大家都在这个双闭环结构中发展。一开始你发展这个产品,你需要推广这个产品,这些都是靠数据的力量来帮你提供数据决策,然后在集成过程中会帮你做二次传播,你在网络渠道销售,或者在线下销售,这个评论反馈到网上,这儿评论可以重新设计下一代产品,下一代产品可以同时做推广,再反馈,再做数据模型。如果这个环做好,就会发现这个产品不断的做下去,这个产品不会死,因为不断的有人在里面把它做更好的正向下去。今天我就说到这儿,待会儿我们有圆桌,会讨论更多实际的东西。谢谢大家!