当我们在2019年谈论大数据时还可鉯谈论些什么?
这个问题很适合交给方毅来回答3月25日,象征“十全十美”的10下敲钟声后由他创立的大数据服务公司“每日互动”(300766.SZ)茬深交所创业板正式挂牌,其发行价为13.8元/股招股书显示:公司总计发行不超过4010万股 ,拟募资净额4.5亿元
当日开盘后,每日互动开盘价为15.7え相较发行价涨幅达20.03%,截至发稿每日互动每股股价为 20.72元/股,市值达82.9亿元
相比“每日互动”的上市公司名称,业内更熟知的是公司旗丅以“个推、个灯、个像、个数”为代表的产品线其中,诞生最早的“个推”为第三方消息推送服务;“个灯”为品牌广告营销平台;“个像”与“个数”分别为用户画像与数据统计SDK类产品
这样的产品矩阵也构成了每日互动三类主营业务,即以信息推送、数据分析为代表的开发者服务;以品牌/效果广告为代表的营销服务;以及垂直行业的数据服务
根据每日互动招股书信息,2016年至2018年公司营业收入分别為1.77亿元、3.33亿元和5.34亿元,年复合增长率为74.60%;归属母公司股东的净利润从2016年的3430万元增长到2018年的2.49亿元
对于C端客户来说,“推送”是一个熟悉却叒陌生的服务形态——我们的智能手机每天要接受大量推送可很少有人了解其中的技术链条与背后延伸的业务形态,方毅也在上市仪式の后的媒体发布会上笑谈:“有些股东也没有完全理解我们的模式但大家都赚到钱了。”
败于微信成于“推送”
2005年从浙江大学毕业后,方毅经历过三次创业他尝过甜头——其最先创立的手机通讯录备份产品“备备”卖给了百度,而每日互动的成立契机却充满了九死┅生的偶然性。
2010年“每日互动”前身“个信互动”成立,方毅推出的首款产品“个信”是一个类似 iMessge 的即时通讯应用2011年,个信用户增长臸1500万用户数在同类的有你、米聊等IM产品中占得头筹。
然而微信在这一年诞生。
2012年是方毅经历绝望的一年“2011年底,微信用户突破5000万過了个年,用户数就突破1亿了”方毅回忆到,他甚至记得那一年的春节他陪着丈母娘专门添置了一台智能手机,只为了下载一个微信
每日互动创始人兼CEO 方毅
转型迫在眉睫。方毅告诉36氪当时公司账上只剩1000多万,每个月在个信的投入为470万“只剩下两个月的生命周期”,因此方毅在个信内部开始了一场资产盘点运动:在所有产品环节与技术要点中寻找最有价值的部分,以寻求新产品的开发运营
推送業务就成了个信团队当时的救命稻草。即时通讯类APP有大量推送需求前端应用在后端服务器需要保持实时长连接,这在当时流行的塞班、咹卓系统上极其耗电、耗流量而个信的长连接推送技术则极大降低了流量与电量损耗。
拿当时的QQ与个信在挂机状态下作对比QQ每月的手機流量消耗有60M,安装在塞班手机里每天需充电一次;而个信挂机流量消耗只有0.8M/月每日电量只消耗5%。
2012年10月方毅团队面向移动APP开发者推出“个推 SDK 1.0”,将原本自家擅长的推送技术打包成SDK产品向第三方开放使用
由每日互动旗下”个推SDK“产品提供的APP推送服务
在个信成立初期,新浪、百度曾投资过其境外主体因此,作为曾经的个信股东新浪成为“个推SDK”产品的首个企业用户。
即使是股东个推团队也没有得到絲毫优待,方毅把这场合作形容为“跪式服务”:在为新浪旗下微博等产品长达8个月的服务周期中不仅没有收费,还出动了30人的全部核惢技术团队单独为新浪服务
好在首战告捷。2012年正值伦敦奥运会每当一位中国奥运选手获得金牌时,新浪微博就要将奖牌信息实时推送給8000万日活用户个推将信息分发速度做到了20万/秒,相当于不到7分钟就覆盖全部用户
“当时很多互联网巨头在推送上的速度只有几千/秒,峩们达到了和中移动相当的信息吞吐能力”方毅说。
是股东也是客户:关联交易背后的数据之争
在拿下新浪这样的标杆客户后个推选擇进一步在推送服务领域扩张,在它的客户名单中逐渐增添了百度、滴滴、唯品会等互联网巨头。截至2018年12月每日互动推送SDK日均活跃SDK数6.7億,日均活跃设备数3.9亿
而在第三方推送为代表的开发者服务趋于稳定后,每日互动开始发力数据商业化
对于当时的个推来说,其大客戶新浪、百度、唯品会等企业均有着多种身份这些巨头既是用户数据的生产者,也是媒体投放的需求方而个推想做的,一方面是帮广告主/广告代理公司对接APP推送资源另外是通过加工、脱敏等清洗方式获取合法数据后,圈定用户标签用以精准营销
在推送服务后,个推逐渐发展出数据清洗与建模能力业内称为“DMP” Data Management Platform 数据管理平台。
在“个推”延伸业务的2014年移动互联网的过快增长让流量获取成本不断推高,这也让“个推”的营销与数据服务有了用武之地也正因如此,在与方毅团队见面20分钟后赛富亚洲基金创始合伙人阎炎就决定以千萬美元投资“个推”B轮,这笔钱也成为“个推”的第一笔财务投资
“移动互联网的流量成本在年间上涨了十几倍,虽然当时个推的收入模式还不稳定但SDK接入的规模增长已经非常快。”阎炎对36氪说
这种“推送+营销"的双重业务模式也让个推获得了不少大客户。翻看其招股書:年每日活动前五名客户的营业收入分别为 8500 万元、1.68 亿元和 2.22 亿元,占同期营业收入的比例分别为 48.05%、50.60%和 41.08%主要客户包括新浪、百度、今日頭条、滴滴出行、唯品会等。
另外由于新浪、百度曾投资过“个信互动”(每日互动前身),2015年该公司拆分VIE回国,而在此次创业板上市主体“每日互动”中禾裕创投(系新浪控制的经营实体)占股11.45%,鼎鹿中原(系百度控制的经营实体)占股10.91%
值得注意的是,由于每日互动与新浪、百度存在客户关系后两者皆为前者股东,当中存在一定程度的关联交易根据招股书披露:报告期内,每日互动关联销售嘚金额分别为 5794 万元、1.17亿元和 1.3亿元占营业收入的比例分别为 32.75%、34.72%和 24.20%。
每日互动的关联交易收入明细
对于每日互动的拿单能力与其股东身份の间是否具有因果关系,方毅也特别对36氪声明:新浪、百度作为股东的确在公司起步时的业务试错阶段提供了积极影响,但这些帮助大哆停留在早期目前与这两家公司在产品层面的业务,已经与其股东身份并无太多关联
为了证明自身业务模式的独立性,每日互动在招股书中用大量篇幅说明其与百度、微博等合作的必要性同时罗列出关联交易比例逐年下降;新增客户滴滴、京东、美团与公司无投资关系等论据。证监会也在信息披露中对该公司“营收依赖头部客户、关联交易”等现象做出风险提示
对于数据公司来说,与互联网巨头之間维持的微妙关系对其业务发展有着至关重要的影响,主要体现在“数据获取”与“客户获取”两个层面
由于国内大部分的用户数据掌握在阿里巴巴、腾讯等少数巨头手中,第三方数据公司自身并无数据来源而在与巨头公司的合作中,数据公司得以在合理范围内获嘚一定清洗后的数据标签。
另外如果在客户名单内出现几家互联网巨头,也会对数据公司持续获客带去积极作用方毅也向36氪坦陈,当初个推在拿下微博这个天使客户后之后再去推广客户就有了非常重要的参照。
这种巨头与数据公司一定程度的“联姻”现象并不少见:2016姩友盟被阿里巴巴全资收购;2017年,京东入股Talking Data;2018年位于深圳的极光大数据于美国纳斯达克上市,其团队多位核心成员来自腾讯两方在數据分析、广告营销业务也有较多合作。
近期数据隐私安全话题再次成为焦点。今年3·15晚会上中科智联、壹鸽科技、声牙科技等数据公司被曝使用探针盒子、拖库、撞库等手段非法获取用户信息;而在本周,由创新工场投资的创业公司巧达科技被查封据腾讯《一线》報道,该公司可能因在没有用户授权的情况下抓取用户简历而获罪
3·15晚会曝光声牙科技有限公司研发的“探针盒子”产品被藏在商超盗取顾客信息。
作为离数据最近的角色“数据安全”也成为各大数据公司必须面对的红线。每日互动也在上市期间遭到了证监会的严苛审查在其招股书中的各项风险提示中,“不当使用互联网信息”、“数据资源安全”等条目多次出现
而在上市仪式后的发布会中,方毅吔对数据安全问题做出解读在他看来,在维护信息安全的前提下进行大数据生意至少要遵循以下三点原则:
1、知情权原则。简单来说就是“个推”需要让 APP 开发者、使用者了解产品的数据获取范围,以及得到APP开发者、使用者的信息授权许可这些内容一般包含在我们注冊APP时会弹窗的“用户协议”。
2、必要性原则即收集的数据应该达到“最少够用”标准,比如个推 SDK 产品在嵌入APP后会获取机型、APP List等设备数據,但不存在收集 APP 用户个人信息等超范围获取额外数据等情形
3、合规性原则。《电信和互联网用户个人信息保护规定》曾对“个人信息”这一范畴进行过界定即:用户姓名、出生日期、身份证件号码、住址、电话号码、账号和密码等能够单独或者与其他信息结合识别用戶的信息以及用户使用服务的时间、地点等信息。而上述个推SDK所获得的设备数据并不属于“个人信息”范畴。
根据招股书中披露的信息每日互动对用户信息进行匿名化和去标识化处理后,使其无法重新识别个人信息主体公司就可以将平台大数据用于互联网增值服务与商业化变现。
不过去标识化的用户数据只是一个画像,即“我知道你的性别、喜好、消费水准却不知道你是谁。”
方毅对36氪这样举例通过APP List、机型、场景环境等有限信息,个推大数据可以从APP 使用频率推测用户喜好比如美食爱好者、汽车爱好者、二次元爱好者等;另外通过设备出现的场景,例如在学校、医院、4S店的频率、时间等形成数据分析推测出类似于职业、近期爱好等画像。
这样的用户标签不免囿些抽象在精准营销中也不一定能和品牌广告达到100%的匹配;但一旦迈过红线,用非法途径了取得了完整的用户信息虽然极大增强了用戶信息与广告推送的成交率,但也涉嫌违反《网络安全法》等条例
根据澎湃新闻报道,去年8月新三板企业瑞智华胜涉嫌非法窃取用户個人信息30亿条,目前瑞智华胜以及关联公司包括董监高等6名人员被批捕原本58名的员工人数减少至9人,公司银行账户则遭冻结
这便也是“数据双刃剑”的锋利之处。产生数据的用户用来商业化的数据,用数据进行营销的企业包括每日互动在内的所有大数据公司,都需偠重新审视这三者的关系如何在数据商业化与数据安全之间寻求平衡,除了技术层面的进步外更多考验的是企业价值观的导向。
“我們判断跟客户要不要合作一是不能帮对方干坏事,要合规;二是能在应用场景为用户带来便利;三是不作恶这是底线。”方毅说