
第68章 时间杀手&多维数据+算法碾压!(求追读!Orz~)
张智东也没怎么意外几人的反应。
因为今天下午,他在解析悠米社区此次更新的时候,也是众人现在这副不可思议的表情。
“另外,极光科技敢放出如此全面的用户信息,而不担心信息泄露,必然已经建立起一套严密的数据安全与合规体系。”
说实话,现阶段的互联网公司,不论国内外,都不怎么重视用户信息安全问题。
很明显的一个现象。
这时候还没有“用户须知”、“隐私政策”这些告知功能。
只有用户点了“我同意”,平台才算是与用户达成授权原则,合规合法的获取并利用用户信息。
直到12年,国内才首次明确,未经用户同意,不得收集、使用个人信息的原则。
阿美利加也差不多在同期,推出了类似的法案。
也因此,现阶段,几乎所有互联网公司,都在肆无忌惮的以售卖用户信息的方式盈利。
仅有阿美利加极少数互联网巨头,会以较为简单的方式告知用户。
究其根本,这时候很少有人能意识到其中的价值。
企鹅意识到了,但他们没有高效处理这些数据的能力。
相较于悠米社区,他们手上的数据更加驳杂,至少有30%用户资料虚假,“清洗”起来自然也更加困难。
悠米社区此番转型开放平台,同步推出“用户须知”,估计也是为了规避一些可能会有的麻烦,也可能是监管部门的要求。
毕竟,极光科技是要在明面上,大规模向开发者提供用户信息。
哪怕是为了提防同行的针对,也要提前做好应对措施。
但说实话,除了脑残,还真没人敢在这方面搞事情。
一方面是因为,张智东验证过,通过悠米社区提供的API接口,调用数据时,系统会自动模糊敏感字段,以保护用户隐私。
并且运用了某种高强度加密算法,抗破解性极强,几乎无法被攻破。
在“用户须知”中,极光科技还表明,已成立“伦理委员会”,由复旦法学院教授领衔,定期进行数据审查,确保所有数据使用场景合规合法。
虽然没有用户会注意,但很显然,极光科技已经提前准备好了多重护身符。
另一方面,正如上面所提到的,几乎所有互联网公司,在这方面的吃相,都比极光科技难看得多。
真要有人敢在这上面找事儿,极光科技直接捅破这层窗户纸,所有人都得吃瘪。
极光科技甚至还可能,借此会成为唯一一朵白莲花。
按照他们之前的行事风格,真有可能会干出这种事儿。
小马哥眉头皱得越来越紧。
极光科技给他的感觉很糟糕。
技术实力强劲,怪招层出不穷,行事风格却又格外缜密,处处料敌先机,完全不像是一家初创公司。
更糟糕的是,这家公司的主攻方向还是社交领域。
即便体量还小,但已然让他嗅到了威胁的气息。
然而,这还没完。
张智东继续抛炸弹。
“还有一项我认为需要马上集中攻关的技术,那就是悠米社区的‘内容推荐机制’。”
光嘴上说不够明显,张智东直接操作起电脑。
其余三人不自觉的坐正身子,聚精会神看着他现场演示。
通过下面研发人员的个人信息和邮箱,张智东注册了两个新账号,一男一女。
女生兴趣标签选择电影、美食、萌宠、美妆,地理位置选择京城HD区。
男生兴趣标签选择音乐、篮球、数码、游戏,地理位置选择深市南山区。
注册完成,张智东将两个账号的首页,一左一右投屏在屏幕之上,翻看“新鲜事”版块中的内容。
几人惊讶的发现,两个账号主页推送的信息差异极大。
差不多有近半信息,跟之前选择的兴趣标签相关,剩下的则是当前热点新闻资讯。
将三人的表情尽收眼底,张智东解释道:“其实,在转型开放平台之前,校内网就已经在试运行这种个性化推送算法,只不过还不像现在这么精准。”
“我们的研发部门,也已经在攻关了,只不过暂时还没有太大的收获。”
“而这次更新之后,这套算法发生了质变,极光科技似乎在其中引入了注意力机制,会动态分配不同用户行为的权重,并实时更新推荐结果。”
张智东边说边演示,在男生账号多次搜索“考研资料”,并对搜索到的内容点赞、评论。
女生账号则是搜索“瑜伽”,进行相同的操作。
随后返回首页,继续翻看“新鲜事”。
差不多五分钟过后,小马哥三人眼中的疑惑,逐渐变为惊讶,然后是震惊。
因为男生账号的首页,竟然出现了教育类内容,其中有一条还是深市大学的讲座信息。
而这位男生选择的地理位置,正是深市!
女生的账号,则是推送了瑜伽、健身等相关信息。
看着屏幕中的那位,脸型很像“嫩牛五方”的不知名女明星的健身自拍照,前不算秃后很翘,小马哥却完全无心观赏,一拍桌子。
“马上跟进!”
这种内容推荐算法,简直就是“用户时间杀手”!
他甚至都生出了一种,以这套算法为核心,把QQ门户彻底改头换面的想法。
再换个角度,如果把这套算法,用在广告精准推送上呢?
那广告费不得直接起飞喽!
刘驰平也想到了这点,心头有些火热:“研发部那边进展怎么样,需要多久能攻破这套算法?”
“半年,一年,或者两年。”张智东也给不出准确的时间,但不妨碍他先浇灭他们急功近利的幻想。
首先是技术难度。
目前,行业内主流的推荐模型是“协同过滤”,每日离线计算,次日更新推荐内容。
企鹅也是如此。
而极光科技的推荐模型,是基于注意力机制的混合模型,并且可进行动态行为捕捉,五分钟内更新推荐结果。
之前谁也没见过这么离谱的推荐模型,极光科技还采取了加密、混淆等多种技术手段,保护算法的核心逻辑,完全无法窥探算法全貌。
并且,想都不用想,极光科技绝对申请了专利。
光是技术摸索,就不知要耗去多少时间。
另一方面,则是数据维度的差距。
极光科技手上掌握着2000+标签的用户信息,覆盖消费、学习、社交等诸多场景,并且有着极强的数据处理能力。
甚至还可以借用交大的超算。
也因此,极光科技可以十分高效的验证、训练模型。
而他们企鹅手上,只掌握着100+标签的用户信息。
由于匿名的关系,即便他们能仿照对方的数据采集维度,也无法保障信息的真实性。
这代表着,他们不仅训练模型的难度更高,技术水平相等的情况下,推荐的准确性也必然不如对方。
很无奈,但这却是现实。
他们被极光科技以多维数据+算法碾压了。。