重回05,从校内网开始狂卷!
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第68章 时间杀手&多维数据+算法碾压!(求追读!Orz~)

张智东也没怎么意外几人的反应。

因为今天下午,他在解析悠米社区此次更新的时候,也是众人现在这副不可思议的表情。

“另外,极光科技敢放出如此全面的用户信息,而不担心信息泄露,必然已经建立起一套严密的数据安全与合规体系。”

说实话,现阶段的互联网公司,不论国内外,都不怎么重视用户信息安全问题。

很明显的一个现象。

这时候还没有“用户须知”、“隐私政策”这些告知功能。

只有用户点了“我同意”,平台才算是与用户达成授权原则,合规合法的获取并利用用户信息。

直到12年,国内才首次明确,未经用户同意,不得收集、使用个人信息的原则。

阿美利加也差不多在同期,推出了类似的法案。

也因此,现阶段,几乎所有互联网公司,都在肆无忌惮的以售卖用户信息的方式盈利。

仅有阿美利加极少数互联网巨头,会以较为简单的方式告知用户。

究其根本,这时候很少有人能意识到其中的价值。

企鹅意识到了,但他们没有高效处理这些数据的能力。

相较于悠米社区,他们手上的数据更加驳杂,至少有30%用户资料虚假,“清洗”起来自然也更加困难。

悠米社区此番转型开放平台,同步推出“用户须知”,估计也是为了规避一些可能会有的麻烦,也可能是监管部门的要求。

毕竟,极光科技是要在明面上,大规模向开发者提供用户信息。

哪怕是为了提防同行的针对,也要提前做好应对措施。

但说实话,除了脑残,还真没人敢在这方面搞事情。

一方面是因为,张智东验证过,通过悠米社区提供的API接口,调用数据时,系统会自动模糊敏感字段,以保护用户隐私。

并且运用了某种高强度加密算法,抗破解性极强,几乎无法被攻破。

在“用户须知”中,极光科技还表明,已成立“伦理委员会”,由复旦法学院教授领衔,定期进行数据审查,确保所有数据使用场景合规合法。

虽然没有用户会注意,但很显然,极光科技已经提前准备好了多重护身符。

另一方面,正如上面所提到的,几乎所有互联网公司,在这方面的吃相,都比极光科技难看得多。

真要有人敢在这上面找事儿,极光科技直接捅破这层窗户纸,所有人都得吃瘪。

极光科技甚至还可能,借此会成为唯一一朵白莲花。

按照他们之前的行事风格,真有可能会干出这种事儿。

小马哥眉头皱得越来越紧。

极光科技给他的感觉很糟糕。

技术实力强劲,怪招层出不穷,行事风格却又格外缜密,处处料敌先机,完全不像是一家初创公司。

更糟糕的是,这家公司的主攻方向还是社交领域。

即便体量还小,但已然让他嗅到了威胁的气息。

然而,这还没完。

张智东继续抛炸弹。

“还有一项我认为需要马上集中攻关的技术,那就是悠米社区的‘内容推荐机制’。”

光嘴上说不够明显,张智东直接操作起电脑。

其余三人不自觉的坐正身子,聚精会神看着他现场演示。

通过下面研发人员的个人信息和邮箱,张智东注册了两个新账号,一男一女。

女生兴趣标签选择电影、美食、萌宠、美妆,地理位置选择京城HD区。

男生兴趣标签选择音乐、篮球、数码、游戏,地理位置选择深市南山区。

注册完成,张智东将两个账号的首页,一左一右投屏在屏幕之上,翻看“新鲜事”版块中的内容。

几人惊讶的发现,两个账号主页推送的信息差异极大。

差不多有近半信息,跟之前选择的兴趣标签相关,剩下的则是当前热点新闻资讯。

将三人的表情尽收眼底,张智东解释道:“其实,在转型开放平台之前,校内网就已经在试运行这种个性化推送算法,只不过还不像现在这么精准。”

“我们的研发部门,也已经在攻关了,只不过暂时还没有太大的收获。”

“而这次更新之后,这套算法发生了质变,极光科技似乎在其中引入了注意力机制,会动态分配不同用户行为的权重,并实时更新推荐结果。”

张智东边说边演示,在男生账号多次搜索“考研资料”,并对搜索到的内容点赞、评论。

女生账号则是搜索“瑜伽”,进行相同的操作。

随后返回首页,继续翻看“新鲜事”。

差不多五分钟过后,小马哥三人眼中的疑惑,逐渐变为惊讶,然后是震惊。

因为男生账号的首页,竟然出现了教育类内容,其中有一条还是深市大学的讲座信息。

而这位男生选择的地理位置,正是深市!

女生的账号,则是推送了瑜伽、健身等相关信息。

看着屏幕中的那位,脸型很像“嫩牛五方”的不知名女明星的健身自拍照,前不算秃后很翘,小马哥却完全无心观赏,一拍桌子。

“马上跟进!”

这种内容推荐算法,简直就是“用户时间杀手”!

他甚至都生出了一种,以这套算法为核心,把QQ门户彻底改头换面的想法。

再换个角度,如果把这套算法,用在广告精准推送上呢?

那广告费不得直接起飞喽!

刘驰平也想到了这点,心头有些火热:“研发部那边进展怎么样,需要多久能攻破这套算法?”

“半年,一年,或者两年。”张智东也给不出准确的时间,但不妨碍他先浇灭他们急功近利的幻想。

首先是技术难度。

目前,行业内主流的推荐模型是“协同过滤”,每日离线计算,次日更新推荐内容。

企鹅也是如此。

而极光科技的推荐模型,是基于注意力机制的混合模型,并且可进行动态行为捕捉,五分钟内更新推荐结果。

之前谁也没见过这么离谱的推荐模型,极光科技还采取了加密、混淆等多种技术手段,保护算法的核心逻辑,完全无法窥探算法全貌。

并且,想都不用想,极光科技绝对申请了专利。

光是技术摸索,就不知要耗去多少时间。

另一方面,则是数据维度的差距。

极光科技手上掌握着2000+标签的用户信息,覆盖消费、学习、社交等诸多场景,并且有着极强的数据处理能力。

甚至还可以借用交大的超算。

也因此,极光科技可以十分高效的验证、训练模型。

而他们企鹅手上,只掌握着100+标签的用户信息。

由于匿名的关系,即便他们能仿照对方的数据采集维度,也无法保障信息的真实性。

这代表着,他们不仅训练模型的难度更高,技术水平相等的情况下,推荐的准确性也必然不如对方。

很无奈,但这却是现实。

他们被极光科技以多维数据+算法碾压了。。