上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

第68章时间杀手＆多维数据+算法碾压！（求追读！Orz~）

张智东也没怎么意外几人的反应。

因为今天下午，他在解析悠米社区此次更新的时候，也是众人现在这副不可思议的表情。

“另外，极光科技敢放出如此全面的用户信息，而不担心信息泄露，必然已经建立起一套严密的数据安全与合规体系。”

说实话，现阶段的互联网公司，不论国内外，都不怎么重视用户信息安全问题。

很明显的一个现象。

这时候还没有“用户须知”、“隐私政策”这些告知功能。

只有用户点了“我同意”，平台才算是与用户达成授权原则，合规合法的获取并利用用户信息。

直到12年，国内才首次明确，未经用户同意，不得收集、使用个人信息的原则。

阿美利加也差不多在同期，推出了类似的法案。

也因此，现阶段，几乎所有互联网公司，都在肆无忌惮的以售卖用户信息的方式盈利。

仅有阿美利加极少数互联网巨头，会以较为简单的方式告知用户。

究其根本，这时候很少有人能意识到其中的价值。

企鹅意识到了，但他们没有高效处理这些数据的能力。

相较于悠米社区，他们手上的数据更加驳杂，至少有30%用户资料虚假，“清洗”起来自然也更加困难。

悠米社区此番转型开放平台，同步推出“用户须知”，估计也是为了规避一些可能会有的麻烦，也可能是监管部门的要求。

毕竟，极光科技是要在明面上，大规模向开发者提供用户信息。

哪怕是为了提防同行的针对，也要提前做好应对措施。

但说实话，除了脑残，还真没人敢在这方面搞事情。

一方面是因为，张智东验证过，通过悠米社区提供的API接口，调用数据时，系统会自动模糊敏感字段，以保护用户隐私。

并且运用了某种高强度加密算法，抗破解性极强，几乎无法被攻破。

在“用户须知”中，极光科技还表明，已成立“伦理委员会”，由复旦法学院教授领衔，定期进行数据审查，确保所有数据使用场景合规合法。

虽然没有用户会注意，但很显然，极光科技已经提前准备好了多重护身符。

另一方面，正如上面所提到的，几乎所有互联网公司，在这方面的吃相，都比极光科技难看得多。

真要有人敢在这上面找事儿，极光科技直接捅破这层窗户纸，所有人都得吃瘪。

极光科技甚至还可能，借此会成为唯一一朵白莲花。

按照他们之前的行事风格，真有可能会干出这种事儿。

小马哥眉头皱得越来越紧。

极光科技给他的感觉很糟糕。

技术实力强劲，怪招层出不穷，行事风格却又格外缜密，处处料敌先机，完全不像是一家初创公司。

更糟糕的是，这家公司的主攻方向还是社交领域。

即便体量还小，但已然让他嗅到了威胁的气息。

然而，这还没完。

张智东继续抛炸弹。

“还有一项我认为需要马上集中攻关的技术，那就是悠米社区的‘内容推荐机制’。”

光嘴上说不够明显，张智东直接操作起电脑。

其余三人不自觉的坐正身子，聚精会神看着他现场演示。

通过下面研发人员的个人信息和邮箱，张智东注册了两个新账号，一男一女。

女生兴趣标签选择电影、美食、萌宠、美妆，地理位置选择京城HD区。

男生兴趣标签选择音乐、篮球、数码、游戏，地理位置选择深市南山区。

注册完成，张智东将两个账号的首页，一左一右投屏在屏幕之上，翻看“新鲜事”版块中的内容。

几人惊讶的发现，两个账号主页推送的信息差异极大。

差不多有近半信息，跟之前选择的兴趣标签相关，剩下的则是当前热点新闻资讯。

将三人的表情尽收眼底，张智东解释道：“其实，在转型开放平台之前，校内网就已经在试运行这种个性化推送算法，只不过还不像现在这么精准。”

“我们的研发部门，也已经在攻关了，只不过暂时还没有太大的收获。”

“而这次更新之后，这套算法发生了质变，极光科技似乎在其中引入了注意力机制，会动态分配不同用户行为的权重，并实时更新推荐结果。”

张智东边说边演示，在男生账号多次搜索“考研资料”，并对搜索到的内容点赞、评论。

女生账号则是搜索“瑜伽”，进行相同的操作。

随后返回首页，继续翻看“新鲜事”。

差不多五分钟过后，小马哥三人眼中的疑惑，逐渐变为惊讶，然后是震惊。

因为男生账号的首页，竟然出现了教育类内容，其中有一条还是深市大学的讲座信息。

而这位男生选择的地理位置，正是深市！

女生的账号，则是推送了瑜伽、健身等相关信息。

看着屏幕中的那位，脸型很像“嫩牛五方”的不知名女明星的健身自拍照，前不算秃后很翘，小马哥却完全无心观赏，一拍桌子。

“马上跟进！”

这种内容推荐算法，简直就是“用户时间杀手”！

他甚至都生出了一种，以这套算法为核心，把QQ门户彻底改头换面的想法。

再换个角度，如果把这套算法，用在广告精准推送上呢？

那广告费不得直接起飞喽！

刘驰平也想到了这点，心头有些火热：“研发部那边进展怎么样，需要多久能攻破这套算法？”

“半年，一年，或者两年。”张智东也给不出准确的时间，但不妨碍他先浇灭他们急功近利的幻想。

首先是技术难度。

目前，行业内主流的推荐模型是“协同过滤”，每日离线计算，次日更新推荐内容。

企鹅也是如此。

而极光科技的推荐模型，是基于注意力机制的混合模型，并且可进行动态行为捕捉，五分钟内更新推荐结果。

之前谁也没见过这么离谱的推荐模型，极光科技还采取了加密、混淆等多种技术手段，保护算法的核心逻辑，完全无法窥探算法全貌。

并且，想都不用想，极光科技绝对申请了专利。

光是技术摸索，就不知要耗去多少时间。

另一方面，则是数据维度的差距。

极光科技手上掌握着2000+标签的用户信息，覆盖消费、学习、社交等诸多场景，并且有着极强的数据处理能力。

甚至还可以借用交大的超算。

也因此，极光科技可以十分高效的验证、训练模型。

而他们企鹅手上，只掌握着100+标签的用户信息。

由于匿名的关系，即便他们能仿照对方的数据采集维度，也无法保障信息的真实性。

这代表着，他们不仅训练模型的难度更高，技术水平相等的情况下，推荐的准确性也必然不如对方。

很无奈，但这却是现实。

他们被极光科技以多维数据+算法碾压了。。

第68章 时间杀手＆多维数据+算法碾压！（求追读！Orz~）

第68章时间杀手＆多维数据+算法碾压！（求追读！Orz~）