天才一秒记住【热天中文网】地址:https://www.rtzw.net
顾清舟写下了这四个字。
这是亚马逊用来卖书的逻辑。
但在社交网络里,它更有效。
“假设用户a喜欢看美女、豪车和科技新闻。
用户b也喜欢看美女和豪车。”
“那么,当用户a给一张新的iphone照点了赞时,我们就可以大胆地推测——用户b也可能喜欢这张照片。”
“即使b从来没看过科技新闻。”
大卫的眼睛亮了一下,但隨即又黯淡下去:“这个理论我知道。
但在海量数据下,计算量太大了。
我们要实时计算几百万用户之间的相似度?伺服器会烧掉的。”
【记住全网最快小説站101看书网超顺畅,????????????.??????隨时看】
“降维。”
顾清舟在坐標轴上画了几个圆圈。
“我们不需要计算每个人。
我们把人变成『向量。”
“给每个用户打標籤。
比如:美妆、极客、摄影、美食、宠物……”
“用户a不再是用户a,他是一个向量:美妆:0.1,极客:0.9,摄影:0.5。”
“我们只需要计算向量之间的夹角。
夹角越小,这两个人越像。”
“然后,把那个像的人看过的东西,推给他。”
大卫盯著白板上的那个坐標轴,脑海里仿佛有一道闪电划过。
作为数学家,他习惯了追求精確解。
但在商业应用里,有时候“模糊的正確”
比“精確的错误”
更有价值。
“向量化……”
大卫喃喃自语,“这確实能极大地降低计算量。
我们可以把用户的行为日誌离线处理,生成用户画像向量,然后在线上实时匹配內容向量。”
“可是,还有一个问题。”
大卫推了推眼镜,指出了关键,“冷启动。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!