从算法原理,看推荐策略
基于内容的协同过滤算法,最首要的低级步调是通过度词技能对问题和简介等举办处理赏罚,形成特性标签。譬喻,对付图书和影戏而言,可以对名称和简介举办特性词提取,从而构建特性向量;虽然,在豆瓣上发明可以用一种更省事的要领,就是让用户举办对作谈论价时必要勾选相干的标签,这样只要为差异种类提供足够多的标签供用户选择即可(虽然这是我猜的); 而假如对付音乐的保举呢?没有相干简介,歌名也不具备足够的指向性,这种环境下则可以通过音乐自己的种别来作为标签举办特性向量的构建,譬喻:民谣、摇滚、怀旧等;我猜这也是网易云音乐回收的一种保举方法吧。 而对付36氪之类的资讯网站,回收什么样的保举算法也可以或许有必然水平的领略了吧,道理都是相同的。 基于内容的保举因为不必要太多的惯性数据,因此可以部门办理冷启动题目和风行性毛病,也就是补充了协同过滤算法中的部门不敷,因此也可以将两者殽杂起来行使,譬喻殽杂保举算法就是回收了这样的方法;其次,必要留意的是,假如纯真行使基于内容的过滤算法,会呈现太过专业化题目,导致保举列表内里呈现的大多都是统一类对象,有的小搭档也许也调查到了相同的征象,好比在亚马逊上购置哪本书(好比java相干的),会发明保举的书本里满是java相干的,就是由于呈现了太过专业化的征象。 结语保举算法的道理着实基于数学的道理获得办理(向量、余弦相似度等),着实其他种种也同理,都是可在数学的基本上获得思绪和衍生,如用来举办情绪判定的朴实贝叶斯算法,就是将人才气领略的情绪题目转化成了根基的概率题目而获得办理,包罗天然说话处理赏罚(NLP)和语音辨认等,由此真是可以领会到数学的博大博识啊。 作为一名低级产物汪而言,从算法道理角度领略一些现实题目照旧很有辅佐的,虽然详细上手层面还必要开拓同窗的大力大举帮忙。 关于文中对保举算法的领略和揣摩,如有不敷之处接待指教~ 文章作者系 @Mr_yang 未经容许,榨取转载。 (编辑:厦门网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |