移动快排的核心
有小伙伴在群里讨论,移动快排始终搞不定,不知是ip还是cookie还是其他参数的问题。
本渣认为,百度移动快排的核心
不在于ip
不在于cookie
不在于url中的某个参数
甚至以上3个,根本就不重要
而是整个移动快排程序,能否成功应对百度移动端的「反欺诈」策略。
所以这先是个「风控问题」,在了解互联网大厂采用的一些基本的风控策略之后,程序研发的方向,才能往正确的方向倾斜。
02移动快排的难点
移动快排的难度,相比PC而言大很多。
因为在移动端:
百度识别欺诈点击的动力,比PC强的多
百度识别欺诈点击的难度,比PC容易的多
实施欺诈点击的硬件成本,比PC高的多
2015年,百度移动端的流量,已经超过PC,到现在2020年,移动端的广告业务,贡献了大部分企业利润,若外人去干扰正常搜索排名,这对企业收入有严重影响。
至于PC,PC流量不值钱嘛。
03PC端欺诈点击识别
百度PC识别欺诈点击的难点在于:无法获取用户硬件层面的数据
如果把刷点击的目标换成google,这个难度就大大增加了,google能获取大部分用户的设备数据,因为chrome全球市场占有率70%+,在中国PC端占有率60%,剩下25%是Edge和QQ浏览器,没百度什么事
所以PC上识别欺诈点击,只能从容易篡改的网络层数据(ip、cookie)和用户行为上来入手
04移动端欺诈点击识别
But,在移动端,就跟PC端的情况完全不同了。
你可能不知道,「手机百度」在移动浏览器份额一直是Top 1,在App Store和各种安卓应用市场的总榜中,也是长期Top20以内,日活2亿多。
手百在移动浏览器份额中,比PC要高多了,如果把IOS用户排除掉(IOS用Safari的很多),只看Android,那就更高了。
一个有日均搜索量的词,没有手百用户访问,是不正常的。
1)手百能拿到什么数据?
用户安装手百,默认授权
存储
电话
位置信息
后续,
用户点击语音输入,会获取「麦克风权限」
用户拍照识图,会获取「相机权限」
用户邀请好友,会获取「通讯录权限」
其实后面3个默认没开的权限,用户使用一段时间后,很有可能打开的,比如邀请好友,百度之前经常诱导的
2)识别策略
回到开头,为啥本渣认为ip、cookie不重要
我们想一个场景:
1)你用一个真机,通过手百,刷了一个点击
2)然后刷机,改了型号、串号、IMEI、ADID、SIM序列号啥的,就是XX抹机、火牛硬改之类修改的参数,换了ip、cookie、位置信息,ip还跟位置信息对应
3)然后又刷了一个点击,这个过程循环10次
百度能不能识别这10次都是同一台设备点击的?
有意思的来了,如果想识别,是可以的。
我们每次做运营活动,都能看到风控黑名单新增不少二货,就是类似上面的方式,刷机&改设备参数&换ip&换账号。
基础的风控,每次新账号登录(尤其是异地登录),都会从新抓取一下此台设备的数据,跟历史的设备数据做对比,排查是否出现「同一台设备在短时间,登录多个账号、不同地区登录等异常情况」
激活手百时授权的「存储权限」,意味百度能获取到此台设备的文件及文件夹数据
说白了,这几次账号登录对应的设备,其SD卡内所有文件夹名称、创建时间、每个文件夹下的文件名称及创建时间(排除实时变化的缓存文件),都完全一致,或高度相似
通讯录同理,同一个词,多个账号点击的设备,通讯录里的联系人都一致,也是有问题。如果为空,更有问题。
从用户行为侧,手百界面可触发的用户行为,比PC要多的多。PC就是搜索,点击网页,退出,完事。
但在手百,正常用户,在一段时间内,大部分会有浏览信息流、视频、小说等非搜索类行为发生。如果刷点击的账号,从未发生过此类行为,这可能有一定概率认为是非正常用户,重点监控。
在本渣接触的APP反欺诈系统中,会获取用户设备和行为共计几百种参数,交叉对比上千种参数组合,来计算每个用户欺诈行为的概率,是个很复杂的东西。
了解Android获取哪些数据,可翻阅Android开发者文档中关于「权限」部分,IOS也一样。但对于APP开发者,IOS能拿到的数据,比Android少一些,所以对于IOS,百度识别欺诈点击的难度,比Android高的。