手机浏览器扫描二维码访问
而且这痕迹里,往往带着很浓重的个人特色。
汇报人员继续说:“然后我们根据这四万个id,逐一在微博上进行了搜索,然后爬取了这些用户名的所有的发言,再利用这些用户动态的相似性,进行深度挖掘。”
这是个极大的工作量。
一个id在微博上有可能有成千上万个同名的账号。
这些帐号的动态内容都得爬下来(这不违法,在地球上,好像是在2017年12月份,微博才关闭了api接口的。)。
爬下来之后还得对这些id曾经发布的动态和内容进行关键词提取、照片信息提取,然后存档。
注意哦,这只是一个id的工作量。
比如说有一个人在豆半上注册了一个帐号叫张三,你按照这个名字在微博上搜索,结果出现了一万个叫张三。
那这些张三的人的所有的动态都得爬下来。
可是你怎么知道这一万个张三里面,哪一个是你想要的呢。
豆半的工作人员坚信昨晚这些人肯定是有相似性的,比如他们都是某一个人的粉丝。
那么他们的发言里一定会提到同样的东西。
这个时候就要再拿出来一个新的id,比如李四。
利用李四这个id,在微博上进行搜索,又出来一万个李四。
照例,全给爬取下来。
接下来是王五、赵六
然后再进行横向比对,一个个的去试!
总能试出来蛛丝马迹。
这个工作量是无比巨大的,对计算机的要求也很高。
这种情况下,豆半只能增加人手,外聘公司。
只是过去的这一夜,花了至少上千万。
但是这是目前为止豆半唯一的方法了。
其实还有一个方法,那就是豆半后台有这些新注册的人绑定的电话号码,如果他们拿着这些电话号码去找微博,在微博数据库里直接用电话号码查找的话,基本上一两个小时就能解决。
但是,这违法。
不同平台不可以把彼此的数据互通有无。
然而,豆半还真是高估了这些小粉丝们的水平了。
到第二天中午的时候,工作人员兴奋地跑来找北总:“北总!结果出来了!”
北总已经一夜没睡了。
听到这话,整个人从椅子上弹了起来。
“快给我看!我倒要看看是哪个王八蛋,胆大包天!”一向温和的北总,破天荒的骂人了。
工作人员拿来电脑,指着一个叫“和尘同光”的id说道:“北总你看这个人,这是昨天参与打分的那些人其中的一个,我们用这个id在微博上进行了搜索,最后锁定了一个微博用户,这是她的用户主页。”
点进去。
北总的眼睛眯了起来。
和尘同光。
2014年5月6号:“尘宝真是太帅了!”
2014年8月13号:“尘宝最新代言的卫生巾,暖暖的很贴心。”
2015年1月12号:“尘宝都当导师了,虽然许坤也很帅,但是尘宝你依然是我的唯一”
2015年1月18号:“尘宝上歌王了,狗日的方澈,凤凰传奇居然是他!怎么哪都有他。”
北总的眼睛亮起来:“这是孙逸尘的粉丝?”
工作人员笃定地说道:“像她这样的帐号,我们筛选出来4781个!”
简介江司明突然发现,自己玩的绝地求生跟别人的不一样!他能在游戏里找到各种颜色的碎片,合成后能变成技能属性才艺金钱古董甚至丹药功法等等各色逆天...
武将铁血铸军魂,文谋风云炼丹心。蝶恋红颜泣幽冥,武镇天下挽天倾。崛起于隋末唐初,铸军魂,炼丹心。立足武道,以武撼仙,咆哮在多朝并立的奇异世界。会秦皇,斗曹操,谋刘贼,战项羽,挑吕布,争天下,镇压各族文明,闯荡各个朝代,誓与天骄试比高,武镇苍生!这就是武道天下!...
废武魂蓝银草?变异的都只有05级先天魂力??还是有缺陷的!?我还好,还好,哥熟读原作何以自救,唯有截胡,唐门大师兄就是我!小三,你的挂,我预定了!又名,出门遭雷劈的我被雷劈就变强哥不是好人,机缘在哪我在哪我真不是曹老板!已完本两本斗罗同人,没有魂技的我,砍翻斗罗人在斗罗,善抱大腿,欢迎试毒!...
公子不愧是正义表率!风华绝代,儒雅随和,嫉恶如仇,不好女色!天不生公子,正道万古如长夜!世人皆感慨。别夸!不要再夸我了!本公子不想正义,本...
预收九十年代修仙日常上将军现代生活录古穿今乐璇万万没想到,她一觉醒来,变成了一只还没睁眼的小猫咪。还是品种猫,叫什么东北金渐层。特别名贵,全国上下也就几百只。唉,算了,既来之则安之。难...
这个世界上总有人要扮演反派角色而他,乐意效劳...