阿里云
发表主题 回复主题
  • 4424阅读
  • 4回复

[新浪微博互动预测大赛]重复博文问题只有博文ID不同

级别: 新人
发帖
7
云币
16
— 本帖被 管理员柳璃 从 天池竞赛 移动到本区(2016-05-03) —
训练数据中,有些用户在同一天发了多条重复的博闻(可能图片没有重复),
但是为什么只有排在前面(只是给的数据的第一行)是有转评赞数量的,排在下面的重复博文均为000(并不是那些垃圾广告之类的博文)
是不是应该把转评赞数量统一,
如果要预测的数据也是这规律,怎么办啊.
难道把第一次出现的重复博文进行转评赞数量预测,后面如果再出现,就直接扔掉(预测为0,0,0),
级别: 菜鸟
发帖
50
云币
76
只看该作者 沙发  发表于: 2015-09-07
回楼主rooboo的帖子
我也注意到了这个现象,我初步猜测是因为重复的微博是用户自己删除的结果,他只保留了最后一份。

【自己猜测的,未证实】
级别: 新人
发帖
3
云币
4
只看该作者 板凳  发表于: 2015-09-10
Re重复博文问题只有博文ID不同
一个用户同一天发了N条重复微博,后面重发的全是000 应该不奇怪吧,这是很正常的现象啊。
级别: 新人
发帖
2
云币
2
只看该作者 地板  发表于: 2015-09-11
Re重复博文问题只有博文ID不同
同样发现这个问题,预测数据里面也是有重复的,官方有给回复吗?
发帖
4
云币
4
只看该作者 4楼 发表于: 2015-09-16
这个是正常的,可能是发帖人点了几次发送,导致同一个帖子发了几次,而用户可能只会对第一个帖子进行评论。
发表主题 回复主题
« 返回列表上一主题下一主题

限100 字节
如果您提交过一次失败了,可以用”恢复数据”来恢复帖子内容
 
验证问题: 11 - 3 = ?
上一个 下一个