找出机器注册名字
有100万个用户名,尽可能筛选出机器自动生成的用户名。换句话说,怎么尽可能多找出微博上机器自动产生的用户名。
1. 将100万个用户名按照字符训练一个语言模型,用这个语言模型对100万个用户名计算得分,得分较低者可以认为是自动产生的用户名。
2. 如果能获得用户对应的个人信息,就可以通过观察个人信息是否完整,有没有转发或者评论,上线次数
总结
- 上一篇: c语言中realloc()函数解析
- 下一篇: 蒙提霍尔问题
有100万个用户名,尽可能筛选出机器自动生成的用户名。换句话说,怎么尽可能多找出微博上机器自动产生的用户名。
1. 将100万个用户名按照字符训练一个语言模型,用这个语言模型对100万个用户名计算得分,得分较低者可以认为是自动产生的用户名。
2. 如果能获得用户对应的个人信息,就可以通过观察个人信息是否完整,有没有转发或者评论,上线次数