欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程资源 > 编程问答 >内容正文

编程问答

大v用户数据统计分析

发布时间:2024/9/5 编程问答 39 如意码农
生活随笔 收集整理的这篇文章主要介绍了 大v用户数据统计分析 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

1,统计数据的基本情况,包括微博总数,用户总数,最活跃和最不活跃的用户id

#!/bin/sh
source_dir=/home/minelab/data/DATA
source_file_name=userinfo_00_au_1_out
source_file=$source_dir/$source_file_name
#source_file=test.src
out_dir=/home/minelab/liweibo/daV out_file_name=basic_satic.txt
out_file=$out_dir/result/$out_file_name out_id_file_name=id_count.list
out_id_file=$out_dir/result/$out_id_file_name rm -rf $out_file
rm -rf $out_id_file
##进行大v用户基础数据统计###
#统计所有微博总数#
echo "#微博总数:">>$out_file
cat $source_file | wc -l >> $out_file
#统计用户总数,发布微博最多的用户和最少的用户#
cat $source_file | awk -F'\t' '{print $16}' | sort | uniq -c | sort -r -n | sed 's/^ *//g' | awk '{print $2"\
\t"$1}'> $out_id_file
echo "#用户总数:">> $out_file
wc -l $out_id_file | awk '{print $1}'>> $out_file
#统计发布微博最多的用户#
echo "#发布微博最多的用户id:">>$out_file
head -n $out_id_file >> $out_file
#统计发布微博最少的用户#
echo "#发布微博最少的用户id:">>$out_file
tail -n $out_id_file >> $out_file

大v用户基本统计脚本

总结

以上是生活随笔为你收集整理的大v用户数据统计分析的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。