《hadoop进阶》PeopleRank从交际相关中发掘代价用户
发布时间:2021-03-07 16:16:33 所属栏目:大数据 来源:网络整理
导读:转载请注明出处: 转载自? Thinkgamer的CSDN博客: blog.csdn.net/gamer_gyt 代码下载地点:点击查察 1:PageRank 与 PeopleRank 2:需求说明:发掘CSDN博客的代价用户 3:算法模子:PeopleRank算法 4:架构计划:从数据筹备到PR算法的MR化 5:措施开拓:had
package pagerankjisuan; import java.text.DecimalFormat; import java.util.HashMap; import java.util.Map; /* * 调治函数 */ public class prjob { public static final String HDFS = "hdfs://127.0.0.1:9000"; public static void main(String[] args) { Map <String,String> path= new HashMap<String,String>(); path.put("page","/home/thinkgamer/MyCode/hadoop/MyItems/pagerankjisuan/people.csv"); path.put("pr","/home/thinkgamer/MyCode/hadoop/MyItems/pagerankjisuan/peoplerank.txt"); path.put("input",HDFS + "/mr/blog_analysic_system/people"); // HDFS的目次 path.put("input_pr",HDFS + "/mr/blog_analysic_system/pr"); // pr存储目次 path.put("tmp1",HDFS + "/mr/blog_analysic_system/tmp1"); // 姑且目次,存放连接矩阵 path.put("tmp2",HDFS + "/mr/blog_analysic_system/tmp2"); // 姑且目次,计较到得PR,包围input_pr path.put("result",HDFS + "/mr/blog_analysic_system/result"); // 计较功效的PR path.put("sort",HDFS + "/mr/blog_analysic_system/sort"); //最终排序输出的功效 try { dataEtl.main(); prMatrix.main(path); int iter = 3; // 迭代次数 for (int i = 0; i < iter; i++) { prJisuan.main(path); } prNormal.main(path); prSort.main(path); } catch (Exception e) { e.printStackTrace(); } System.exit(0); } public static String scaleFloat(float f) {// 保存6位小数 DecimalFormat df = new DecimalFormat("##0.000000"); return df.format(f); } } prSort.java (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |