加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

《hadoop进阶》PeopleRank从交际相关中发掘代价用户

发布时间:2021-03-07 16:16:33 所属栏目:大数据 来源:网络整理
导读:转载请注明出处: 转载自? Thinkgamer的CSDN博客: blog.csdn.net/gamer_gyt 代码下载地点:点击查察 1:PageRank 与 PeopleRank 2:需求说明:发掘CSDN博客的代价用户 3:算法模子:PeopleRank算法 4:架构计划:从数据筹备到PR算法的MR化 5:措施开拓:had

package pagerankjisuan;

import java.text.DecimalFormat;
import java.util.HashMap;
import java.util.Map;

/*
 * 调治函数
 */
public class prjob {

	public static final String  HDFS = "hdfs://127.0.0.1:9000";
	
	public static void main(String[] args) {
		Map  <String,String> path= new HashMap<String,String>();	
		
		path.put("page","/home/thinkgamer/MyCode/hadoop/MyItems/pagerankjisuan/people.csv");
		path.put("pr","/home/thinkgamer/MyCode/hadoop/MyItems/pagerankjisuan/peoplerank.txt");
		
		path.put("input",HDFS + "/mr/blog_analysic_system/people");          // HDFS的目次
        path.put("input_pr",HDFS + "/mr/blog_analysic_system/pr");       // pr存储目次
        path.put("tmp1",HDFS + "/mr/blog_analysic_system/tmp1");             // 姑且目次,存放连接矩阵
        path.put("tmp2",HDFS + "/mr/blog_analysic_system/tmp2");           // 姑且目次,计较到得PR,包围input_pr

        path.put("result",HDFS + "/mr/blog_analysic_system/result");                   // 计较功效的PR
        
        path.put("sort",HDFS +  "/mr/blog_analysic_system/sort");  //最终排序输出的功效
        
        try {
        	   dataEtl.main();
            prMatrix.main(path);
            int iter = 3;           // 迭代次数
            for (int i = 0; i < iter; i++) {
                prJisuan.main(path);
            }
           prNormal.main(path);
           prSort.main(path);

        	} catch (Exception e) {
        		e.printStackTrace();
        	}
        	System.exit(0);
    	}
	
	 	public static String scaleFloat(float f) {// 保存6位小数
	        DecimalFormat df = new DecimalFormat("##0.000000");
	        return df.format(f);
	    }
}

prSort.java

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读