加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

HBase在人工智能场景的行使

发布时间:2018-11-23 06:01:22 所属栏目:教程 来源:明惠
导读:近几年来,人工智能逐渐火热起来,出格是和大数据一路团结行使。人工智能的首要场景又包罗图像手段、语音手段、天然说话处理赏罚手段和用户画像手段等等。这些场景我们都必要处理赏罚海量的数据,处理赏罚完的数据一样平常都必要存储起来,这些数据的特点首要有如下几点:

上面 HBase 表的列簇名为c,我们行使人脸id作为列名。我们只行使了 HBase 的一张表就替代了之前线面的三张表!固然我们启用了 MOB,可是详细插入的要领和正常行使一样,代码片断如下:

  1. String CF_DEFAULT = "c"; 
  2. Put put = new Put(groupId.getBytes()); 
  3. put.addColumn(CF_DEFAULT.getBytes(),faceId1.getBytes(), feature1.getBytes()); 
  4. put.addColumn(CF_DEFAULT.getBytes(),faceId2.getBytes(), feature2.getBytes()); 
  5. …… 
  6. put.addColumn(CF_DEFAULT.getBytes(),faceIdn.getBytes(), featuren.getBytes()); 
  7. table.put(put); 

用户假如必要按照人脸组id获取全部人脸的数据,可以行使下面要领:

  1. Get get = new Get(groupId.getBytes()); 
  2. Result re=table.get(get); 

这样我们可以拿到某小我私人脸组id对应的全部人脸数据。假如必要按照人脸组id+人脸id查找某小我私人脸的详细数据,看可以行使下面要领:

  1. Get get = new Get(groupId.getBytes()); 
  2. get.addColumn(CF_DEFAULT.getBytes(), faceId1.getBytes()) 
  3. Result re=table.get(get); 

颠末上面的改革,在2台 HBase worker 节点内存为32GB,核数为8,每个节点挂载四块巨细为 250GB 的 SSD 磁盘,并写入 100W 行,每行有1W列,读取一行的时刻在100ms-500ms阁下。在每行有1000个face的环境下,读取一行的时刻根基在20-50ms阁下,对比之前的10s晋升200~500倍。

下面是各个方案的比拟机能比拟环境。

HBase在人工智能场景的行使

行使 Spark 加快数据说明

我们已经将人脸特性数据存储在阿里云 HBase 之中,这个只是数据应用的第一步,怎样将潜匿在这些数据背后的代价施展出来?这就得借助于数据说明,在这个场景就必要回收呆板进修的要领举办聚类之类的操纵。我们可以借助 Spark 对存储于 HBase 之中的数据举办说明,并且 Spark 自己支持呆板进修的。可是假如直接回收开源的 Spark 读取 HBase 中的数据,会对 HBase 自己的读写有影响的。

针对这些题目,阿里云 HBase 团队对 Spark 举办了相干优化,好比直接读取 HFile、算子下沉等;而且提供全托管的 Spark 产物,通过SQL处事ThriftServer、功课处事LivyServer简化Spark的行使等。今朝这套 Spark 的技能栈如下图所示。

HBase在人工智能场景的行使

通过 Spark 处事,我们可以和 HBase 举办很好的整合,将及时流和人脸特性发掘整合起来,整个架构图如下:

HBase在人工智能场景的行使

我们可以网络各类人脸数据源的及时数据,,颠末 Spark Streaming 举办简朴的 ETL 操纵;其次,我们通过 Spark MLib 类库对方才试试网络到的数据举办人脸特性发掘,最后发掘出来的功效存储到 HBase 之中。最后,用户可以通过会见 HBase 内里已经发掘好的人脸特性数据举办其他的应用。

【编辑保举】

  1. Accordion:HBase的 “呼吸式”内存压缩算法
  2. HBase从入门到能相关列:误删数据怎样急救?
  3. HBase高机能随机查询之道 – HFile道理理会
  4. 怎样行使HBase?大数据存储的两个实沙场景
  5. HBase相对Hive查询速率快的比拟
【责任编辑:未丽燕 TEL:(010)68476606】
点赞 0

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读