巧用呆板进修定位云处事器妨碍
1.妨碍分级:将妨碍分别品级,如一级妨碍(硬件妨碍-软件妨碍),二级妨碍为硬件妨碍下更详细的妨碍范例。当直接对全部二级妨碍做分类结果不抱负时,可先思量对一级妨碍做分类,再对二级妨碍做分类,实现妨碍分级的结果。 2.数据不服衡:即差异类此外妨碍工单在数目级上纷歧致,数据量上相差较大,使得分类模子方向于数目多的妨碍。思量到妨碍工单数据不服衡的题目,可思量将数量少的归总为一类——其他类。示譬喻下,九分类题目可被转化为四分类题目。可是,在工单数目严峻不服衡并且妨碍种别多的环境下,这种归总少类样本为其他类的要领,使得模子分类结果具有较大的随机性。 ![]() 3.多字特性词:道理即将文本内容按字节约举办巨细为N的滑动窗口操纵,形生长度为N的字节片断序列,以自动发生多字特性词。对比于分隔存在,几个单词的持续呈现也许会有发生纷歧样的意义,对分类发生影响。 4.布尔权重:CPU产生妨碍时,CPU多核妨碍和单核妨碍属于统一类,但多核妨碍会记录每一个核的环境,导致某些要害词可能名目一再呈现,使得模子对付两者的相似性低落。此时,可思量行使布尔权重取代tf-idf举办文本向量化。 后续 因为文天职类涵盖的内容较多,本文尽也许从简出发,叙述母机日记说明的概略流程,以及工程实践上的办理方案,以供交换。对付文天职类特性选择,模子参数调优和数据不服衡的更为具体的办理要领,笔者将在后续跟进。 以上内容基于roganhuang(黄荣庚) 在演习时代事变的总结。感激运营开拓组的小搭档们的辅佐,感激学长@simbazhou,导师@lelandwu和学姐@mengnizhang给以的指导和辅佐。 笔者鄙人。若有错误,接待指正! 参考链接 1.https://blog.csdn.net/zrc199021/article/details/53728499 2.https://blog.csdn.net/sangyongjia/article/details/52440063 3.http://www.ruanyifeng.com/blog/2013/03/tf-idf.html 4.https://blog.csdn.net/lxg0807/article/details/52776183?fps=1&locationNum=10 5.https://blog.csdn.net/wangongxi/article/details/51591031 6.https://blog.csdn.net/wangongxi/article/details/51591031 【编辑保举】
点赞 0 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |