欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程资源 > 编程问答 >内容正文

编程问答

OA(part2)--Outlier Evaluation Techniques

发布时间:2023/12/19 编程问答 56 豆豆
生活随笔 收集整理的这篇文章主要介绍了 OA(part2)--Outlier Evaluation Techniques 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

学习笔记,仅供参考,有错必纠
机翻,建议看英文原著


Outlier Evaluation Techniques


一个关键的问题是如何评估离群点检测算法的有效性。不幸的是,这通常是一项困难的任务,因为根据定义,异常值很少。这意味着将数据点标记为异常值或非异常值通常是不可用的。对于无监督算法来说尤其如此,因为如果基本事实确实可用,它可以用来创建更有效的有监督算法。在无监督的情况下(没有基本事实),通常很难以严格的方式判断底层算法的有效性。因此,许多研究文献使用案例研究来提供对无监督场景中潜在异常值的直观定性评估。


在像数据聚类这样的其他无监督问题中,一种常见的方法是使用内部有效性度量,其中使用“好”的模型来度量算法的有效性。例如,数据聚类中的一个常见的好的度量是聚类的均方半径。这些措施的主要问题在于,它们仅仅提供了一个概念,即“善”的模型与学习的模型匹配得有多好。毕竟,在无监督的问题中,没有办法知道善的“正确”模型;矛盾的是,如果我们知道这个正确的模型,那么我们应该在算法中使用它,而不是用于评估。事实上,通过选择一个与优度模型相关的算法来博弈这样的内部有效性模型相对容易;这个问题在聚类领域是众所周知的[33]。这也称为内部评价中的过拟合问题。在离群点检测中,这个问题要严重得多,因为离群点标签中的少量变化会极大地影响性能。例如,与线性(例如,基于主成分分析)技术相比,基于距离的内部测量更倾向于基于距离的算法。相反,内部有效性的线性模型更倾向于基于主成分分析的技术ÿ

总结

以上是生活随笔为你收集整理的OA(part2)--Outlier Evaluation Techniques的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。