自训练的概念及其与半监督学习的联系

WBOY
发布: 2024-01-23 17:15:05
转载
540 人浏览过

自训练的概念及其与半监督学习的联系

自训练是一种半监督分类方法,包括平滑度和聚类假设。因此,它也被称为自标记或决策导向学习。

通常,当标记的数据集包含大量关于数据生成过程的信息,并且未标记的样本仅用于微调算法时,自训练是一个不错的选择。

然而,当这些条件不满足时,自训练的结果就不理想。因此自训练在很大程度上取决于标记样本。

自训练的每一步会根据当前决策函数对未标记数据进行标记,并使用预测进行重新训练。

自训练的工作原理

自训练算法以拟合另一个先前学习的监督模型预测的伪标签。

自训练有这几个关键点

数据实例分为训练集和测试集,分类算法训练在标记训练数据上。评估数据点,使用置信向量表示预测结果。

2、选择与最大置信度相关的前K个值并将其添加到标记数据集中。

3、分类器预测标记测试数据实例的类别标签,并使用选择的指标评估分类器性能。

4、分类器使用新的标记数据集重新训练。

自训练利用标记数据集的结构来发现合适的分离超曲面。在这个过程之后,对未标记的样本进行评估,并将具有足够大置信度的分类点包含在新的训练集中,自训练算法会重复这个过程,直到每个数据点都被分类。

以上是自训练的概念及其与半监督学习的联系的详细内容。更多信息请关注PHP中文网其他相关文章!

相关标签:
来源:163.com
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!