sklearn 中的两个半监督标签传播算法 LabelPropagation和LabelSpreading


标签传播算法是一种半监督机器学习算法,它将标签分配给以前未标记的数据点。要在机器学习中使用这种算法,只有一小部分示例具有标签或分类。在算法的建模、拟合和预测过程中,这些标签被传播到未标记的数据点。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜


LabelPropagation

LabelPropagation是一种在图中查找社区的快速算法。它只使用网络结构作为指导来检测这些连接,不需要预定义的目标函数或关于群体的先验信息。标签传播通过在网络中传播标签并基于标签传播过程形成连接来实现。

接近的标签通常会被赋予相同的标签。单个标签可以在密集连接的节点组中占主导地位,但在稀疏连接的区域中会遇到麻烦。标签将被限制在一个紧密连接的节点组中,当算法完成时,那些最终具有相同标签的节点可以被视为同一连接的一部分。该算法使用了图论,具体如下:-

LabelPropagation算法以下列方式工作:-

  • 每个节点都使用唯一的标签进行初始化。
  • 这些标签通过网络传播。
  • 在每次传播迭代中,每个节点都会将其标签更新为最大邻居数所属的标签。
  • 当每个节点具有其邻居的多数标签时,标签传播算法达到收敛。
  • 如果达到收敛或用户定义的最大迭代次数,则标签传播算法停止。

为了演示LabelPropagation算法的工作原理,们使用 Pima Indians 的数据集,创建程序时,我导入了运行它所需的库

复制一份数据并且将lable列作为训练目标

使用matplotlib可视化:

使用随机数生成器随机化数据集中70%的标签。然后随机标签被分配-1:-

在对数据进行预处理之后,定义因变量和自变量,分别为y和X。y变量是最后一列,X变量是剩下的所有部分:-

使用sklearn的LabelPropagation数来标记所有未标记的数据点:-

准确率为发现它是76.9%。

下面我们看看另外一个算法LabelSpreading。

LabelSpreading

LabelSpreading也是一种流行的半监督学习方法。创建一个连接训练数据集中样本的图,并通过图的边缘传播已知的标签来标记未标记的示例。

LabelSpreading是由 Dengyong Zhou 等人在他们 2003 年题为“Learning with Local and Global Consistency”的论文中提出的的。半监督学习的关键是一致性的先验假设,这意味着:附近的点可能具有相同的标签,并且同一结构上的点(通常称为簇流形)很可能具有相同的标签。

LabelSpreading可以认为是LabelPropagation的正则化形式。在图论中,拉普拉斯矩阵是图的矩阵表示,拉普拉斯矩阵的公式为:

L是拉普拉斯矩阵,D是度矩阵,A是邻接矩阵。

下面是一个简单的无向图标记的例子和它拉普拉斯矩阵的结果

本文将使用sonar数据集演示如何使用sklearn的LabelSpreading函数。

这里的库比上面的多,所以简单解释一下:

  • Numpy执行数值计算并创建Numpy数组
  • Pandas处理数据
  • Sklearn执行机器学习操作
  • Matplotlib和seaborn来可视化数据,为可视化数据提供统计信息
  • Warning,用于忽略程序执行期间出现的警告

导入完成后使用pandas将读入数据集:

我使用seaborn创建了热图:-

先做一个就简单的预处理,删除具有高度相关性的列,这样将列数从 61 减少到 58:

然后对数据进行打乱重排,这样在打乱的数据集中预测通常更准确,复制一个数据集的副本,并将 y_orig 定义为训练目标:

使用matplotlib来绘制数据点的2D散点图:-

使用随机数生成器随机化数据集中60%的标签。然后随机标签被分配-1:-

在对数据进行预处理之后,定义因变量和自变量,分别为y和X。y变量是最后一列,X变量是剩下的所有部分:-

然后使用sklearn的LabelSpreading算法对未标记的行进行训练和预测。

使用这种方法,能够达到87.98%的准确率:-

简单对比

1、labelspreading中含有alpha=0.2,alpha称为夹紧系数,指的是采用其邻居的信息而不是其初始标签的相对量,若为0,表示保留初始标签信息,若为1,表示替换所有初始信息;设置alpha=0.2,意味着始终保留80%的原始标签信息;

2、labelpropagation使用从数据中构造的原始相似矩阵,不做修改;labelspreading最小化具有正则化特性的损失函数,对噪声更加稳健,迭代了原始图的修改版,并通过计算归一化拉普拉斯矩阵来标准化边权重。

3、同时LabelSpreading非常占用CPU,物理内存占用率还好;LabelPropagation 的CPU占用率还好,非常占用物理内存,高纬度数据可能会有一些问题。


# 拉普拉斯  # 是一种  # 随机数  # 分别为  # 迭代  # 在对  # 组中  # 若为  # 是一个  # 占用率 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 网络优化91478 】 【 技术知识72672 】 【 云计算0 】 【 GEO优化84317 】 【 优选文章0 】 【 营销推广36048 】 【 网络运营41350 】 【 案例网站102563 】 【 AI智能45237


相关推荐: 如何用AI一键给视频自动加字幕  Canva AI终极指南:免费AI聊天机器人,设计、视频、网站全搞定!  律师视角下的生成式AI:信息爆炸时代的法律实践与未来展望  在线歌曲歌词生成器:创意歌词轻松创作指南  AI超级英雄大乱斗:蜘蛛侠、死侍的爆笑奇幻之旅  SteosVoice:电报语音克隆终极教程  Ignite & Sell Assistant:AI 邮件营销终极指南  ClickUp AI Agents:项目管理的革命性突破  eBookWriter AI:无需写作也能创作专业电子书  通义万相IP形象设计怎么用_通义万相IP形象设计使用方法详细指南【教程】  AI赋能营销:5分钟快速生成品牌营销素材全攻略  DeepSeek AI:AI通用谜题解题器,解题思路全解析  AI工作流程详解:概念到生产的完整指南  畅游长崎:寻找宝可梦与樱花的浪漫之旅  使用 DeepSeek 进行网络协议栈分析与优化建议  Canva AI终极指南:释放AI力量,设计触手可及  五大AI视频编辑工具:提升视频创作效率和质量  雷小兔ai智能写作怎么设置写作风格_雷小兔ai智能写作风格选择方法【指南】  千问怎么使用插件功能_千问插件调用与功能扩展【教程】  网络安全警钟:揭秘“美足”背后隐藏的危机与防范  ChatGPT 4o 辅助学生复习 GRE 词汇的方法  稿定设计AI抠图怎么修复瑕疵_稿定设计AI瑕疵修复与手动微调【步骤】  Sim.AI教程:构建智能客户支持助手  AI症状自检:最佳AI症状检查器,告别网络庸医!  智行ai抢票怎样设置抢票通道_智行ai抢票通道选择与速度优化【指南】  3步教你用AI自动分类文件,整理电脑告别杂乱  AI时代设计师生存指南:职业发展、技能提升与未来趋势  Midjourney怎样生成网页图标_Midjourney图标生成教程【方法】  千问如何生成年终总结PPT_千问PPT模板选择与内容自动填充【攻略】  精明小鱼:儿童动画寓言故事及启示  百度ai助手怎么取消 百度ai助手取消显示设置  AI Agent:颠覆传统工作模式的关键力量  提升效率的AI工具:Jace、Yutori、Dia等效率神器测评  Midjourney怎样用参数调分辨率_Midjourney分辨率调整技巧【教程】  批改网AI检测工具怎么生成评分报告_批改网AI检测工具报告生成与维度解读【指南】  面试成功秘诀:如何巧妙回答常见面试问题  如何通过豆包 AI 进行每日新闻简报的个性化定制  AI如何革新心理健康诊断:从症状检查到大脑分析  终极人声移除器UVR5:AI驱动的免费开源音频处理神器  一键生成PPT工具怎么用_一键生成PPT工具使用方法详细指南【教程】  构建AI工作流:利用BuildShip低代码平台赋能Gemini和Google Cloud  2025年10月狮子座运势:事业、爱情与生活指南  普通人如何用DeepSeek月入过万?2026最新赚钱路径全解析!  批改网ai检测工具能否检测引用格式_批改网ai检测工具引用格式检查与修正提示【攻略】  Tenorshare PDNob:免费AI图像翻译器,即时转换图像为文本  播客成功的秘诀:打造高转化率的内容和社区  2025年最佳AI时间管理软件:Motion、Reclaim AI与Clockwise终极评测  ChatGPT 如何助力建筑承包商?三大实用技巧解析  股票 vs. ETF:解锁股市财富密码,新手投资完全指南  打破传统,拥抱幸福:公主如何找到真我? 

 2023-04-12

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

南京市珐之弘网络技术有限公司


南京市珐之弘网络技术有限公司

南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。

 87067657

 13565296790

 87067657@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.