论文填补了传统统计方法(如 PCFG、Markov)与深度学习方法(如 LSTM、GAN)之间的研究空白,提出基于随机森林的口令猜测框架 RFGuess,覆盖三种核心猜测场景,为口令安全研究提供了全新技术路线。

一、研究背景

        口令面临的核心威胁是猜测攻击。目前猜测攻击存在局限:传统方法存在过拟合和数据稀疏的问题;而深度学习需要大规模训练数据,训练时间长,调参复杂等问题。

二、本文研究

        可概括为 “1 条技术路线 + 3 个模型 + 1 套优化算法 + 大规模验证”

        技术路线:通过口令字符的多维度重新编码,将机器学习应用于口令猜测

        三个模型:

        ①RFGuess:针对 “漫步猜测”(无目标信息,追求破解数量);

       ② RFGuess-PII:针对 “基于个人信息(PII)的定向猜测”(利用姓名、生日等,快速破解指定用户);

        ③RFGuess-Reuse:针对 “基于口令重用的定向猜测”(利用用户旧口令,破解新口令)

        一套算法:近似最优 PII 匹配算法:改进传统 “左最长匹配” (优先匹配左侧最长 PII 片段)的局限,通过信息熵最小化选择全局最优 PII 表示,提升定向猜测成功率 7%~13%。

        大规模验证:基于 13 个真实口令数据集(共 2.41 亿条口令,含中 / 英文、普通用户 / 安全意识较高用户),验证模型在不同场景下的有效性。

三、具体实现

3.1 口令字符的多维度编码(特征工程)

        设计6 阶前缀 + 26 维特征向量(4×6+2)

        单字符 4 维特征:字符类型,类型内序号,键盘行号,键盘列号。

        额外2维长度特征:字符在整个口令中的位置,字符在当前字段的位置

3.2 场景一:漫步猜测模型:RFGuess

核心逻辑:将口令生成视为 “多分类问题”

输入:6 阶前缀的 26 维特征向量;输出:下一个字符的类别;模型:随机森林(由 30 棵 CART 决策树组成,通过 “特征随机选择 + 样本随机抽样” 避免过拟合)

步骤:

        1.训练阶段:将训练集中的每个口令拆分为 “6 阶前缀 - 下一个字符” 对(Bs作为开始符);用前缀的 26 维特征向量作为输入,下一个字符的序号作为标签,训练随机森林。

        2.生成阶段:从初始前缀(Bs×6)开始,通过随机森林预测下一个字符的概率分布;对未获投票的字符采用 “add-δ 平滑”(δ=0.001),避免概率为 0;按概率降序生成猜测,直至生成终止符 Es 或达到预设猜测数。

优势:

  • 解决 Markov 模型的数据稀疏问题:决策树会将 “相似特征的前缀” 归为同一叶节点,即使前缀未在训练集中出现,也能通过相似样本预测;
  • 自动特征筛选:随机森林通过 “Gini impurity” 选择重要特征(如字符序号、键盘列号更重要),剔除冗余特征(如键盘行号),提升训练效率。

3.3 场景2:基于PII的定向猜测模型 RFGuess-PII

本文提出通过 “信息熵最小化” 选择全局最优 PII 

步骤:

        1. PII 标签数字化:将 PII 类型(姓名、生日、用户名等)用数字标签表示

        2.枚举所有可能表示:对每个口令,列出所有可能的 PII 标签组合

        3.按频次排序与迭代选择:按表示的频次降序排序,用 R₁表示所有可匹配的口令,剩余表示的频次减 1;重复上述步骤,直至所有表示频次≤1,未匹配口令用 “最短结构” 表示;

        4.理论验证:该算法能最小化口令集的信息熵

RFGuess-PII模型

        特征适配:PII 标签用(PII 类型、PII 序号、0、0)编码

        训练:用含 PII 标签的口令集训练随机森林;

        生成:将生成的含 PII 标签的猜测,替换为目标用户的真实 PII

3.4 场景 3:基于口令重用的定向猜测模型 RFGuess-Reuse

核心逻辑:用户重用口令时,通常会进行 “结构级”和 “字段级”修改

        结构级变换:统计训练集中口令对的结构转换概率(如 “尾部插入 D₃” 的概率);

        字段级变换:用随机森林预测字段内的原子修改(插入、删除、替换)概率。

eg:旧口令 “password!!”(结构 L₈S₂)生成新口令 “p@sswor123”(结构 L₇D₃)

四、实验验证

 4.1数据集

        基础数据集:13 个真实数据集(8 个英文、5 个中文),共 2.41 亿条口令

        PII 数据集:6 个含个人信息的数据集

        口令重用数据集:8 个跨平台口令对数据集

4.2 对比方法

        漫步猜测:PCFG、3/4 阶 Markov、FLA(LSTM)、Min-auto(理想攻击,取各方法最优结果)

        定向 PII 猜测:TarGuess-I(PCFG-based)、Targeted-Markov(Markov-based)、FLA-PII(改进 FLA)

        口令重用猜测:TarGuess-II(PCFG-based)、Pass2Path(Seq2Seq-based)

通过实验证明RFGuess 框架在三种核心场景下均表现优异。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/94982.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/94982.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/94982.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

项目一系列-第9章 集成AI千帆大模型

第9章 集成AI千帆大模型 学习目标 能够说清楚健康评估模块在项目中的作用能够掌握千帆大模型的开通和对接能够掌握健康评估模块中的prompt提示词编写能够自主完成健康评估模块的接口开发 分析设计 需求说明 健康评估是指老人办理入住前需上传体检报告,由AI自动…

vben admin5组件文档(豆包版)---VbenTree

VbenTree 用法说明 VbenTree 是 Vben5 中基于 radix-vue 实现的树形组件,支持单选、多选、展开/折叠、权限控制等功能。以下是其核心用法说明: 1. 基础引入 import { VbenTree } from vben-core/shadcn-ui;2. 核心属性(Props)属性…

postman常用快捷键

作为一名IT程序猿,不懂一些工具的快捷方式,应该会被鄙视的吧。收集了一些Postman的快捷方式,大家一起动手操作~ 1小时postman接口测试从入门到精通教程简单操作 操作mac系统windows系统 打开新标签 ⌘TCtrl T关闭标签⌘WCtrl W强制关闭标签…

【物联网】什么是 DHT11(数字温湿度传感器)?

正面照片(蓝色传感器朝上,针脚朝下) 丝印标注非常清晰: 左边 → S 👉 信号 (DATA) 中间 → 👉 VCC (电源,3.3V 或 5V) 右边 → - 👉 GND (地) ✅ 正确接法(Arduino Nano…

光谱相机在雾霾监测中有何优势?

光谱相机在雾霾监测中的优势主要体现在多维度数据采集和环境适应性方面,结合最新技术进展分析如下:一、核心优势‌穿透性监测能力‌ 短波红外(SWIR)波段可穿透雾霾颗粒,结合可见光成像实现雾霾浓度与能见度的同步监测&…

【c++】超好玩游戏

#include <iostream> #include <vector> #include <conio.h> #include <windows.h> #include <time.h>using namespace std;// 游戏常量 const int WIDTH 40; const int HEIGHT 20; const int PADDLE_WIDTH 5;// 方向枚举 enum Direction { S…

GitHub 热榜项目 - 日榜(2025-08-27)

GitHub 热榜项目 - 日榜(2025-08-27) 生成于&#xff1a;2025-08-27 统计摘要 共发现热门项目&#xff1a;15 个 榜单类型&#xff1a;日榜 本期热点趋势总结 本期GitHub热榜呈现出三大技术趋势&#xff1a;1. AI生产力工具持续升温&#xff1a;系统提示词泄露库、DeepCode…

基于Springboot + vue3实现的学校学报出版发行管理系统

项目描述本系统包含管理员和用户两个角色。管理员角色&#xff1a;用户管理&#xff1a;管理系统中所有用户的信息&#xff0c;包括添加、删除和修改用户。稿件分类管理&#xff1a;管理稿件分类信息&#xff0c;包括新增、查看、修改和删除稿件分类。新闻资讯管理&#xff1a;…

【Keil5教程及技巧】耗时一周精心整理万字全网最全Keil5(MDK-ARM)功能详细介绍【建议收藏-细细品尝】

&#x1f48c; 所属专栏&#xff1a;【单片机开发软件技巧】 &#x1f600; 作  者&#xff1a; 于晓超 &#x1f680; 个人简介&#xff1a;嵌入式工程师&#xff0c;专注嵌入式领域基础和实战分享 &#xff0c;欢迎咨询&#xff01; &#x1f496; 欢迎大家&#xff1…

国家育儿补贴政策遭利用,黑产组织借机窃取敏感数据

组织概况与作案手法近期网络安全领域出现了一个高度组织化的犯罪集团UTG-Q-1000&#xff0c;该组织通过利用中国国家育儿补贴政策实施大规模金融诈骗和数据窃取活动。这个结构严密的犯罪网络下设多个专业部门&#xff0c;包括财务组、新闻与色情组、设计与制造组以及黑市交易组…

Python Imaging Library (PIL) 全面指南:PIL高级图像处理-分割与颜色空间转换

高级图像处理&#xff1a;PIL中的图像分割与颜色空间转换 学习目标 本课程将深入探讨PIL&#xff08;Python Imaging Library&#xff09;中的一些高级功能&#xff0c;包括图像分割和颜色空间转换。通过本课程的学习&#xff0c;学员将能够掌握如何使用PIL进行更复杂的图像处理…

图解 OAuth,为什么这样设计?

OAuth 于 2007 年首次推出。它最初由 Twitter 创建&#xff0c;因为 Twitter 希望能够允许第三方应用代表用户发布推文。想象一下&#xff0c;如果今天设计类似的应用&#xff0c;你会怎么做&#xff1f;一种方法是直接要求用户输入用户名和密码。因此&#xff0c;你创建一个非…

WeakAuras Lua Script ICC (BarneyICC) Simplified Chinese [Mini]

WeakAuras Lua Script ICC &#xff08;BarneyICC&#xff09; Simplified Chinese [Mini] ICC 迷你版本会打了只需要团队框体高亮提示即可&#xff0c;因为有DBM&#xff0c;就不需要那么多了 !WA:2!S3xc4XrXzI6wkSjzcVSyb4aoKWGaC04ijMdPrsoit0OdRXwxmsYgmWoNTup4rZ0UNr2sKL…

mcp学习

mcp学习 预算&#xff1a;5块(半顿拼好饭呜呜呜) 出问题试着开启或者关闭代理。 文章目录mcp学习1. 基本原理2. 环境配置1. cherryStudiodeepseekpython2. Clinedeepseek3. 常用mcp服务1. mcp-server-fetch2. mcp-playwright3. baidu-map4. filesystem5. mcp-mysql-server参考…

Rust:所有权

Rust&#xff1a;所有权拷贝 & 移动堆栈拷贝移动克隆所有权变量的初始权限指针的双重权限权限的动态变化引用赋值重新借用函数调用时的权限移动拷贝借用不可变借用可变借用复合类型的权限结构体元组数组传统语言的内存管理要么依赖程序员手动管理&#xff08;C/C&#xff0…

Elasticsearch数据迁移快照方案初探(二):快照创建与多节点存储问题解决

快照仓库创建成功 经过前面的配置修改&#xff0c;我们成功创建了快照仓库&#xff1a; curl -X PUT "https://[ES_HOST]:9200/_snapshot/backup_repo" \-H "Content-Type: application/json" \-u "[USERNAME]:[PASSWORD]" \-k \-d {"type&…

DeepSeek大模型风靡云平台,百度智能云、阿里云、腾讯云等多个平台宣布上线DeepSeek模型

近日&#xff0c;百度智能云、华为云、阿里云、腾讯云、360数字安全、云轴科技等多个平台纷纷宣布上线DeepSeek大模型&#xff0c;这一消息无疑为AI开发者和企业用户带来了全新的机遇和选择。本文将探讨DeepSeek大模型上线的背景、意义以及未来的发展趋势。 首先&#xff0c;我…

position属性

文章目录Position属性&#x1f9ed; 一、position 属性的取值&#x1f4dd; 二、各属性值详解与示例1. static&#xff08;静态定位&#xff09;2. relative&#xff08;相对定位&#xff09;3. absolute&#xff08;绝对定位&#xff09;4. fixed&#xff08;固定定位&#xf…

通信中间件 Fast DDS(二) :详细介绍

目录 1.引言 2.DDS的基本原理 3.FastDDS 的核心特性 4.FastDDS 的核心架构 5.典型应用场景 6.FastDDS 的安装与快速上手 7.学习资源与社区 1.引言 FastDDS&#xff08;原称 Fast RTPS&#xff09;是由西班牙公司 eProsima 开发的一款开源、高性能、实时性强的数据分发服…

【69页PPT】智慧方案智慧校园解决方案(附下载方式)

篇幅所限&#xff0c;本文只提供部分资料内容&#xff0c;完整资料请看下面链接 https://download.csdn.net/download/2501_92808811/91776074 资料解读&#xff1a;【69页PPT】智慧方案智慧校园解决方案 详细资料请看本解读文章的最后内容 智慧校园的概念与背景 智慧校园是…