题目描述

静态扫描可以快速识别源代码的缺陷,静态扫描的结果以扫描报告作为输出:

1、文件扫描的成本和文件大小相关,如果文件大小为N,则扫描成本为N个金币

2、扫描报告的缓存成本和文件大小无关,每缓存一个报告需要M个金币

3、扫描报告缓存后,后继再碰到该文件则不需要扫描成本,直接获取缓存结果

给出源代码文件标识序列和文件大小序列,求解采用合理的缓存策略,最少需要的金币数。

输入描述
第一行为缓存一个报告金币数M,L<= M <= 100

第二行为文件标识序列:F1,F2,F3,…,Fn。

第三行为文件大小序列:S1,S2,S3,…,Sn。

备注:

1 <= N <= 10000
1 <= Fi <= 1000
1 <= Si <= 10

输出描述
采用合理的缓存策略,需要的最少金币数

用例

输入5
1 2 2 1 2 3 4
1 1 1 1 1 1 1
输出7
说明文件大小相同,扫描成本均为1个金币。缓存任意文件均不合算,因而最少成本为7金币。
输入5
2 2 2 2 2 5 2 2 2
3 3 3 3 3 1 3 3 3
输出9
说明

静态扫描成本优化:缓存策略的贪心解法

核心解题思路

题目要求通过合理的缓存策略最小化静态扫描的总成本,核心问题是:对于重复出现的文件,何时缓存报告最划算? 关键在于权衡扫描成本与缓存成本:

  • 扫描成本:每次扫描文件需支付其大小的金币(文件越大成本越高)
  • 缓存成本:缓存报告需固定支付M金币(后续相同文件可免扫描)
  • 决策关键:对每个文件标识,判断"缓存并复用"还是"每次重新扫描"更经济

贪心策略

对每个文件标识独立决策:

  • 若不缓存:总成本 = 文件大小 × 出现次数
  • 若缓存:总成本 = 第一次扫描成本 + 缓存成本
  • 选择成本更低的方案min(文件大小×频次, 文件大小 + M)

为什么贪心有效?每个文件的缓存决策相互独立,缓存一个文件不会影响其他文件的扫描成本。

解题步骤详解

1. 输入处理与参数设置

# 读取缓存成本M
M = int(input().strip())# 读取文件标识序列
file_ids = list(map(int, input().split()))# 读取文件大小序列
file_sizes = list(map(int, input().split()))

2. 构建文件分组统计

from collections import defaultdict# 创建分组字典:记录每个标识的[频次, 总大小, 首次大小]
file_groups = defaultdict(lambda: [0, 0, None])# 遍历所有文件
for fid, size in zip(file_ids, file_sizes):# 更新出现频次file_groups[fid][0] += 1# 累加总大小(用于不缓存方案)file_groups[fid][1] += size# 记录首次出现的大小(用于缓存方案)if file_groups[fid][2] is None:file_groups[fid][2] = size

3. 计算最小成本

total_cost = 0
for fid, (count, total_size, first_size) in file_groups.items():# 不缓存方案:每次扫描cost_no_cache = total_size# 缓存方案:首次扫描+缓存cost_cache = first_size + M# 选择更经济的方案total_cost += min(cost_no_cache, cost_cache)

4. 输出结果

print(total_cost)

关键逻辑解析

1. 分组统计的重要性

  • 频次(count):决定重复扫描的成本
  • 总大小(total_size):计算不缓存方案的总成本
  • 首次大小(first_size):缓存方案只需首次扫描成本

为何记录首次大小而非任意大小?
缓存发生在首次扫描时,后续文件无论大小如何都复用结果

2. 成本比较的数学原理

决策依据的数学表达式:
min( Σsᵢ , s₁ + M )
其中:

  • Σsᵢ:所有出现位置的大小之和
  • s₁:首次出现的大小
  • M:固定缓存成本

3. 独立决策的正确性

  • 文件标识相互独立,缓存决策无耦合
  • 缓存文件A不影响文件B的扫描
  • 局部最优解之和等于全局最优解

完整代码实现

from collections import defaultdictdef main():# 读取缓存成本M = int(input().strip())# 读取文件标识序列file_ids = list(map(int, input().split()))# 读取文件大小序列file_sizes = list(map(int, input().split()))# 创建分组统计字典# 格式: {文件标识: [出现次数, 总大小, 首次大小]}file_groups = defaultdict(lambda: [0, 0, None])# 遍历所有文件for fid, size in zip(file_ids, file_sizes):# 更新出现次数file_groups[fid][0] += 1# 累加总大小file_groups[fid][1] += size# 记录首次大小if file_groups[fid][2] is None:file_groups[fid][2] = size# 计算最小总成本total_cost = 0for fid, (count, total_size, first_size) in file_groups.items():# 计算两种方案成本cost_no_cache = total_sizecost_cache = first_size + M# 选择更经济的方案total_cost += min(cost_no_cache, cost_cache)print(total_cost)if __name__ == "__main__":main()

复杂度分析

  • 时间复杂度:O(N)
    • 遍历文件序列:O(N)
    • 分组统计:O(N)
    • 决策计算:O(K)(K为唯一文件数,K ≤ N)
  • 空间复杂度:O(K)
    • 存储分组信息:O(K)(K为唯一文件标识数)

示例验证

示例1:

输入:

5
1 2 2 1 2 3 4
1 1 1 1 1 1 1

处理流程:

  1. 分组统计:
    • 文件1: [频次=2, 总大小=2, 首次大小=1]
    • 文件2: [频次=3, 总大小=3, 首次大小=1]
    • 文件3: [频次=1, 总大小=1, 首次大小=1]
    • 文件4: [频次=1, 总大小=1, 首次大小=1]
  2. 成本决策:
    • 文件1: min(2, 1+5)=2
    • 文件2: min(3, 1+5)=3
    • 文件3: min(1, 1+5)=1
    • 文件4: min(1, 1+5)=1
  3. 总成本:2+3+1+1=7
    输出:7

示例2:

输入:

5
2 2 2 2 2 5 2 2 2
3 3 3 3 3 1 3 3 3

处理流程:

  1. 分组统计:
    • 文件2: [频次=8, 总大小=24, 首次大小=3]
    • 文件5: [频次=1, 总大小=1, 首次大小=1]
  2. 成本决策:
    • 文件2: min(24, 3+5)=8
    • 文件5: min(1, 1+5)=1
  3. 总成本:8+1=9
    输出:9

总结

通过贪心策略解决静态扫描成本优化问题:

  1. 问题特性:重复文件可复用缓存,决策相互独立
  2. 核心洞察:缓存的价值 = 后续扫描成本节省 - 缓存成本
  3. 算法选择:分组统计 + 成本比较(O(N)时间复杂度)
  4. 优化关键
    • 小文件高频:倾向不缓存(如示例1)
    • 大文件高频:倾向缓存(如示例2)
    • 低频文件:通常不缓存

实际应用场景:编译器构建系统(如Makefile)、CI/CD流水线,通过缓存中间结果加速重复构建过程。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/83067.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/83067.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/83067.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Java】在 Spring Boot 中连接 MySQL 数据库

在 Spring Boot 中连接 MySQL 数据库是一个常见的任务。Spring Boot 提供了自动配置功能&#xff0c;使得连接 MySQL 数据库变得非常简单。以下是详细的步骤&#xff1a; 一、添加依赖 首先&#xff0c;确保你的pom.xml文件中包含了 Spring Boot 的 Starter Data JPA 和 MySQ…

基于51单片机的音乐盒键盘演奏proteus仿真

地址&#xff1a; https://pan.baidu.com/s/1tZCAxQQ7cvyzBfztQpk0UA 提取码&#xff1a;1234 仿真图&#xff1a; 芯片/模块的特点&#xff1a; AT89C52/AT89C51简介&#xff1a; AT89C51 是一款常用的 8 位单片机&#xff0c;由 Atmel 公司&#xff08;现已被 Microchip 收…

Android Native 之 adbd进程分析

目录 1、adbd守护进程 2、adbd权限降级 3、adbd命令解析 1&#xff09;adb shell 2&#xff09;adb root 3&#xff09;adb reboot 4、案例 1&#xff09;案例之实现不需要执行adb root命令自动具有root权限 2&#xff09;案例之实现不需要RSA认证直接能够使用adb she…

C语言进阶--动态内存管理

学习数据结构重要的三个部分&#xff1a;指针、结构体、动态内存管理&#xff08;malloc、calloc、realloc、free&#xff09;。 1.为什么存在动态内存分配&#xff1f; 1.空间开辟大小是固定的&#xff1b; 2.数组在声明时&#xff0c;必须指定数组的长度&#xff0c;它所需…

C# 密封类和密封方法

密封(sealed)是C#中用于限制继承和多态行为的关键字&#xff0c;它可以应用于类和方法&#xff0c;提供了一种控制继承层次的方式。 密封类 特点 使用 sealed 关键字修饰的类密封类不能被其他类继承&#xff0c;但可以继承其他类或接口主要用于防止派生所有结构(struct)都是…

thinkpad T-440p 2025.05.31

thinkpad T-440p 2025.05.31 老了退休了&#xff0c;说起来真的可恶现在笔记本的设计师&#xff0c;只有固态硬盘了

WPS自动换行

换行前 换行后 快捷键 第一步&#xff1a;启用「自动换行」功能 选中目标单元格/区域&#xff1a;点击需要设置的单元格&#xff08;或拖动选中多个单元格&#xff09;。开启自动换行&#xff08;3种方式任选&#xff09;&#xff1a; 快捷按钮&#xff1a;在顶部菜单栏点击「…

cuda_fp8.h错误

现象&#xff1a; cuda_fp8.h错误 原因&#xff1a; CUDA Toolkit 小于11.8,会报fp8错误&#xff0c;因此是cuda工具版本太低。通过nvcc --version查看 CUDA Toolkit 是 NVIDIA 提供的一套 用于开发、优化和运行基于 CUDA 的 GPU 加速应用程序的工具集合。它的核心作用是让开发…

【TTS】基于GRPO的流匹配文本到语音改进:F5R-TTS

论文地址&#xff1a;https://arxiv.org/abs/2504.02407v3 摘要 我们提出了F5R-TTS&#xff0c;这是一种新颖的文本到语音(TTS)系统&#xff0c;它将群体相对策略优化(GRPO)集成到基于流匹配的架构中。 通过将流匹配TTS的确定性输出重新表述为概率高斯分布&#xff0c;我们的方…

头歌java课程实验(Java面向对象 - 包装类)

第1关&#xff1a;基本数据类型和包装类之间的转换 任务描述 本关任务&#xff1a;实现基本数据类型与包装类之间的互相转换。 相关知识 为了完成本关任务&#xff0c;你需要掌握&#xff1a; 1.什么是包装类&#xff1b; 2.怎么使用包装类。 什么是包装类 在JAVA中&#x…

实现一个免费可用的文生图的MCP Server

概述 文生图模型为使用 Cloudflare Worker AI 部署 Flux 模型&#xff0c;是参照视频https://www.bilibili.com/video/BV1UbkcYcE24/?spm_id_from333.337.search-card.all.click&vd_source9ca2da6b1848bc903db417c336f9cb6b的复现Cursor MCP Server实现是参照文章https:/…

ES6 深克隆与浅克隆详解:原理、实现与应用场景

ES6 深克隆与浅克隆详解&#xff1a;原理、实现与应用场景 一、克隆的本质与必要性 在 JavaScript 中&#xff0c;数据分为两大类型&#xff1a; 基本类型&#xff1a;Number、String、Boolean、null、undefined、Symbol、BigInt引用类型&#xff1a;Object、Array、Functio…

新闻数据加载(鸿蒙App开发实战)

本案例基于ArkTS的声明式开发范式&#xff0c;介绍了数据请求和onTouch事件的使用。包含以下功能&#xff1a; 数据请求。列表下拉刷新。列表上拉加载。 网络数据请求需要权限&#xff1a;ohos.permission.INTERNET 一、案例效果截图 操作说明&#xff1a; 点击应用进入主页…

办公效率王Word批量转PDF 50 +文档一键转换保留原格式零错乱

各位办公小能手们&#xff0c;我跟你们说啊&#xff01;在办公的时候&#xff0c;咱经常会碰到要把一堆Word文档转成PDF格式的情况&#xff0c;比如说要统一文件格式、保护文档内容或者方便分享啥的。这时候&#xff0c;就需要用到Word批量转换成PDF的软件啦。下面我就给你们好…

一张Billing项目的流程图

流程图 工作记录 2016-11-11 序号 工作 相关人员 1 修改Payment Posted的导出。 Claim List的页面加了导出。 Historical Job 加了Applied的显示和详细。 郝 识别引擎监控 Ps (iCDA LOG :剔除了160篇ASG_BLANK之后的结果): LOG_File 20161110.txt BLANK_CDA/ALL 45/10…

SpringAI系列4: Tool Calling 工具调用 【感觉这版本有bug】

前言&#xff1a;在最近发布的 Spring AI 1.0.0.M6 版本中&#xff0c;其中一个重大变化是 Function Calling 被废弃&#xff0c;被 Tool Calling 取代。Tool Calling工具调用&#xff08;也称为函数调用&#xff09;是AI应用中的常见模式&#xff0c;允许模型通过一组API或工具…

第六十三节:深度学习-模型推理与后处理

深度学习模型训练完成后,如何高效地将其部署到实际应用中并进行准确预测?这正是模型推理与后处理的核心任务。OpenCV 的 dnn 模块为此提供了强大支持,本文将深入探讨 OpenCV 在深度学习模型推理与后处理中的关键技术与实践。 第一部分:基础概念与环境搭建 1.1 核心概念解析…

uniapp开发企业微信小程序时 wx.qy.login 在uniapp中使用的时候,需要导包吗?

在 UniApp 中使用 “wx.qy.login” 不需要手动导包&#xff0c;但需要满足以下条件&#xff1a; 一、环境要求与配置 1&#xfffd; 企业微信环境判断 必须确保当前运行环境是企业微信客户端&#xff0c;通过 “uni.getSystemInfoSync().environment” 判断是否为 “wxwork”…

ONLYOFFICE文档API:更强的安全功能

在数字化办公时代&#xff0c;文档的安全性与隐私保护已成为企业和个人用户的核心关切。如何确保信息在存储、传输及协作过程中的安全&#xff0c;是开发者与IT管理者亟需解决的问题。ONLYOFFICE作为一款功能强大的开源办公套件&#xff0c;不仅提供了高效的文档编辑与协作体验…

Linux系统编程之共享内存

概述 在Linux系统中&#xff0c;共享内存也是一种高效的进程间通信机制&#xff0c;允许两个或多个进程共享同一块物理内存区域。通过这种方式&#xff0c;不同进程可以直接访问和操作相同的数据&#xff0c;从而避免了数据的复制。由于数据直接在内存中共享&#xff0c;没有额…