Python练习:读取Apple Plist文件

Plist文件简介

  1. ​​定义​​:Apple公司创建的基于XML结构的文件格式
  2. ​​特点​​:采用XML语法组织数据,可存储键值对、数组等结构化信息
  3. 文件扩展名​​:.plist
  4. 应用场景:
    ​​iOS系统:​​ 应用描述文件(权限配置:蓝牙/网络访问/GameCenter等)IPA安装包中的配置信息 ​​
    macOS系统​​: .app应用的配置文件 系统偏好设置存储 ​​
    苹果生态​​ iTunes音乐播放列表 Xcode项目配置

Python操作库:plistlib

import plistlib

代码适配指南(Python 2 → Python 3)
​​废弃方法​​(Python 2旧版)

plist = plistlib.read(filename)

​​正确方法​​(Python 3新版)

with open(filename, 'rb') as plist_file:plist = plistlib.load(plist_file)

注意事项

  1. 始终使用​​二进制模式​​(‘rb’)打开文件 Python
  2. 3.4+ 支持load()/dump()替代旧版API
  3. macOS内置plutil工具可验证文件有效性:bash 下运行下面的代码
    plutil -lint Example.plist

下文是练习代码,其中也包含了画图部分
练习代码:

import re, argparse
import sys
from matplotlib import pyplot
import plistlib
import numpy as np# 找到重复的音乐
def find_duplicates(file_name):print("Find duplicate tracks in %s..." % file_name)with open(file_name, 'rb') as f:plist = plistlib.load(f)# 读取playlist# 获取音轨目录tracks = plist['Tracks']# 创建音轨字典track_names = {}# 结构:{name:(duration,count)}# 遍历 添加for track_id, track in tracks.items():try:name = track['name']duration = track['Total Time']# 检查是不是以及在在字典里面了if name in track_names:# 匹配 歌曲名称和时长if duration // 1000 == track_names['name'][0] // 1000:count = track_names[name][1]track_names[name] = (duration, count + 1)else:# 不匹配的情况下track_names[name] = (duration, count)except:# ignorepass# 保存重复的音轨, name, countdups = []for k, v in track_names.items():if v[1] > 1:dups.append(k, v[1])# 保存到一个文件if len(dups) > 0:print("发现一共有%d个重复的文件, 以及保存到了dup.txt中" % len(dups))else:print("没有发现任何重复的文件")f = open("dups.txt", "w")for val in dups:f.writable("[%d] %s \n" % (val[0], val[1]))f.close()# 查找多个播放列表中的共同的音轨
def find_common_tracks(file_names):# a list of sets of track namestrack_name_sets = []# 遍历读取多个plist文件for file_name in file_names:track_names = set()with open(file_name, 'rb') as f:plist = plistlib.load(f)# 获取音轨节点tracks = plist.get("Tracks", {})# 遍历迭代for track_id, track in tracks.items():try:track_names.add(track['Name'])except:# ignorepass# 添加到track_name_sets中track_name_sets.append(track_names)# 交集处理common_tracks = set.intersection(*track_name_sets)# 写文件if len(common_tracks) > 0:f = open("common.txt", "w")for val in common_tracks:# s = "%s\n" % valf.write(f"{val}\n")f.close()print(f"Track names wirte to common.txt { len(common_tracks)}")else:print("No common tracks!")# 收集歌曲评分和时长
def plot_stats(file_name):# 读取播放列表with open(file_name, 'rb') as f:plist = plistlib.load(f)tracks = plist['Tracks']# 创建音轨排序和时长ratings = []durations = []for track_id, track in tracks.items():try:ratings.append(track['Album Rating'])durations.append(track['Total Time'])except:# ignorepass# 确保是有效数据if ratings == [] or durations == []:print(f"在文件中%s没有有效的Album Rating/Total Time  数据 {file_name}")return# scatter plot x= np.array(durations, np.int32) # convert to minutes x = x/60000.0 y = np.array(ratings, np.int32) pyplot.subplot(2, 1, 1) pyplot.plot(x, y, 'o') pyplot.axis([0, 1.05*np.max(x), -1, 110]) pyplot.xlabel('Track duration') pyplot.ylabel('Track rating') # plot histogram pyplot.subplot(2, 1, 2) pyplot.hist(x, bins=20) pyplot.xlabel('Track duration') pyplot.ylabel('Count') # show plot pyplot.show() def main():# create parserdescStr = """This program analyzes playlist files (.xml) exported from iTunes."""parser = argparse.ArgumentParser(description=descStr)# add a mutually exclusive group of argumentsgroup = parser.add_mutually_exclusive_group()# add expected argumentsgroup.add_argument('--common', nargs = '*', dest='plFiles', required=False)group.add_argument('--stats', dest='plFile', required=False)group.add_argument('--dup', dest='plFileD', required=False)# parse argsargs = parser.parse_args()if args.plFiles:# find common tracksfind_common_tracks(args.plFiles)elif args.plFile:# plot statsplot_stats(args.plFile)elif args.plFileD:# find duplicate tracksfind_duplicates(args.plFileD)else:print("These are not the tracks you are looking for.")if __name__ == "__main__":main()

最后这个是画图的部分,以后有兴趣再研究吧
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/89340.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/89340.shtml
英文地址,请注明出处:http://en.pswp.cn/web/89340.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JAVA几个注解记录

在Java中,Data、AllArgsConstructor和NoArgsConstructor是Lombok库提供的注解,用于自动生成Java类中的样板代码(如getter、setter、构造函数等),从而减少冗余代码,提高开发效率。以下是它们的详细功能和使用…

js对象简介、内置对象

对象、内置对象 jarringslee 对象 对象(object)是js的一种引用数据类型,是一种无序的数据集合“ul”(类比于数组,有序的数据集合“ol”)。 基本上等于结构体。 对象的声明 //基本方法 let 对象名 {声…

【工程篇】07:如何打包conda环境并拷贝到另一台服务器上

这是一份以名为 qwen2.5-vl 的 Conda 环境为例的详细操作手册,指导您如何将其打包并迁移至另一台服务器。操作手册:迁移 Conda 环境 qwen2.5-vl 至新服务器 本文档将提供两种有效的方法来迁移您的 qwen2.5-vl 环境。请根据您的具体需求和服务器条件选择最…

rustdesk远控电脑替代todesk,平替向日葵等软件

rustdesk网页端远控电脑docker run --restart always \ --privileged \ -p 9000:9000 \ -p 21114:21114 \ -p 21115:21115 \ -p 21116:21116 \ -p 21116:21116/udp \ -p 21117:21117 \ -p 21118:21118 \ -p 21119:21119 \ -e KEYj8muHpzr2HK00zm9D94b1UFkaJ1bEiWsyA1qxb1nOA \ …

板凳-------Mysql cookbook学习 (十二--------1)

第9章 存储例程,触发器和计划事件 326 9.0 概述 326 9.1 创建复合语句对象 329 mysql> -- 恢复默认分隔符 mysql> DELIMITER ; mysql>mysql> DROP FUNCTION IF EXISTS avg_mail_size; Query OK, 0 rows affected (0.02 sec)mysql> DELIMITER $$ mysq…

密码学系列文(3)--分组密码

一、分组密码概述分组密码是许多系统安全的一个重要组成部分,可用于构造:拟随机数生成器流密码消息认证码(MAC)和杂凑函数消息认证技术、数据完整性机构、实体认证协议以及单钥数字签字体制的核心组成部分应用中对于分组密码的要求:安全性运行…

WCDB soci 查询语句

测试代码 #pragma once #include <string> #include <vector>// Assume OperationLog is a struct representing a row in the table struct OperationLog {int id;std::string op_type;std::string op_subtype;std::string details;std::string timestamp; };clas…

lesson16:Python函数的认识

目录 一、为什么需要函数&#xff1f; 1. 拒绝重复造轮子 2. 让代码像句子一样可读 3. 隔离变化&#xff0c;降低维护成本 二、函数的定义&#xff1a;编写高质量函数的5个要素 基本语法框架 1. 函数命名的黄金法则&#xff08;PEP8规范&#xff09; 2. 不可或缺的文档…

通过轮询方式使用LoRa DTU有什么缺点?

在物联网系统中&#xff0c;DTU&#xff08;Data Transfer Unit&#xff09;通常用于通过485或M-Bus等接口抄读子设备的数据&#xff0c;并将这些数据传输到平台侧。然而&#xff0c;如果DTU采用轮询方式与平台通信&#xff0c;会带来一系列问题&#xff0c;尤其是在功耗和系统…

Syntax Error: Error: PostCSS received undefined instead of CSS string

报错&#xff1a;Syntax Error: Error: PostCSS received undefined instead of CSS string npm rebuild node-sass报错&#xff1a;npm i canvas 报错 canvas2.11.2 run install node-pre-gyp install --fallback-to-build --update-binary npm install canvas --canvas_binar…

人工智能之数学基础:概率论和数理统计在机器学习的地位

概率和统计的概念概率统计是各类学科中唯一一门专门研究随机现象的规律性的学科&#xff0c;随机现象的广泛性决定了这一学科的重要性。概率论是数学的分支&#xff0c;它研究的是如何定量描述随机现象及其规律。我们之前经常在天气软件上看到&#xff1a;“今天下雨的概率是95…

第十四章 Stream API

JAVA语言引入了一个流式Stream API,这个API对集合数据进行操作&#xff0c;类似于使用SQL执行的数据库查询&#xff0c;同样可以使用Stream API并行执行操作。Stream和Collection的区别Collection:静态的内存数据结构&#xff0c;强调的是数据。Stream API:和集合相关的计算操作…

Oracle数据库各版本间的技术迭代详解

今天我想和大家聊聊一个我们可能每天都在用&#xff0c;但未必真正了解的技术——Oracle数据库的版本。如果你是企业的IT工程师&#xff0c;可能经历过“升级数据库”的头疼&#xff1b;如果你是业务负责人&#xff0c;可能疑惑过“为什么一定要换新版本”&#xff1b;甚至如果…

论文reading学习记录3 - weekly - 模块化视觉端到端ST-P3

文章目录前言一、摘要与引言二、Related Word2.1 可解释的端到端架构2.2 鸟瞰图2.3 未来预测2.4 规划三、方法3.1 感知bev特征积累3.1.1 空间融合&#xff08;帧的对齐&#xff09;3.1.2 时间融合3.2 预测&#xff1a;双路径未来建模3.3 规划&#xff1a;先验知识的整合与提炼4…

crawl4ai--bitcointalk爬虫实战项目

&#x1f4cc; 项目目标本项目旨在自动化抓取 Bitcointalk 论坛中指定板块的帖子数据&#xff08;包括主贴和所有回复&#xff09;&#xff0c;并提取出结构化信息如标题、作者、发帖时间、用户等级、活跃度、Merit 等&#xff0c;以便进一步分析或使用。本项目只供科研学习使用…

调用 System.gc() 的弊端及修复方式

弊端分析不可控的执行时机System.gc() 仅是 建议 JVM 执行垃圾回收&#xff0c;但 JVM 可自由忽略该请求&#xff08;尤其是高负载时&#xff09;。实际回收时机不确定&#xff0c;无法保证内存及时释放。严重的性能问题Stop-The-World 停顿&#xff1a;触发 Full GC 时会暂停所…

git merge 和 git rebase 的区别

主要靠一张图&#xff1a;区别 git merge git checkout feature git merge master此时在feature上git会自动产生一个新的commit 修改的是当前分支 feature。 git rebase git checkout feature git rebase master&#xff08;在feature分支上执行&#xff0c;修改的是master分支…

Java学习--JVM(2)

JVM提供垃圾回收机制&#xff0c;其也是JVM的核心机制&#xff0c;其主要是实现自动回收不再被引用的对象所占用的内存&#xff1b;对内存进行整理&#xff0c;防止内存碎片化&#xff1b;以及对内存分配配进行管理。JVM 通过两种主要算法判断对象是否可回收&#xff1a;引用计…

用大模型(qwen)提取知识三元组并构建可视化知识图谱:从文本到图谱的完整实现

引言 知识图谱作为一种结构化的知识表示方式&#xff0c;在智能问答、推荐系统、数据分析等领域有着广泛应用。在信息爆炸的时代&#xff0c;如何从非结构化文本中提取有价值的知识并进行结构化展示&#xff0c;是NLP领域的重要任务。知识三元组&#xff08;Subject-Relation-O…

(附源码)基于 Go 和 gopacket+Fyne 的跨平台网络抓包工具开发实录

基于 Go 和 gopacket Fyne 的跨平台网络抓包工具开发实录 一、项目背景 在网络安全、协议分析、运维排查等场景中&#xff0c;抓包工具是不可或缺的利器。Wireshark 虽然功能强大&#xff0c;但对于部分初学者或有定制需求的开发者来说&#xff0c;学习曲线较陡&#xff0c;且…