啁啾集 - 探索新事物

如何将图片或视频转化为 AVIF/AVIFS 格式？

AVIF 是新一代的图片压缩格式，不仅支持标准动态范围(SDR)图像，还支持高动态范围(HDR)和宽色域(WCG)。相对于传统 jpeg\png\webp\gif 图片格式而言，在提供更好的图像品质同时还能够有效的减少文件体积，并且支持透明图层。此外，AVIF 同样支持无损压缩。 AVIF 还支持动图技术(Animated Pictures)，称之为Image Sequence，跟AV1编码渊源颇深。AVIF 动图文件扩展名可能为 .avifs 或.avis ，不过浏览器和图片编辑器能够自动判别，因此只需要统一使用 .avif 当文件扩展名就好。目前，几乎所有浏览器与主流操作系统都已经支援 AVIF。Windows 10/11 或 Android 12 等系统已经提供了对它的支持。苹果公司将在 iOS 16 提供对

使用 Python 下载 YouTube 高分辨率视频(包含音频)

很多人喜欢把一些油管(YouTube)视频下载到本地存储，这样最大的好处就在于可以在没有网络的情况下依然可以观看它们。尽管网络上有很多 YouTube 下载工具，但是它们通常不太稳定。而且，对于 720P 以上高分辨率的油管视频，就算下载成功通常它们也是没有声音的（无音频）。另外，一些视频由于受到年龄等因素的限制，您也无法成功完成下载。本文就来教您如何下载带有音频(声音)的高分辨率 YouTube 视频，并且突破受限制的视频。根据小编经验，不借助第三方平台 API，有两种工具可以帮助您从 YouTube 成功下载视频： 1. youtube-dl 这是一个命令行实用工具，最大的优点在于您可以从任何编程语言中调用它。 2. pytube 这是一个 Python 库，功能强大。本文我们选择使用 pytube 库，不但因为它使用起来非常简单，而且支持组合使用额外的库来自适应下载油管4K(2160P) 高分辨率视频！我们还可以为这些无声高分辨率视频加上音频。下载 YouTube 高分辨率视频，

视觉文档理解(VDU)模型 Donut 项目解析

Document Understanding Transformer ，是一种新的文档理解方法，它利用了无 OCR 的端到端 Transformer 模型。Donut 不需要现成的 OCR 引擎/API，但它在各种视觉(可视化)文档理解任务——例如视觉文档分类或信息提取（又名文档解析）上展示了最先进的性能。也就是说，Donut 不做 OCR，直接对图片进行文字信息抽取（也叫文档理解）。理解文档图像(如发票)一直是个重要的研究课题，在文档处理自动化方面有许多应用。通过基于深度学习的光学字符识别(OCR)的最新进展，目前的视觉文档理解(VDU)系统已经开始基于 OCR 设计。尽管这种基于OCR的方法承诺了合理的性能，但它们受到OCR引起的关键问题的影响。主要体现为昂贵的计算成本以及由于OCR错误传播导致的性能下降。本文提出一种新的VDU模型，在没有OCR框架支持的情况下可以进行端到端训练。提出了一个新的任务和一个合成文档图像生成器来预训练模型，以减轻对大规模真实文档图像的依赖。该方法在公共基准数据集和私有商用服务数据集的各种文档理解任务中取得了最先进的性能。通过广泛的实验和分析，证

使用 Python 下载 instagram 视频(Reels)

Python 有很多非常棒的开源工具软件包可以抓取互联网上的页面，甚至包括网页中的图片以及视频。今天来给大家介绍一款名为 instaloader 的 Python 开源工具，使用它能够从 Instagram 中提取并下载视频、图像、个人资料头像、帖子和评论等数据，并允许自定义筛选你感兴趣的媒体和元数据。非常强大！ instaloader 主要功能： * 下载个人资料、标签、用户故事、摘要和保存的媒体。 * 下载每个帖子下方的评论和地理位置标签。 * 自动检测配置文件名称的变更，并重命名目标目录。 * 允许对过滤器进行细粒度定制，以及自定义下载资料的存储位置。 * 遍历抓取及下载个人账户中所有图片和视频，以及个人头像(需登陆对应 instagram 账户)。安装 instaloader 请在终端执行命令： pip3 install instaloader 遍历抓取 instagram 账户内所有内容安装完成后，请创建一个名为 instasave.py 的 Python 文件，然后输入以下代码： import

使用 Python 提取及下载 YouTube 视频字幕

对于自媒体作者来说，很多时候，想要参考一段油管(YouTube)视频中的字幕。通常你需要将这段视频看完，并且将你需要的内容逐行逐字的手工码出来。很无奈，这将耗费你不少的时间和精力。如果您正面临这样的难题，不妨来看看本教程。本文我们将教你如何使用 Python 在一秒钟内获取任何 Youtube 视频中的字幕文本。如果有必要的话，您还可以选择将字幕文本转换成PDF格式。长话短说，下面就让我们开始吧！安装 Python 库在本教程中，我们将使用两个 Python 库：fpdf 和 request。请使用下面的命令来安装： # 安装 pip3 install fpdf pip3 install requests # 导入 import request from fpdf import FPDF 获取 API 为提升便捷性，在这里我们可以使用 Rapid