为什么需要转换工具链?
你有没有遇到过这种情况:朋友发来一个 WebP 图片,你的电脑打不开;公司要求提交 PDF 格式的简历,但你只有 Word 文档;或者想把一段录音转成文字写会议纪要,却找不到顺手的工具。这些日常小麻烦,其实都能靠一套顺手的“转换工具链”解决。
什么是转换工具链?
简单说,就是把一种格式的内容,变成另一种你需要的格式。这个过程可能涉及多个工具配合使用。比如,把网页文章保存为电子书,可能需要先抓取内容,再转成 Markdown,最后打包成 EPUB。这一连串操作,就是一条工具链。
图片格式转换:别再被 WebP 难住
现在很多网站用 WebP 存图,节省流量,但老版本 Windows 或 Office 可能不支持。这时候用 ImageMagick 就很合适,命令行跑一下就行:
magick input.webp output.jpg
如果你不想敲命令,可以用 XnConvert,批量处理几十张图也不卡。拖进去,选输出格式,一键导出。
文档互转:Word、PDF、Markdown 自由切换
写材料经常要在格式间跳来跳去。推荐组合是 pandoc + LibreOffice。pandoc 是个文本转换神器,支持十几种格式。比如把 Markdown 转成 Word:
pandoc article.md -o report.docx
如果原始文件是扫描版 PDF,得先用 OCRmyPDF 加一层文字识别:
ocrmypdf scanned.pdf searchable.pdf
之后就能复制内容,甚至拿去转成其他格式了。
音视频转文字:会议记录不再靠手记
开会时记笔记总怕漏重点?录个音,回头转文字更踏实。本地优先推荐 Vosk,支持中文离线识别,保护隐私。Python 调用几行代码就能跑:
from vosk import Model, KaldiRecognizer
import wave
model = Model("model-chinese")
wf = wave.open("meeting.wav", "rb")
rec = KaldiRecognizer(model, wf.getframerate())
while True:
data = wf.readframes(4000)
if len(data) == 0:
break
if rec.AcceptWaveform(data):
print(rec.Result())
print(rec.FinalResult())
要是不折腾环境,直接用讯飞听见或腾讯云语音识别也行,准确率高,就是得联网。
数据格式转换:JSON、CSV、Excel 之间流转
做报表时,常遇到别人给的 JSON 数据没法直接导入 Excel。用 jq 提取字段,再转 CSV 很方便:
jq -r '.[] | [.name, .age] | @csv' data.json > output.csv
Windows 用户可以试试 Notepad++ 搭配 JSON Viewer 插件,点几下就能展开结构,复制表格内容粘贴到 Excel 里。
构建你自己的小工具链
真正高效的做法,不是每次临时找工具,而是搭一套自己顺手的流程。比如我平时收集资料,固定用“浏览器插件 Save Page WE → 转 Markdown → pandoc 打包 EPUB”,全程不到一分钟。工具不在多,在熟。挑两三个用顺的,组合起来,比啥新软件都强。