Microsoft 发布了 MarkItDown 库,它允许您将 Word、PowerPoint 和 Excel 等文件转换为 Markdown。详细信息如下。
当地时间2024年12月12日,微软发布了一个Python库,不仅可以将PDF,还可以将Word、PowerPoint、Excel等Office文件转换为Markdown格式文件。「记下来」是新出版的。
用于将文件和办公文档转换为 Markdown 的 Python 工具。[…]MarkItDown 库是一个用于将各种文件转换为 Markdown 的实用工具(例如,用于索引、文本分析等)
microsoft/markitdown:用于将文件和 Office 文档转换为 Markdown 的 Python 工具。 – GitHub
微软 Human-AI eXperiences (HAX) 小组的 Adam Fourney 目前负责 AI 工具「自动生成」为了在开发时使 PDF、Office 文件和网站基于文本(Markdown)「记下来」看来他们已经发展起来了
MarkItDown 是一个开源文档转换器「潘多克」虽然它支持的格式不多,但除了PDF、Word(.docx)、Excel(.xlsx)和PowerPoint(.pptx)之外,它还支持图像、音频、HTML(包括维基百科的特殊处理)、csv和json.,支持xml等文本文件,
使用 MarkItDown 转换的 Markdown 文件
使用它需要Python环境,但由于它是开源的(MIT许可证),Replit的Matt Palmer和其他人开发了一个Web工具。「微软」它已发布为 ,所以如果您有兴趣,请尝试一下。