Microsoft 發布了 MarkItDown 庫,它允許您將 Word、PowerPoint 和 Excel 等文件轉換為 Markdown。詳細資訊如下。
在當地時間2024年12月12日,微軟發布了一個Python庫,不僅可以將PDF,還可以將Word、PowerPoint、Excel等Office文件轉換為Markdown格式檔案。「記下來」是新出版的。
用於將文件和辦公室文件轉換為 Markdown 的 Python 工具。
microsoft/markitdown:用於將文件和 Office 文件轉換為 Markdown 的 Python 工具。 – GitHub
微軟 Human-AI eXperiences (HAX) 小組的 Adam Fourney 目前負責 AI 工具「自動產生」為了在開發時使 PDF、Office 文件和網站基於文字(Markdown)「記下來」看來他們已經發展起來了
MarkItDown 是一個開源文件轉換器「潘多克」雖然它支援的格式不多,但除了PDF、Word(.docx)、Excel(.xlsx)和PowerPoint(.pptx)之外,它還支援圖像、音訊、HTML(包括維基百科的特殊處理)、csv和json.,支援xml等文字文件,
使用 MarkItDown 轉換的 Markdown 文件
使用它需要Python環境,但由於它是開源的(MIT許可證),Replit的Matt Palmer和其他人開發了一個Web工具。「微軟」它已發佈為 ,所以如果您有興趣,請嘗試一下。