MarkItDown 是一款轻量级的 Python 实用程序,用于将各种文件转换为 Markdown,以便用于 LLM 和相关的文本分析流程。就这一点而言,它与 textract 最为相似,但更侧重于将重要的文档结构和内容保留为 Markdown(包括标题、列表、表格、链接等)。虽然输出结果通常相当美观且人性化,但它旨在供文本分析工具使用——对于高保真文档转换供人类使用而言,可能并非最佳选择...