要尽量利用AI工具提高效率,同时也要触达到平常无法实现的事情,这篇文章要不断迭代,积极探索各种工具的使用体验。

深度思考和提问

  • ChatGPT
  • Claude 有时候ChatGPT回答的问题比较好,有时候Cluade好。同一个问题可以结合使用。

提示词

  • Claude Console 的 General a Prompt 和 Improve an exisiting Prompt
  • OpenAI的Console

    指定内容的问答

  • Google NoteBookLM
  • Cursor的CodeBase
  • Claude的Project 有200k tokens上下文窗口的限制,单个文件不能超过30MB
  • Obsidian的Copilot插件
  • Anthropic MCP 服务器
  • GraphRAG

图片、流程图的生成

  • Claude的artifact生成SVG 或mermaid
  • mermaidchart 将mermaid转换为SVG
  • napkin生成图表
  • streamlit 图表
  • Recraft生成UI 或者 线框图。
  • Excalidraw 可以将mermaid转换为Excalidraw,也可以用大模型AI生成

书的总结

  • 微信读书的AI大纲

口语陪练

  • 元宝APP的官方口语陪练智能体,支持纠错,提示,可控性好
  • 豆包和元宝都支持自定义智能体,可以选择音色,和提示词。但卡片不支持纠错和提示。

编程

  • Cursor
  • windsurf
  • bolt
  • V0
  • Cline
  • 浏览器插件,一键克隆任意网页 UI 组件,生成代码。UICloner Extension
  • 一个 Jetbrains 插件,使用 AI 生成 git 的提交信息。AI git commit
  • Repo Prompt 这个工具挺实用的,它可以把你整个Repo的代码拼成一个XML文本,方便你发给像Gemini 2、Claude 3.5、o1 pro这样支持长上下文的模型。 当然你也可以只选择部分文件,目前只支持 Mac https://repoprompt.com
  • Google Gemini 宣布新更新 你现在可以上传一整个代码库然后向 Gemini 提问,可以考虑整个项目并综合辅助调试、重构、重写或优化代

聊天UI,接入各个大模型的API

  • Chatbox 客户端
  • OpenWebUI 网页
  • Lobe Chat
  • ChatOllama

抓取信息,信息格式化

  • jina reader
  • firecraw
  • 可以把各种文件转成Markdown的一个工具:E2M。github:https://github.com/wisupai/e2m
  • MarkItDown是微软开源的工具,支持将PDF、PPT、Word、Excel、图像、音频和HTML等格式转换为Markdown,并允许自定义处理流程和批量处理。github:markitdown
  • nv-ingest
  • unstructured
  • omniparse
  • ChatDOC PDF 解析器 / PDFlux: 这是一个被广泛认为在处理复杂 PDF 文档时表现卓越的工具,特别是在财务报告、学术论文和法律文件等领域。它通过增强 PDF 结构识别来革新 RAG 技术,支持多种语言,并能精确地解析文档中的内容块。
  • LlamaParse: 由 LlamaIndex 提供的 LlamaParse 技术专为高效解析复杂 PDF 文档而设计。它能处理包含文本、图片和表格的文档,提供高准确度的解析效果,并支持多种语言。解析后的内容通常转换为 Markdown 格式,以保留文档结构。
  • MinerU: 开源工具 MinerU 可以将任意 PDF、网页或电子书转换为 AI 友好的数据格式,支持提取表格、图片、LaTeX 公式等。它的设计初衷是为了支持大模型的数据准备工作。
  • gptpdf: 这是一个轻量级的工具,使用 GPT-4o 进行 PDF 解析,能够识别并转换 PDF 中的图片、表格和文字排版为 Markdown 格式,适合学术研究和办公自动化。
  • PDF-Extract-Kit: 这个工具专注于 PDF 内容的抽取,具有独创的布局识别和公式识别模型,适用于学术论文、电子书、研究报告等场景,提供了高精度的抽取效果。

    RAG类​

  • LlamaIndex的LlamaParse
  • HayStack
  • LangChain
  • OpenSPG/KAG

音频类

  • flowvoice
  • livekit
  • fishvoice
  • chattts
  • voicelingo

翻译

  • 沉浸式翻译
  • Relingo

PDF

  • 万兴PDF阅读器
  • smartpdf

运维

  • 开源的 Kubernetes 可视化工具,提供搜索、洞察、AI 等能力。Karpor

标签:

分类:

更新时间:

留下评论