GPT知识管理工具的第三轮迭代

我们之前开发的基于GPT的语音录入工具已经经历了两次迭代。最初的构想是一个简单的快速录入工具,让我们能够在短时间内通过语音输入生成大量文字,例如我现在甚至可以每分钟输入300个汉字左右。上一轮迭代主要将应用场景转向知识管理方面,我们发现它不仅是一个输入工具,在知识的沉淀处理和输出上也有很大用途。为了支持这个应用思路的转变,我们将用户界面从基于Web App转移到了Telegram Bot上,这带来了很多好处,如自动拥有session和user的概念,每个人都有自己的聊天记录,我们可以轻松地记录数据。同时,我们意外地发现这些记录可以作为很好的训练数据,用于微调现有的LLM,实现类似GPT-4的功能。

然而,在与更多用户交流后,我们发现这个应用仍然非常小众。真正喜欢它的用户很少,大多数人对这样的应用并不感兴趣。这意味着我们在思考这个工具的思路上仍存在一些局限,没有真正考虑整个IT相关群体的需求。为了最大化GPT这个思路的影响力,我和课代表立正进行了更多讨论,并与一些早期用户进行了访谈,对整个问题进行了更多梳理。

我们认为,从更抽象的层面来看,这个工具的潜力远不止知识管理。它在知识管理中主要做了两件事:第一,像一个点一样,把一个idea变成另一个idea,可能是通过语音识别、GPT-4重塑或者细微的语气更改等;第二,它提供了一个线的概念,把不同的点组成一个序列,完成更复杂的操作。例如,快速录入就是一个有两个点的线:先进行语音识别,再调用GPT进行有逻辑的转述。这个模式可以应用到很多其他领域,有些用户可能只需要对语音识别的结果加上标点、改正错别字,有些用户可能需要GPT-4的转述并进行有条理的总结,输出Markdown格式的文本。有些用户甚至需要一个网状结构,使用GPT完成非常复杂的工作。

因此,我们的价值可能不仅仅是提供语音识别和GPT转述这两个特定的点,而是提供一个平台,帮助用户构建由点和线组成的系统。这个构想是一个深度讨论和高度抽象的产物,可能比较难理解。从更贴近实际应用的角度出发,很多时候我们现实生活中遇到的应用,GPT的能力还不够聪明,不能够端到端地完成任务,需要我们一步步引导。例如,写一篇文章时,我们可能需要先给GPT几个关键字组成的提纲,让它扩写成一小段话,然后编辑后再口述给GPT,让它润色成一个更好的文本,最后再改变文字风格,让它更利于传播。所以,使用GPT完成相对复杂的任务需要我们逐步引导。更具体地说,核心难点主要有两方面。一方面,我们需要根据模型的能力范围,了解它擅长和不擅长的领域,然后将这个复杂的任务进行适当的分解。另一方面是根据任务分解,进行一些工程实践,例如编写每一步的prompt,将第一步处理好的结果作为输入扔给第二步。

这两个过程都可以通过这个工具支持,后者主要是更偏向工程方面。我们可以将现有的工具扩展成一个基于点和线的执行引擎,这样用户只需告诉我们他们想要做什么,我们就可以帮助他们完成数据变换、搬运、存储和序列化等工作。另一方面,关于模型的边界和如何分解任务,如果有更多人使用这个工具,我们也可以提供集体智慧(collective intelligence)来帮助新入门的GPT用户。让他们能够从老手的模板中学习,快速搭建一套系统,从而将精力集中在需要领域知识的地方,而不是如何构建一个将GPT结果搬来搬去的系统,如何优化prompt以及如何分解任务。当然,此时任务分解仍然是一个很困难的工作。

在确定了工具的价值之后,我们需要一个合适的UI。这个UI的主要任务是让用户能够自由组合点和线。我们考虑过一些可能的设计,如基于Telegram bot实现一个对话式的UI,或者将其制作成一个图形化的界面,类似少儿编程,通过拖拽空间来实现。在权衡了工程成本和用户使用直观程度之后,我们决定使用苹果的Shortcut(快捷方式)工具。它是苹果在Mac、iPhone和iPad上内置的一个无代码编程小工具,具有编程的所有功能,如循环、分支和变量,同时具有非常直观的界面。用户无需编写任何代码,只需拖拽一些基本模块并建立连接,就可以形成一个可在手机上执行的程序。这完美地符合我们的需求,我们无需重新发明轮子,而是可以复用苹果在这个领域的深入探索。因此,我们将核心功能封装成一个Web API,然后通过Shortcut进行调用,让用户将我们提供的点连接成线,实现非常灵活的应用。除了灵活性和应用性之外,这个工具还可以与手机深度集成,与手机上的不同应用互动,输出结果到Notes或作为微信消息发送等。它还具有非常灵活的呼出方法,如与Siri集成,或让用户双击手机背面来调用Shortcut。这使得我们的产品可以非常灵活地嵌入到用户的工作流程中,同时也让它变得非常轻量级。

我们现在已经制作了一个示例Shortcut,大家可以通过这个链接查看或将其添加到自己的Shortcut中:https://gpty.ai/example。 欢迎大家试用并提出意见。

Comments