GPT语音速记工具的迭代

记录一下近期对基于GPT的语音速记工具的产品迭代的过程。以前我在开发这个语音录入工具时,已经对GPT的能力边界进行了很多探索。我觉得它在很多领域的智能表现得非常superficial。换句话说,它给出的回答或得到的结论很多时候是相对浅显的,不像有多年经验的人会给出特别有洞察力的回答。这就是为什么我一开始把它定位成一个文本处理的秘书,只需要复述我的观点,把它重新组织成一个有条理的形式。

但是最近我逐渐开始尝试深化它的功能,让它在文本之外对我的想法提出一些评论。具体来说,我给它加了一个prompt,让它针对我刚才说的话提出一个有启发的问题,看看我有没有思维盲点,然后再提出一个反驳的想法。尝试了几次后,我发现这确实有启发。很多时候我们并不需要特别深入的回答或意见,因为有个二八定律,即我们80%的时间都花在20%重要的工作上,20%的时间创造了80%的价值。我们不能期待每一个决策或每一件事情都非常有挑战和重要。对于这种占大部分的工作,我们其实不需要特别有洞察力或深刻的意见,而更需要的可能是提醒,即使是简单的提示也很有价值。

从这个角度来说,我觉得GPT是有能力完成这一切的。在很多情况下,我都可以从它的回答中学到一些东西,让我的想法逐渐迭代,变得更有深度和全面。因此,在和课代表立正做了更多的讨论之后,我们对这个产品的形式进行了改动。以前它只是一个语音识别和速记工具,输入是语音,我们把它整理成一段文字后,这件事就结束了。这个文本会被存储在某个知识管理系统里,除非我们要写文章,否则不会再拿出来做进一步的改动。

但现在我们把最基础的处理单元从语音变成了一个具体的"想法"(idea)。首先我们会用速记的形式来获取想法,然后拿到GPT重新整理的想法后,我们可以利用一些提示让GPT提出一些有深度的问题和批判性意见,从而让我们的思考变得更有深度。在这个想法的基础上进行迭代后,我们还可以对这个想法进行特定的重塑和输出。具体来说,我们可以通过某些prompt来增加它的易读性,或者让它看起来更高级,或者是让它呈现某种特定的风格。这样就完成了一个想法从获取到迭代到输出的整个过程。相比之前把GPT仅当作一个速记工具,这样的产品形式更上了一个台阶。而且我已经切实体会到,在现实生活和工作中,它有非常实际的助益。

正如我们之前提到的,如果一个知识仅仅停留在脑海中,而没有将它记录下来并放入某个持久化的系统中,那么它的作用将会受到很大的限制。这就是为什么我不仅让这个工具以Telegram为平台,与用户通过对话形式进行交互,还为它添加了一些导出功能。例如,现在每天晚上都会运行一个脚本,将当天记录的想法全部导出到Notion中。因为这个工具极大地降低了思想记录的门槛,所以我更愿意使用它来记录。仅仅今天,它就记录了6600多字,重新看这些想法,温故知新本身就很有价值,更不用说未来在搜索和聚合中可以产生更大的作用。这个观察验证了我们之前的一个想法:GPT和语音记录工具(现在已经是想法迭代工具了)可以极大地降低知识获取的门槛,提高知识获取的效率,甚至摧毁旧有的知识管理体系。接下来,我打算继续迭代这个工具,在使用几天后再来分享新的感想。

Comments