写作这事,AI能帮什么忙?

  每次写稿,最痛苦的都是开头。所谓下笔无神,坐在电脑前东摸西摸,百般拖延,就是没有办法开始敲第一行字。

  如果面向全国中学生做一个问卷调查,问他们最痛苦的任务是什么,语文作文将可能成为第一名。据我观察,许多人在中学语文课堂上留下的梦魇足以伴随一生,会在每次需要提笔写作的时候突然被唤醒,让人忘记如何说人话。

  但写作又是一件无法避免的事情。即使不用写专栏,即使工作和写作没有直接关系,恐怕也要写文档、写工作计划、写述职报告、写会议记录……还有婚礼的致辞、葬礼的悼词等等,都需要写。如今不管是控诉上司还是伴侣也流行往社交媒体发小作文,而作文写得好不好,直接影响传播效果。

  我不是专业的写作者,但高考语文也考了快140分,写作文对我来说理论上不在话下。感谢我的舅妈和历任语文老师,让我知道写作的本质是表达,最重要的还是要感受自己想要表达什么。即使如此,还是很难动笔:不是没有东西要写,但面对千头万绪的混沌状态,似乎还是很难撕开一个口子,摧枯拉朽地让脑子里面的东西一泻而出。

  每当此时,我又会开始想,AI能提供什么帮助。于是,在拖延写作的这段时间里我又会将市面上的AI工具尝试一圈,看看到底有没有哪个能给写作帮上点忙。

  AI写作,或者说AI生成文本,出现的时间早于ChatGPT。事实上,GPT一开始就是用来生成文本的,只是后来OpenAI发现也可以用来聊天(毕竟聊天本质上就是两个人根据之前的聊天记录继续生成文本),这才改造出了ChatGPT。

  我最早试用的文本生成产品是Notion中的AI写作功能,它从2022年11月中旬开始内测,比ChatGPT的推出还早半个月。同一时间,我使用的笔记产品Craft也推出了自己的同类功能。它们的背后都是GPT或者Claude,我记得我在那两个月的专栏中就尝试过使用AI写作。

  快进到今天,几乎所有国外的办公软件中都已经集成了生成式AI功能,包括微软和Google在内的许多技术公司最喜欢在发布会的舞台上演示的一个场景就是一键生成各种长篇大论,比如邮件、文档、营销计划等。

  效果如何呢?可以想象,如果你只是输入“帮我写一篇专栏吧”,AI会瞎编一篇多么废话连篇的文章。这并不是由什么技术限制导致的,不是我们常说的“AI幻觉”。还是用我们经常打的比方,如果把AI看成一个受过良好教育的实习生,它今天初来乍到,对你一无所知,一上来就要求人家“写篇专栏”,它除了瞎编,还能做什么呢?

  当然,如果你提的要求不太需要对你有所了解,而是基于常识,那生成效果相对是比较好的,比如我曾经用AI来生成事故处理协议、给客服写的投诉信、大众点评上的评论、闲鱼的商品文案……

  至于各大公司画的“一键生成”的饼,我觉得还是代表了人们的美好幻想,就和人们幻想长生不老一样。去年我刚开始了解大语言模型时,读的是王建硕老师的几篇科普文章,它们从使用者的视角教你如何和AI打交道。其中有一句话我印象很深,“不要把ChatGPT当作你肚子里的蛔虫”。是呀,让陌生人一键写出来的东西,能用就怪了,但有趣的是,这就是我们对AI的期待。

  也不能完全怪人类,谁让今天的AI很少反问呢?如果是一个真的实习生,我大概会教他,一定要学会反问,而不是瞎编。向Perplexity提问时,如果问题比较模糊,它会反问以确认自己是否正确理解了你的问题,我们自己在做AI产品时也非常希望AI不要添油加醋,并且能学会反问。有了反问,这就让人放心很多。

  如果对方不懂得问,那就要主动告诉别人,就像我们也可以吩咐实习生,你先把这些资料读一下。

  让AI读资料还是有点儿麻烦的,这主要怪聊天界面。今天大多数的大语言模型标配的都是聊天界面,尤其是刚刚推出的最新模型,一般都只能通过官方的聊天界面使用,还没有开放给第三方应用。在这点上,聊天框有点像是上个时代的搜索框,是一个万能的基础形态,任何需求都能满足,但也有很多需求用它来满足并不顺手。

  例如我最近安利给很多朋友的Kimi,其特点是长文本,但就官方举例的使用场景来说,不管是往聊天框里面输入200万字,还是传500份简历,或者在别的地方看到一个网址再复制粘贴过来,都不算顺手。

  另外一个障碍,则是市面上所有的产品都照搬了ChatGPT的设计,用户可以和AI开启多个对话记录,然而这些对话是不会共享记忆的。当然,这么设计,本来就是因为此前的大语言模型上下文窗口很小。这可以粗略理解成AI只有短期记忆,很容易出现聊着聊着AI就忘了刚刚说过的话的情况,所以才需要这样的设计,保持每个对话较短。

  但这带来一个问题,就是我每次想让AI完成一个新的任务,都得重新给它背景资料。这有点像你每次见到你的实习生,他不认识你。由于经常需要请AI重新阅读资料,之前我花时间把往期专栏整理成了不同格式、大小的文件,放在桌面上,方便随时上传。普通人是不会有耐心来做这个事情的,相比“提示词工程”的难度,这一点更容易阻碍普通人使用AI。

  其实,AI能顺畅阅读背景资料也就是最近才能实现的事情。本专栏已经写了25期,共约10万字,超过了市场上大部分模型的上下文窗口,也就是说,没有办法直接放在AI的短期记忆里面。一般的产品会用一个叫RAG的方式去解决这个问题,这是一个外挂的“大脑”,打个比方,有点像脑子里装不下的东西先抄在小抄上,等考试要用的时候再去翻。不在脑子里的东西,运用起来效果还是会大打折扣的。

  据我所知,市面上普通人能接触到的支持10万中文字的产品只有Kimi。Google的Gemini Pro 1.5也能支持,不过目前只通过API提供给开发者,还没有被整合到Google的产品中。Kimi最近开始内测200万字的上下文窗口,更是大幅提升了这个门槛。有些产品宣称支持1000万字,据说是使用RAG的方式实现的—通过这种方式,想装多少字其实都可以。

  实际上,200万字和最初的ChatGPT相比,已经提升了1000倍。产品形态可以有一些变化了。

  说回用AI辅助写作。大家知道,正常情况下你是不会在一个聊天窗口中写作的,而是会用类似Word这样的文档编辑工具。那如果你同时需要和AI“聊天”,那就麻烦了,得几个窗口切来切去,来回不断地复制粘贴才可以。如果对AI生成的内容大体满意,但只是想精准地调整一大段文本中的一句话呢?要用语言描述这种要求非常困难。我之前尝试过请AI修改文风、校对、编辑、简化语言……都非常麻烦。

  最近我倒是发现了一个挺好用的工具。你可能猜不到,这篇专栏是在VS Code中写的。这是微软面向程序员推出的一个用来编程的编辑器,购买了GitHub Copilot后,可以随时在里面召唤AI来撰写、修改代码。反正代码和专栏都是语言嘛,效果还是不错的。

  针对不同的场景去做“顺手”的界面并不难。比如总结链接就不如做一个浏览器插件,一个实习生花一个周末就能写出来。为什么不做呢?我猜测有一些特别的考虑。当然,也有可能是我想多了。去年这个时候我曾经在直播中和其他CEO讨论过为什么ChatGPT不推出App,对方列举了一些理由,而我说可能只是还没有做出来罢了。果然,过了不久,ChatGPT就推出了自己的App。

  也可能是我把这事儿想简单了。多年的工作经验告诉我,工程师们总会高估解决一个问题的难度,而低估其工作量。

  那聊天适合做什么事情呢?回想现实中的写作过程,和编辑、记者聊天,回答他们的问题,本身就是一个不错的获得写作灵感的方式。所以,和AI讨论选题,请它扮演读者告诉我想看什么,甚至把大纲给它看看,讨论下能不能用有创造性的方式来梳理故事线……这些操作的使用感受都还不错。

  今天的AI产品一是缺少关于我的个人数据,二是缺少直接执行操作的能力,这些都导致它们没有办法对普通人“开箱即用”。

  王建硕老师的那句话我一直在想。一开始是从使用者的角度提醒自己,不要把AI当成我肚子里的蛔虫。但后来切换到做事情的角度,就会想,凭什么AI不能成为使用者肚子里的蛔虫呢?我们怎么样才能让AI成为使用者肚子里的蛔虫?在脑机接口被广泛应用之前,还是需要一些别的方式。

  这也是为什么我之前很期待Google和微软分别将AI整合到自己的办公套件中,即Google Workspace和Microsoft 365(它的原名Office大家更熟悉一些)。我个人在Google中保存的数据更多,20年来的邮件记录和工作文档都在Google,理论上它应该比蛔虫更了解我。而它们的AI都可以直接在编辑器中使用,理论上可以省去了来回复制粘贴之苦。

  Google的版本(Gemini for Google Workspace)我在3月初拿到了内测权限,而微软面向个人的Copilot Pro在1月发布,我也第一时间购买了。但测试结果都让我非常失望,它们仍然看起来一问三不知,想请它们帮忙修改的文档,十个也有九个做不了,不知道到底实现难点在哪里。

  这个领域还是有很多做新产品的机会的。有一些产品已经拥有关于我们的大量数据,自然做起来比较容易。有一些开发者另辟蹊径,希望用不同的方式来获得用户的数据。我去年提到过的Rewind通过直接录屏的粗暴方法采集数据,我坚持使用了一年多,电脑中存下了108GB的录屏,应该有接近3000小时。但这些数据怎么用,似乎也还没有好的方法,噪音过多,AI无法区分哪些重要哪些不重要。另外有几个新的硬件产品,如Humane Ai Pin、Rabbit R1等,通过随身录音的方式采集数据,不知道会不会遇到类似问题。

  是不是其实没有必要收集用户所有的所见所闻,努力降低用户输入的门槛,也能捕捉到更多有一点点价值的火花?这是我正在尝试的。现在我自己大部分的碎片想法都放在原型产品中,写稿的时候拿出来,也是灵感的来源。

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: