前几天 a16z 公布了全球 TOP 100 AI 应用,在众多海外产品包围中,字节跳动旗下的豆包、豆包海外版(Cici)、Coze 一起上榜,成为国内 AI 应用出海的成功案例。 而根据「身边人统计学」,豆包在我周围中也是比较出圈的一个产品,很多平时不怎么关注 AI 产品的朋友都说豆包是他们接触的第一款 AI 应用。 正好最近我一直在体验豆包电脑版,今天就来聊一聊,豆包电脑版如何将我们手中的老电脑变身为全功能的 AIPC。 AIPC 时代我们需要什么样的 AI 应用从去年开始,AIPC 的概念非常火,但说实话,我一直觉得 AIPC 的概念还有点虚,因为 NPU 的性能显然不足以支撑超过 10B 的大模型,而真正能有高性能独显的设备价格又往往会超出一般用户的预算,现在大多数电脑都不做到真正的端侧 AI,就连苹果也只能做端云混合的 AI。 而最近几年移动互联网的比例明显超过 PC 端,很多应用都只有手机 App 没有电脑版软件。我不知道大家的习惯是什么,我日常还是有 PC 多于用手机的,PC 的多任务、屏幕分区天然地能提供更多的生产力。 在这样的背景下,豆包电脑版的出现并不令人意外,在体验完之后我甚至会好奇为什么其他厂家都没有做出这样的应用,虽然 PC 端看上去有点过时,但 AIPC 时代的新应用显然属于「低垂的果实」,是一片未经开垦的良田。 在大多数 AI 应用都还停留在 ChatBot 网页,依靠一问一答来做交互的时候,豆包电脑版优化了很多场景的触达方式 —— 快捷键唤起、划词搜索、网页上 AI 总结的按键、针对视频和播客的专门优化、跨 PC 应用在其他文本编辑器中直接使用,等等等等。 在这样的交互设计下,可以省去很多对话和复制粘贴,让用户真正一键 AI,处处 AI,这才是从用户出发的产品设计。 豆包电脑版到底能帮我们做什么?朋友之前问我,你天天既要工作,还要写自媒体,忙里偷闲还经常打游戏,哪来的时间。我就会回答他们,因为有 AI。 这样说其实并不夸张,我总结了一下 AI 能帮助我的三个场景,分别是快速获取信息(AI 搜索),快速处理信息(AI 理解),快速生成内容(AI 创作),分别对应输入、整理、输出三个步骤。 举个例子,我今天想到一个选题「RAG 与长文本哪个是大语言模型的未来?」这个话题还是比较专业的,目前也没有什么定论答案。所以我需要搜索很多信息,甚至读一些论文,看一些视频,才能最终产出自己的内容。 如果没有 AI 的帮助,这样一篇文章可能一周都未必能写出满意的稿子。接下来我就演示一下,豆包电脑版如何在全过程中帮助到我。 AI 搜索:搜索 + AI = 个性化的答案选择深入搜索模式,豆包检索了 21 个搜索来源,一口气给我写了 2000 多字的回复,我看了一下,全文的基本结构还是很有逻辑的: 开头说尚无定论,各有所长,然后挨着讲了长文本的优势、RAG 的优势,为什么有人认为长文本会取代 RAG,有人觉得 RAG 很有前景,几乎已经是一篇可用的文章了: AI 理解:网页、PDF、视频、播客统统拿下信息时代已经不再缺乏信息,相反,信息太多太杂,我们难以从中提取精华。豆包则可以很好地帮助我们提炼总结内容,快速理解吸收信息精华。 比如我通过刚才的参考来源打开一个网页,结果文章很长而且网页上也有一些分散注意力的其他元素,这是就要用到豆包的 AI 总结功能了: 除了最基础的网页总结,豆包还支持 PDF、视频、播客,几乎可以说覆盖了文本、音视频所有格式了。 其实现在支持上传文档的 AI 工具有不少,但豆包的体验确实丝滑,还是那句话,产品设计用心了。 豆包的阅读总结页面看上去没有什么不同,但当你上传一篇英语论文,就会发现其中的玄机。在对话的左下角,豆包会提供一个「AI 伴读」的按钮。 点击这个按钮,我们就会得到这样的阅读页面,双栏翻译,侧栏问答… 在豆包电脑版中打开 B 站视频,在顶部可以看到一个「AI 看视频」的标签。点进去就可以解锁看视频的另一种姿势 —— 既有 AI 总结,甚至帮我们自动标注出了重要的章节点和截图,方便跳转观看: 有了这样的功能,B 站真正变成了一个学习工具(话说这功能应该 B 站自己做)。 不知道大家喜不喜欢听播客,播客虽然小众一些,但我感觉很多播客里隐藏着高质量的内容。但受限于音频的形式,播客里的很多内容并没有被有效地收录、检索,从头听到尾又比较费时间。 豆包电脑版为我们提供了 AI 总结播客的功能,以侧边栏的形式帮我们快速整理播客的亮点内容,可以直接跳转时间戳。 除了总结,还会帮我们生成脑图,帮助我们快速理清逻辑,消化吸收其中的内容: 上面这套组合拳打完,对一个话题的理解和积累也就差不多了,接下来就需要把这些内容转化成自己的文字再输出一遍。 |