四家明星经纪公司创始人辩称:少谈“普遍性”对大家都好

编辑:郭海威 在AI创客嘉年华期间,宇和科技创始人兼CEO翟星吉、Flowith联合创始人CMO拐子、Macaron创始人兼CEO陈凯​​杰、RockFlow创始人兼CEO赖云起、硅星合伙人王朝阳,举行了一场线下“辩论”。这次讨论几乎涵盖了当今人工智能代理创业最重要的所有内容。以下是谈话实录,经过编辑,不改变原意: 普遍性神话 王朝阳:我认为普遍性和垂直性问题是基于论证的本质,而不是论证的形式。基本上每个人都会遇到代理站。它就像一个盒子,里面可以放任何东西。但这实际上解决了一个非常有趣的话题:代理到底是什么?陈凯杰:首先,主办方定义了什么是普遍性、什么是垂直性。对我来说,个人代理比 ChatGPT 更受限制。宰真嗣:我一直觉得你(马卡龙)很厉害技术代理。陈凯杰:(但是)我们又给旅行社扩大了。拐子:我认为(Flowith)是创意代理。翟行吉:正如你所看到的,一切都是垂直的。王朝阳:乍一看,Flowith和Macaron似乎有一些共同点,但语言的根源似乎是垂直的。没有产品。如果您是从头开始,请弄清楚您想做什么,无论是整体的还是垂直的。过了一段时间,你可能会开始思考普遍性和垂直性的问题。先从陈凯杰开始吧。你为什么创造这个产品?您什么时候开始思考这个产品的通用性和垂直性?陈凯杰:我开始提建议。在这次讨论发生之前,我什至没有想过它是垂直的还是普遍的。今年早些时候,我们了解到人工智能正在成功解决生产力方向的许多问题。然而,用户的生活中有很多需求。然而,它们并不完全遇见了。因为?第一个结果是记忆。 AI 听不懂你的意思。它给你的可能是正确的,但没有用处。第二点是没有设备支持。例如,记录体重变化。我想,一边和豆宝聊天一边记录自己的体重变化,这太疯狂了。假设用户想要从人工智能那里获得帮助并想要提供一些建议和分析,但不想在聊天范例中做太多事情。然后,我们的私人代理将帮助您创建您的小程序。从这个角度思考,我们想解决用户生活中的问题。王朝阳:为什么要用经纪人一辈子?陈凯杰:我想每个人都希望自己的生活中有一个私人助理。我并不富有,但我可以想象有钱人的生活。今天我想买东西,所以我给我的助理发消息,他给我买了。我明天就出发,(我的助理)会帮我安排整个行程。这就是我想要的。如果你能更好如果我从之前的旅行中了解了我的偏好,你也许可以帮助我完成这项工作。好的。我想每个人都有这样的愿望。王朝阳:绑匪在哪里?拐子:首先你觉得为什么现在总代理和垂直代理这么流行?因为Manus发布时,视频中称这是“第一个AI代理”,并将通用代理添加到这个主题组中。我们于去年八月推出了第一个代理。当时我们称之为Oracle,并将其定义为AI for DeepWork。我们希望您不仅可以将其用于深入研究,还可以用于内容制作(实践)。例如,一些记者想要调查新闻,可以帮助您撰写高质量的研究报告。自媒体可以帮助您创建短视频和图文,有工作人员。也许你的编码最终会有不同的方向。这对于创建产品原型或小气氛编码产品原型非常有用。在我看来,这个范式不是很普遍且似乎偏向创造。当然,我认为所有伟大的人工智能模型都是通过预测下一个令牌将吐出什么并预测下一个代码中要写什么来构建的。 “预测”这个词可能不太准确,但我认为它主要的意思是“写”接下来会发生什么。我认为伟大的人工智能模型有点像写作。王朝阳:“写作”已经是一个比较普遍的方向。拐子:是的,我们可以做得更多。通用代理确实感觉自己可以做任何事情,尤其是通过内部定义。实际上,我认为Agent General IA一词来自AGI。我们理想的 AGI 是贾维斯。如果你要求他们演钢铁侠,他们会为你做的。如果有一个“通用创意代理”(类别名称),我想将其称为“通用创意代理”,但我不太想将其称为通用创意代理,因为这会让用户产生歧义。这是因为演讲中提到的创意场景应该已经被成功地运用了。但因为由于“通用”二字,用户进入产品后不知道该做什么。这就是为什么我们不喜欢每次发布产品时都称自己为独家经销商。我们在特定场景中生成的内容可能与 Manus 等东西生成的内容类似。人们会用横向的比喻,把我们归入一般代理机构的范畴。如果再有一次机会,我会打电话给创意领域的各个代理商。创意区分为一般区,或一般(内部)场景,和一般区。我们探索垂直行动,但我们仍然可以专注于创造。王朝阳:一开始,“通用”这个词是不存在的,可能是因为它涉及到整个行业。 Flowis 很快就出来了。 “当对手出现时,甚至有一个故事这样说:“你会看到Flowith非常成功地解决了创作问题。” 陈凯杰:说到创作,洛瓦托特工也很有名。你能比较一下Flowith和Flowis的区别吗?洛瓦特?拐子:首先,我们不是竞品。我们是范式创造者,我认为洛瓦托更像是一名设计师。如果我必须想一个口号,那就是“人人都可以成为设计师”。仍然有向视觉创作领域,特别是绘画创作的倾向。图文视频都可以制作,尤其是代码编码。我认为他们很棒,我们是典范的创造者。王朝阳:行集在哪儿?你一开始怎么想?翟星吉:Cua去年开始做这个方向的时候,我们把它定义为垂直。这是因为我们相信代理或人工智能应该成为企业的生产力工具。和B一起做之后,我们更清楚地意识到人工智能将以生产力的形式取代某些东西。基于这个初步的认识,去年我们想考虑两三个最有价值的场景:垂直场景。此外,我们还会从多个角度来思考这个问题。第一个角度表明,在未来所有员工都可以变得垂直。这意味着所有代理现在可以为每个职位垂直工作。从第二个角度来说,作为一个初创公司,我们必须专注。这是非常原始的业务逻辑。我们需要关注更少的宏观故事,更好地做我们擅长的事情并使其发挥作用。今年早些时候,我们有一定的透明度。这就是我们发现的。例如,在任何职位上,特别是在高级职位上,即使你雇用了一个刚毕业的优秀博士生,他或她也可能无法胜任这份工作。你在这个岗位上需要一定的训练,所谓的知识和经验的积累,你更有决心,才能做好这个岗位。具体职位你必须专注于应用,积累知识,积累数据,并根据数据进行工程或建模工作。最终,我可以教导如何在这个职位上取得成功。这是我们必须自己进行垂直调用的一个非常重要的原因。王朝阳:有趣。我还特别关注了今天人们在行动中提到马努斯的次数。上个月我们和马努斯进行了接触,他也提到了我刚才提出的问题,这和你刚才分享的问题非常相似。马努斯分享说,他还说他们讨论了先拍哪些场景。但一个想法是,通过选择单个场景,用户只能在需要该场景时打开产品。那么我该如何保留它呢?例如,电子邮件产品每天只打开一次,因此可以通用。这是他给出的叙述性解释。这不是第一个讨论的话题,但渐渐地每个人都想对其进行分类,并出现了两个部门。也就是说,是市场竞争产生了一些概念之后才开始讨论的。陈凯杰:我回答一个问题。事实上,似乎每个人都在回避一件事。 ——如果我们从总体上或者纵向上看这个问题,似乎每个人都避免竞争。当我们谈论垂直性时,我们说的是:“我在这个阵营,你在那个阵营,我们不打架,所以我们都可以做,我们都可以筹集资金,我们都可以发展。”。我认为Manus在这个话题上特别困难。我是正刚聊天GPT,因为我是海外总代理而出名。虽然肯定有细微的差别,但在很多用户心目中可以用同等的价值来代替。PPT和视频生成,我 相信ChatGPT也有这些功能,但时至今日用户数量却挡不住。第三季度初,我告诉我的团队,ChatGPT 已经有 3 亿 DAU。 Q4到时候我告诉团队ChatGPT的DAU是4亿。很多事情变化太快。当我通过这个词来思考竞争时,我认为这实际上是一种逃避。我想知道的是,由于有很多场景需要解决的问题类似于 ChatGPT问题,什么原因有不同或更好的解决方案吗?我想这才是问题的本质。宰信治:这一点非常重要。当您解决问题时,您开始看到其他代理在解决问题方面缺乏哪些地方以及用户不满意的地方。所以你想,“好吧,我可以做点什么,我可以用这种方式做得更好,它可能更适合这个用户。”从某种意义上说,您是该场景中的专家用户并且拥有大量知识。了解如何使用该产品将帮助您定义应如何使用和执行该产品,以便在此场景中获得更好的交付结果。这是为了寻找更好的解决方案。面对吞噬一切的模型,特工该何去何从?王朝阳:我们谈到了ChatGPT。也许未来是该代理商与其他代理商之间的竞争。我在听之前演讲的时候,提到了下面这句话:“与模型相比,通用智能体是一个伪命题吗?”这一点在之前的交流中也提到过。例如,顾艾子还分享说,他需要有智能体从模型到动作的角度来解决问题,但仍然很难避免这些问题。如果模型变强了,代理会被吃掉吗?特别是模型被送到多个厂家的工厂,还提出了模型加代理的概念。我们先从绑匪开始吧。你们很擅长给事物命名。上一位叫做 Neo 特工,但这次他将被称为太监。我问你一个问题,你为什么想当太监而不叫皇帝?绑匪:我们产品的名字从来不叫太监。太监是内部代号。这只是一个笑话。我们都暗自喜欢电影《黑客帝国》。事实上,我认为技术定义,或者更好的术语,是监听代理。他是倾听者,更直接,更容易理解。太监本意是一个笑话,因为它在中国语境中更容易理解。不过我觉得还是打电话给li比较好斯坦纳斯和连接之前就是要宣布一切。王朝阳:回到这个问题,对应的模特-经纪人关系。这就好像代理人阉割了自己,成为了太监,而不是试图登上皇帝的宝座。拐子:首先,我们先抛开刚刚发布的新特工,回到模特是不是特工这个概念上来。我认为有一个。当然,模特将来也可以成为你眼中的经纪人。这是很有可能的。即使在 O3 和 O4 等模型中,我们也看到许多功能都是为了启用代理功能。这个话题对我(OpenAI)来说肯定很重要,但我认为对用户来说并不重要。对用户来说唯一重要的是什么能帮助他们解决问题。我想大家都在关注Agent。因为 Agent 比传统的大规模语言模型更进一步,将图像、文本和 v5 第二个想法的输出转换为我可以提供的结果。您还可以组合各种东西:PPT、视频和其他任何东西。这与之前的用户体验相比绝对是一个进步。这就是代理商实际做的事情。当然,模型将来有可能会做这样的事情。当然有可能。但首先我想说从市场角度(我还是营销人员)来说,首先这个市场非常非常大,太大了。因为每个人都是代理用户:知识工作者、媒体工作者、手机和电脑用户,他们都需要利用这个来变现、赚钱。因此,在模型出现之前,通用智能体也是当然,你可能会感到受到威胁,但我不认为这是一个伪命题。因为如果模型再次做类似的事情,也可以使用类似的方法和代理。当然,可以将其作为模型来执行,但最终取决于代理的实现方式。我们知道我们需要调用代理并且它需要内存。时间当前的模型训练架构不可能做到这一点。王朝阳:原生模型解决不了。绑匪:是的,有“模范特工”。我们把前半句去掉,问:“万能主体是一个伪命题吗?”我不知道。事实上,用户并不真正理解注意力这个词。我觉得我们这个行业的人、一些媒体、投资者越来越关注这个词了。由于我离市场比较近,所以我认为用户不太关心这个词。这位代理人关心什么问题?你会制作PPT吗?或者 Excel 电子表格?或者你能为我做点什么吗?或许打开时的使用场景是什么?应该什么时候打开?我想这是现​​在所有产品都开始考虑的问题。王朝阳:看来你不仅是一个CMO,而且还是一个产品经理。拐子:我是一名计算机专业的学生,​​所以我认为思考产品是团队营销的一部分。如果你只做营销,你只购买数量或者你做公共关系和广告。但在人工智能营销的新阶段,我认为不能仅仅依靠增加购买量或数量来取胜,也不能仅仅依靠明星营销。当然,这些事情是必须要做的。我总觉得,如果我们正是做好这些事情,那么各大厂商就会有机会。尽管谷歌拥有世界上最好的营销资源,但许多人工智能产品还没有找到自己的PMF。我什至可以说,99%的产品仍处于早期阶段。拥有世界上最强大的产品,如 ChatGPT 和 Manus。嗯,现在还早,机会还很多。王朝阳:你必须参与产品的定义。拐子:是的,这可以让我们知道用户是谁。因为我们认为 CMO 应该非常贴近用户。否则,你甚至不知道你的产品是什么,或者你的用户是什么样的。王朝阳:这可能是一个很好的对手能够与大公司竞争。大公司的 CMO 没有你那么忙。我问了凯吉一个问题。他在刚才的讲话中贬低了“太监”这个词,说不需要太监。马卡龙直接懂你。我认为它的意思是,当出现足够多的场景后,实际上就实现了普遍性。但我们真的能克服这个问题吗?如果一个场景是详尽无遗的,那么它就变得普遍了,这不是有点奇怪吗?特别是在模型被认为是无所不知的情况下。陈凯杰:好吧,我没有看不起你的意思。 Practicalaround世界各地收集来自不同维度的背景信息。作为“聆听者”,这绝对是从“生活之声”方向收集语境的好方法。理想的情况是能够24小时连续收听,但用户可能不会对此感到满意。收集上下文的方法差异很大。我们希望用户能够将这些场景作为背景他们接下来所做的一切,例如食物追踪、健身追踪、日记,甚至是他们自己的旅行计划。我认为今天的许多产品从不同的角度来看待背景问题。特别是,我认为存在着未开发的上下文的宝库,特别是如果我们能够充分利用用户习惯中已经存在的上下文,例如相册。王朝阳:就连苹果的表现也不是很好。陈凯杰:是的,因为里面有很多数据。谷歌可以拿走你的相册,但监管太严格,你可能更难采取行动。但实际上,一本相册包含了很多东西,有很多与生活相关的东西(语境)。骗局我想每个人都想知道文本来自哪里,是“监听者”还是通心粉。回到上一个问题,当我们把这些词放在一起时,我们在谈论什么,通用、代理、模型?我认为当今市场上关于两者之间的关系有一些不同的想法。通用和型号。去年,当我们谈论通用目的时,我们真的认为它可以做任何事情。当时,事前培训仍然是主要目标。但等等,RI\O1 之后,预训练不再是提高模型智能的支柱。模型智能的提升主要是通过强化学习和后期训练来不断提高其能力。对于强化学习,您需要一个参考题库。你必须回答这些问题。无论一个问题有标准答案、人工智能评估还是人类评估,总会有问题。这一过程实际上为该主题提供了不同的“品味”,具体取决于每个主题定义的标准。其实每个人的喜好已经有差异了。和Anthropic一样,经历了所有的编码之后,今天写的代码应该会更好。 OpenAI并不是不想追赶它,也不是不想抓住它。你必须等到破产才能获得用户。 GPT5和 Codex 都不如 Claude 擅长写代码。这是因为克劳德在这个方向上的强化学习做得还不够。反之亦然。 OpenAI 比任何其他公司都能更好地回答一般问题、聊天、内心疗愈和实际问题。人择并不是我想在这个话题上竞争的。因为这是不可能的。可见,大模型已经具备了差异化的场景。我认为争论是否称其为普遍性是没有意义的。我们最想知道的是它覆盖了多少面积。作为一家新公司,我们的影响力有限。我只能掩饰我的生活。可以是生活的一些小方面,比如生活管理、人生规划、吃穿住行等等。Flowith可能是创造,但是,是一种不同的方向选择。相比于模型,我认为模型不再“普适”,尽管普适性是一个伪命题。在自己的领域努力,找到自己的课题。是一个代理,只为一个场景提供一顿现成的饭菜?王朝阳:我无法反驳,那我再说清楚一点。 “只提供一种场景的经纪人是准备好的菜吗?”赖运奇:RockFlow是一家进行投资运营的代理商。对于我的场景,大家都会认为是垂直的。因为在我们的场景中,我们不会要求你给我们买奶茶。所有代理的目标都是解决任务或做事情。我认为这只是取决于场景。上周五,有用户通知我们:“Bobby,首先问我你今天喝了没有,我一键结账太快了,卖完了,我下单太快了,我不想去库存。所以我希望以后他会问我:你今天喝了吗?”我认为你不需要做出这个答案。答案可以从他们的经纪人(另外三位客人)那里得到。我认为(不同的代理)在不同的场景下可以很好地使用(交叉)。这还可能包括财务和医疗保健。他们的经纪人非常垂直,但是y 还可以互相交流。例如,当您感觉不舒服时,您确实不应该进行交易。事实上,我可以更多地访问您的健康数据,以便您的代理广告可以:我可以更好地了解您当前的状态,并相应地做出许多改变和相应的改变。事实上,我同意。通用型和垂直型之间没有真正的区别。您要为用户解决什么问题?如果你的产品能够解决这个问题,那么它就很有价值。王朝阳:我觉得像RockFlow这样的产品就像是把AI融入到现有的系统中。我们先不从该模型的功能开始,今天每个人都对此感到非常兴奋。基于技术的进步,我们必须重新思考我们做事的方式。这是因为我们这个阶段的其他三个公司应该是在ChatGPT3.5之后诞生的。 RockFolw是一家之前想进军金融领域,同时也有媒体方面的公司。我们都知道,一旦交易发生,尤其是在金融领域金融行业的投资回报率与没有交易时完全不同。这让我很好奇,所以我想到了一个与装饰的类比。这个特工已经准备了很长一段时间了,似乎还添加了一些类似于人工智能的东西。赖云起:我觉得这是一个非常好的问题。让我告诉你一些关于我的旅行的事情。我一定比你们所有人都老。我在那里工作了10年才出来。我10年里有4到5年涉足AI行业,最近4到5年在AI初级市场进行投资。事实上,我从事人工智能相关的工作已经有一段时间了。你是绝对正确的。第 1 部分 RockFlow 并不是一家只在 2023 年及以后的大模型之后才会存在的公司。根据我的经历,你大概可以想象我当时为什么要创办这家公司。当我尝试创业时,我打开了我们生活中使用的所有应用程序,例如抖音,它们都是个性化的编辑。但无论什么应用,事实并非如此。我9岁时就开始交易。我对这个话题非常敏感,我发现这是非常错误的。当时,我觉得 RockFlow 只有两点优势。一是多合一,这意味着您可以在一个平台上交易所有股票。第二个称为 AI Native。我是机器学习一代,正在研究“蜂巢”推荐系统。我们最初是在 2011 年第四季度开始的。我们在使用机器学习功能来提供个性化体验方面已经有了一个非常进步的过程。这很有趣,以至于今天很多企业家和投资者,特别是2000年以来的投资者来找我,告诉我他们觉得它还没有实施。他说这话的时候我很困惑。因为我想说整个移动互联网都已经上线了,为什么还没有应用呢?技术总监也很困惑。我原来他是百度深度学习研究院的领导。他说,我是谁,过去10年我在做什么?当每个人定义人工智能时,首先,代际之间的定义是不同的。回到我之前说的,我们的产品确实很特别。我最初想修改和使用现有的人工智能功能来个性化这个产品并创造更简单的体验。时至今日,我认为所有To C产品本质上都是一家产品公司,而不是一家科技公司。如今,即使是大型机型,首先要考虑的就是易用性。如果情况确实如此,那么不使用大型模型可能会有所帮助。我想对于所有的创业者来说,没有人是为了做AI而做AI的。您仍然必须这样做才能满足用户的需求。所以这可能是我今天对好产品的定义。当伟大的模型聚集在一起时,我们创建的第一个产品被称为事务性 GPT。 Si es un usuario antiguo, debe saber que我们有机会推动 Llamaba Trading GPT 和 Trading GPT 等个性化交易。我们是第一家使用大型模型来创建商业产品的公司。王朝阳:你当时是“世界第一”吗?赖云起:是的,在这个过程中我发现了一个非常重要的东西。为什么你会变成现在这个样子?因为它还不够简单。在互动页面上,Rock Flow 的一个有趣的动作非常简单,只需 1 分钟即可完成,并在 1 分钟内存放,解决了很多问题。例如,也许您不知道如何下条件订单?当事件发生时,这与你的立场有什么关系?我不知道当你睡着的时候如何管理账户头寸。 lAl ver a aBuBu en la fila,¿qué puede comprar?托德他们在知道买什么以及如何买方面仍然存在很大的问题。该产品于2023年9月上线,目前Bobby是最老的代理产品这里。这个垂直类别比较具体,所以金融和医药是比较难探索的垂直领域。因此,我们花了近两年的时间来构建我们的代理架构,然后我们开发了我们的第一个产品,我们称之为 Bobby。我们计划推出可以直接在网络上使用且只有 Bobby 可以体验的产品。没有商业应用程序,它是会话式(交互式)的。我们发现,越来越多的用户可以通过对话直接了解发生了什么、买什么、如何选择期权和交易,直到一切完成。事实上,我们有一个进化的过程。事实证明,当技术非常简单的时候,用户仍然无法使用它。关于智能体在自然语言中的交互性,我们学会了如何解构产品,更好地满足每个人的个性化需求。 Bobby出来后,我们定义了这个产品,认为它应该比Rock Flow 1.0更好。上线后我们发现它工作。对于大多数人来说,无论是有一定的投资经验还是很少的投资经验,代理形式都可以帮助他们更好地满足自己的一些投资需求。我认为我们也是一个范例,可以被视为给相对专业的企业家一些不同的经验。王朝阳:我听说(RockFlow)可能利用了人工智能领域新一波的自然语言交互能力以及它正在做的升级。几乎最后,我们创建了“Bobby”产品,您最想创建的特工。过去的问题是人们无法像今日头条或淘宝那样以个性化的方式获取你的商业信息。我在一家财经媒体公司工作,为交易者推出了一款付费产品。因为在国内媒体很难做付费媒体,但是付费的(效果)很好。因为交易者对信息非常敏感,如果他们比其他人早 5 分钟知道,他们就可以赚更多利润。这意味着如果信息不是个性化的,那不是一件好事。例如,如果你认为这些信息对他来说没什么用处,就不要强加给他。然后它变成大葱。 Bobby(这样的产品)会带来更多的大葱吗?赖云池:不,投资是一件非常私人的事情。从这个意义上来说,现在这个行业的人心态最大的不同就是大家都会说:“就像买衣服是为了好看,投资就是赚钱”。我经常举这样的例子。但如果大家都有同一个方面,淘宝就不应该有淘宝,应该是优衣库,应该有自己的SKU,投资也是如此。赚钱的定义因人而异。风险回报(也不同)。有些人想在一年内将投资翻倍,但我可以接受失去本金的风险,所以我投资赚到的钱称为风险回报。如果每个人都有不同的生活和经历不同的人生观,他们的盈利目标在投资风险方面也会完全不同。投资平台上实际交易的产品不是股票或标准化信息,而是个性化的交易机会。我想这可能是因为当我创立Rock Flow和Bobby时,我与商业和其他金融行业的许多前辈有着不同的心态。王朝阳:我今天去体验了一下,我知道非常神奇。没想到Rock Flow给我的体验和马卡龙的体验是一样的。它给你足够的情感价值。当你上去的时候,它会告诉你,你的选择很棒,我们一起缩短Nvidia吧。但我认为根本做不到。我也有和星吉一样的问题。你很勇敢,把你发现的问题都写在了PPT里。主要问题可能是 RPA(机器人流程自动化软件)问题。是“SaaS的复活”吗?翟行吉:是嗯,回到问题本身,如果我直接回答的话,是的,肯定是现成的菜。不过,这道现成的菜还不是工作流程层面的。由于模型本质上是数据产品,因此代理或模型所能做的事情也是数据(即环境中的数据)的反映。基本上,代理只关注一种场景,因为这种场景有更多更好的数据。例如,在现在所谓的通用基础模型中,强泛化是基于两个基础的。第一个基础是它的架构,其参数规模产生了所谓的出现,然后是一些特征。然后,更基本的是语料库及其数据。它包含有关整个互联网事件的所有数据。根据这些数据,您可以做类似的事情。然而,如果我们再进一步,为什么要发布O系列和R1呢?基本上,基于强化学习,我们标记更高级的数据批次、更高质量的数据,以及来自较长思维链的数据。这会给你类似反应的能力。同样,所谓垂直代理,或者垂直代理,在垂直场景下可以更好地工作。基本上,作为这个场景中的垂直制造商,你拥有大量的数据和知识。然后,我们将数据和知识转化为products.ucts,为用户提供更好的体验。成为所谓产品的过程可以体现两件事。一是通过工程来实现。我使用工作流程、代理架构和上下文管理来完成此操作。其次,我有更多的通用技能。将数据转换为代理的微调或执行其他方法将训练后数据转换为模型本身的一部分。但本质上,我将回到前两个问题并更坚定地回答这个问题。这是一道现成的菜。王朝阳:预制食品是有耻辱的。 Shinji Zai:配菜也不错,但问题是产品和价格。用一句话解释一下什么是代理。王朝阳:这很有趣。我们就产品的细节讨论了很多。去年这个时候,当我在旧金山参加科技周时,我开玩笑说,十分之九的人是创始人,十分之五的人是代理人。宰欣子:另外四个人在做什么呢?王朝阳:我也没想到会被称为机构。现在,其中大概有九人是特工。当我与基本上每个机构的创始人见面时,我都会问他们一个问题。您能用您自己的话告诉我什么是代理吗?首先扔一些砖块和灰泥,希望能带来更好的结果。我认为有两个总结对我来说非常好。其中一位是我在 Anthropic 的朋友,他说代理是循环使用工具的模型。他的话后面的非常简洁的句子解释了如何做到这一点。另一位 Genspark 联合创始人在我们的活动中这样说道。这是从产品角度写的。他的机构想要什么要做的就是将 Cursor 带来的经验带给各行业的开发人员。到目前为止我有这些我经常听到的。现在我们问四个人同样的问题,谁先问?陈开济:我觉得比较简单。代理人可以帮助您开展工作。而且你没有提到人工智能。如果我们从事媒体行业,我们经常聘请广告公司来帮助我们做广告。虽然它是一个代理,但它不是人工智能。就这样。我认为你可以做很多事情。现在有些事情是很容易的,也许只是聊天就能完成。请帮我拍张照片。您可以通过将界面打包并出售来创建“照片代理”。就事情进展而言。我认为没有什么更复杂的事情了。王朝阳:你看看人文主义是怎么定义的(这个定义),你就能明白他在做什么。您不必担心任何技术性的问题。陈凯杰:我认为现在的“意识”会发生变化。今天我们在赛道上,明天我们可能在树上。我认为今天的h光标,明天光标过时后,它会被另一个词取代,并且会改变很多次。最终,您今天创建的内容将帮助用户完成复杂的任务。另外,稍后如何实现也是(不太重要)。我想了一会儿,也许将来我们可以创建像呼叫中心这样的东西。大模型调用人类呼叫中心,帮助它做人类做不到的事情,然后回调给大模型。那你管这个叫什么?当然,也可以是代理。绑匪:被困在循环中的人。王朝阳:绑匪,你想好了吗?拐子:刚才讲的两个(观点)特别实用,特别具体,特别是对于行业人士来说,一句话就能明白代理商是做什么的。我比较抽象一点。我以前见过这句话,但这不是我的原创。”(特工)是一个聪明的存在,可以识别他说:“简单地说,就是获取上下文。一方面收集上下文,另一方面存储上下文。我刚才说的我认为这是一件好事,你的智能体会帮助你。但是我认为这背后还有一个非常重要的事情。我认为我可以同意50%的人类学观点,但我认为未来必须是多智能体。当然,多智能体也有局限性,有合作 和冲突,有很多事情可以阻止它。不过,我认为这个问题应该在生命有限的时间内解决,并且我确信它会得到解决。王朝阳:Flowith目前还是单一经纪人吗?拐子:多代理即将上线。我认为我们需要大胆的尝试。多代理应该是未来,证明单环系统是游戏规则的改变者。也可以包含游标。因为这个产品 格式完全是为 IDE 和单一代理代码设计的。现在很多程序员都会批评它。例如,如果光标右下角显示进度条,则当上下文到达某些数据时,幻觉率会增加。因此,上下文可以成为限制级别的新条件。未来的模型能否解决这个问题是另一个问题。光标自己能想到一些解决方案吗?代理能想到一些解决方案吗?每一次都是一次新的尝试。王朝阳:这个我稍后再说。您可以详细分析代理在模型之外做了哪些技术事情。翟星吉,在问这个问题之前,你有没有想过用一句话来描述一个特工?翟星吉:说实话,我从来没有专门用一句话来抽象过。但我觉得大家的看法在某种意义上是一致的。从角度上,从组织上或者结构上看,我同意马卡龙说的。技术是什么并不重要。重要的是,我们希望通过 Agent 实现的是社会化整体变革、组织变革和新的生产力。至于结果,其实很简单。我认为他是一位真正能够完成我自己能做到的事情的经纪人。只要你能做到,你也能做好,完美交付。正如我上面提到的,未来可能是完全的多代理系统,其中一些人成为多个代理的执行者。这是因为人类本质上是金字塔型组织。在组织中,协调总是层层进行的。有特定的组织角色,例如项目管理 PM。项目经理对最终结果负责。项目经理是代理人,就像为他们工作的人一样。然后他们形成一个多代理系统。王朝阳:(笑)题外话,大家都是经纪人。赖云起:我同意凯杰的观点。解决问题的节点可以称为代理。王朝阳:经纪人这个词很有趣。这波人工智能浪潮,尤其是 OpenAI,起步并不顺利。他我发明了很多概念,非常有趣的概念,每天一个。最令人印象深刻的是,Open AI 曾因盗用其语料库而被《纽约时报》起诉。 Open AI的解释甚至用了“沉思”这个词来形容窃取语料库而不向对方支付使用费的行为。然而,在如此纷繁复杂的概念中,“代理”一词终于成为了今天的流行词。包括今天的活动在内,本月共有四场代理商赞助的活动。代理这个词很有趣。上个月,我在硅谷的斯坦福大学进行了一次代理交流。我有一个朋友,是斯坦福大学考古学博士后研究员。我问他,你为什么来这里听这个?他说代理这个词是从我们的人类学中出现的。他解释说,我们赋予非人类物体人类属性,以便它们能够做事。这也适用于代表您行事的代理人、旅行社或中介机构。这意味着当许多人患有 b人工智能和计算的背景使用来自其他领域的词汇,他们并不真正关心它们来自哪里。我意识到了一些事情。听完我刚才给出的答案并做了一段时间后,我发现我又回到了起点。陈凯杰所指的代理人可以在人文社会科学领域进行定义。奇怪的是,在同一个问题中我们发现:Genspark、Simuller、Lowald。我听到观众中有两种不同的声音。一个你有文科背景,大家都觉得很有趣。还有一些做生意的经纪人小声问我:“有什么问题吗?”我为什么要担心这个?但我认为这实际上是一个非常有趣的融合,最终它们真的相交了。您能想象 RockFlow 与通心粉相似吗?王朝阳:现在我们从产品的角度来谈。第一次是辩论,所以我们两人一组来创建一个主题列表。一、RockFlow和马卡龙:你能想象RockFlow是怎样的一个马卡龙?事实上,它的味道似乎有点相似。赖云池:我们很相似。 RockFlow 最初的座右铭是“投资是一种生活方式”。我也把上周陈凯杰的采访发给了我们的同事。这是一家与我们的公司在情感和理念上非常相似的公司。因为投资也是生活的方方面面,它的认知转化为交易。对于回答上一个问题,很难苟同。比如前几天我在贵州做公益,和几百个CEO在一起。当时我告诉大家加密货币公司可以大动作的时候,市场上只有一个人买了,当天就涨了20点。所以我也说了同样的话,但我的信息只适用于那个人。其他七八个人没有这个概念,所以他从来没有听说过。第二天,另一个量子计算企业家表达了量子计算是什么样子,那天你看到另一个做相应事情的人。因此,尽管每个人似乎都有相似的认知和教育水平,但这两条信息都可能是有益的。在投资偏好甚至类别上也可以看到明显的差异。事实上,在我们的知识中我们经常提到如何赚钱,这是非常重要的。很多人感觉不到自己。我认为我们实际上非常相似,因为人工智能往往比你更了解你。陈凯杰:我觉得我们很相似。这是因为Macaron预计未来会插入多个MCP代理。目前,我们还与外卖等各种代理商建立了联系。未来我们可能会看到更多像交易这样的场景(当然交易不一定是马卡龙的主要场景)。事实上,它们非常相似。在所谓的通用垂直的末端,有一个大入口,您可以在其中插入您创建的所有垂直。我不认为那是 pos兄弟姐妹。王朝阳:其实你看一下RockFlow的资料,有一件很有趣的事情。看来我明确表示我的目标是年轻投资者。这在历史上从未发生过(除非法律要求,否则 18 岁以下的人不得投资)。没有任何商业应用程序可以让我知道我的目标受众是 18 至 20 岁的女性还是男性。但现在它起作用了。从生活的角度来说,包括马卡龙。说到情感,所谓的年轻人不是更愿意付出吗?是不是可以在一个相对成熟的行业或者之前没有差距的行业打开一个缺口?这对于这波AI产品来说可能是一个独特的机会。赖云池:我完全同意。您之前提到科技、人文和社会学是完全混合在一起的。这是非常典型的。我们最初为什么想出并创建 GenZ?投资是一种生活方式,我们不需要接受教育,仅此而已。这就是为什么像罗比尼奥这样的人OD 与华尔街。这个问题的结论是什么?首先,年轻一代会有更好的经济基础,所以他们能够促进你的成长。随着时间的推移,你会更有信心。其次,确实新一代的用户可能会觉得这就是我的生活方式,是我想要表达的东西。它不具备 20 世纪 80 年代和 90 年代之前存在的“一致性”。因此,你会想要更主动地表达你的需求,表达“我是谁”。如果您的定制需求非常强烈,以前的所有应用程序演示格式都将更改。我今天说的代理实际上解决了应用呈现格式的很多问题。例如,在携程上,酒店和航班预订都是基于传统产品“最大公分母”的抽象设计。事实证明,每个人的需求是非常不同的。同样,当我旅行时,我过去总是按预算旅行,只带很少的钱,但是现在我发现这个地方的主题很不一样。如果每一项的主观需求都很明确,传统的基于特征的产品形态无法解决问题。因此,在实践中,代理人的技术能力得到了更好的体现。配套Agent的产品可以满足时代各方面的个性化需求,包括新的心理和生活方式。他们刚刚认识。目前美国从事金融科技领域的人有很多,不仅仅是RockFlow,而且很多都是20多岁、30多岁的年轻人。因为您的需求和满足需求的方式完美契合。这是我的领域和凯杰领域的共同点。王朝阳:凯杰在接受采访时说,满分100分的话,他会给这个产品打8分。它不是一个很完整的产品。我们请马卡龙先生录制他的足球比赛。每次我看足球比赛时我都会告诉他们结果。但他做了一些非常基本的事情:踢球。是的,马卡龙很漂亮的。 ItYounger用户表示情感价值很高,对话也相当不错。但也许我可以忍受它,因为我没有得到我想要的。但RockFlow能做到吗?对于这个建议需要花钱。不可能说这个产品给我带来了情感价值,我也不在乎。这是一个非常现实的话题,没有必要回避。赖云驰:满分100分,我现在的分数是5、6、8,就是这个水平。王朝阳:这也是我想讲的。产品不成熟可以做增长吗?赖云起:回答你的问题,人工智能不可能从0到1。因此,对事物的看法和想法首先必须由用户自己表达。 Bobby 和我们所有其他产品都有监管要求,我们会在每一步中与您核实。他只是根据你问的问题告诉你一些相应的事实。例如,如果有人告诉我“选择一个好人”,我会直接遵循该命令。最后,事实证明听从命令其实是最大的需要。表达完这个要求后,他会给你一个结论,并告诉你制作的过程。我需要检查一下。所有订单均经过两次确认。所以这个场景其实更容易实现。后续有明确的要求,按照方法来就可以了。我之前说过,我不会帮你做决定,但我会告诉你,按照你的逻辑,你认为哪一个是投资时对应的行动。王朝阳:这是一个巧合。根据金融监管的运作方式,很难从交易的属性来讨论产品的情感价值,也不可能像我之前所说的那样在桌面上提出建议并将价格分成20%。但现在有了金融+AI,我们就可以把一切交给AI了。 Language Core 和 Flowith 可以互相替代吗?王朝阳:Flowith是一幅免费的画布,也是您的第一幅作品。这背后还隐藏着一件事。正如我所说综上所述,后来我发现有一些好的场景我的产品是非常适合的。为什么不这样做呢? B另一方面,如果我们简单地称他们为数字化员工,Flowwith也能完成这些任务吗?另一方面,如果我们能够成功地抽象垂直领域,是否也是生产力方面的Flowith的另一个版本? Shinji Zai:我认为这与此没有任何关系(笑)。王朝阳:没关系。也就是说,他无法取代你,你也无法取代他。宰真治:是的。我真的很喜欢 Neo 之前做的无限画布交互。从本质上讲,这打破了每个与 ChatBot 和 Chat UI 交互的人的习惯,这是我们非常清楚的。我认为代理不一定需要在聊天中可见。可能有许多最适合您的特定场景的交互模式或方法。在许多情况下,我们的垂直代理不需要聊天,但可以通过 GUI 激活。我认为有都是我们可以互相学习的东西,但是从场景和产品本身的角度来看,我认为不存在任何替代的可能。拐子:我想提一个词,就是我们今天不经意提到的“味道”二字。不管是马卡龙、岩流还是云海,我想我们都喜欢,但又各有不同。我认为我们的偏好与团队的基因有关。首先,我们都是独一无二的。 “我们将于 2023 年开始生产画布,”德里克说。 eo,发布了一条即时消息,说人们没有意识到我们当时有多么痛苦。这是极其痛苦的。我们有大约 20,000 个熟记用户,80% 的负面评论率,这是相当可怕的。 Canvas 是一种令人讨厌的方法和交互,这是可以理解的。我们还是更喜欢微信聊天框,使用小红书和各种社交程序。传统的 GUI 使我们“去个性化”。但我们的出发点不同。我们仍然相信这这不是人类和人工智能互动的最佳方式。我们想尝试新事物。我在这儿。基于此,这个分支还有很多事情要做(探索)。我们认为代理是未来的方向,我们正在考虑接下来会发生什么,(再次)为什么我们构建知识库,为什么我们构建代理,为什么我们构建这些东西。我认为Flowith这个名字很早就出现了,因为我们认为人类的思维是多线程的,并且我们认为人工智能思维的未来只有多线程才能创新。当然,在职业领域场景、B端或者量化交易场景中,你提到了如意算盘必须解决。我想是的。但历史上伟大的设计师,比如最初创建苹果的团队或为最新版本的 IOS 创建液态玻璃的团队,认为它们更有可能出现在 Canvas(人机协作平台)这样的场景中。当然,现在我们测试画布,可能(现在)有很多产品带有 f与画布相关的特性。我认为我和尹惠本质上是在做完全不同的事情,并且有不同的出发点。也许将来你作为代理人可能会做得很好,也可能会做得很差。但每个人仍然认为我们出发的原因是为了创造像画布这样的东西。事实上,我最近又回到了画布上。我们正在使用 Canvas 做很多新的事情,并将在下一个版本中更新。王朝阳:您说在新版本中,声音虽然不是,但在画布上自由流动。拐子:我觉得Neo一代不能算是完全自由的画布,因为它就像一把剑,是往下流的东西。我们希望给人一种代理人重要又不重要的感觉。从产品概念的角度来看,当用户打开画布时,感觉就像打开了一组 Figma/Profile 文件。例如,我是一名设计师,今天我将为 Silicon 配置 UI明星事件,还有小红书的图文,公众号的图文。你需要一整套画布才能做到这一点。您可以调用多个工具,无论是否有代理。您可以分组玩耍,体验细胞有丝分裂的感觉。这些小红书(比如结果)可以发送给下游代理和其他工具,将它们变成更自由的画布。您可以通过与 GPT 或代理聊天来获取结果。 (用户)在画布上有更多的自由。无论是语言输入、图像输入还是视频输入都没关系。我们让它变得更加自由。另外,我们的团队都是纯人才,所以我们更注重用户界面和美观等方面。请在C面做。特别是我之前提到的,很多AI用户都是年轻的,他们都有非常高的审美要求,所以我认为审美产品非常重要。 “对于代理公司来说,AGI难道不值得谈论吗?”王朝阳:下一个话题。除了一些模型技术,像Agent这样的公司在技术方面到底是做什么的或者是重点做的?我发现了一个非常有趣的现象。很多人在谈论PPT时都会引用图片。我认为代理结构最早是在 Lilian Weng 两年前的文章中提到的。代理在中间,内存在顶部,操作在底部,工具在左边,计划在右边。我很好奇,老了吗?基于这四个区别,如果不是过时的话,您认为目前哪一个最需要技术进步?正如我之前所说,我们需要在上下文方面取得很多进展。 Manus CTO 还发表了一篇比较有影响力的文章,讲述了上下文工程中所做的脏活累活。也可以分享给大家。陈凯杰:我认为今天的核心不是这四个模块所关注的内容。毕竟,无论如何,每个人都会这样做。事实上,当今技术的核心是上下文工程。问题是使用机器编程还是强化学习ing。基本上有两个大派别,上下文工程实际上代表了马努斯和其他人所做的很多事情。事实上,你们在这里有很多讨论。也许最重要的论点是上下文工程极大地提高了 iteration.ion 的速度。您可以“每日”更改公司的关键字、工作流程和通话。王朝阳:从技术角度来看,AGI似乎只能通过技术模型来实现?陈凯杰:首先,实现了AGI。如果说AGI的定义是图灵测试,或者是完成复杂任务的能力。如何实现 AGI(如果不能)?即使你在路上开车,你也需要帮忙收拾房子。我们稍后会讨论这个AGI。返回上下文工程来驱动机器学习。上下文工程的代表是Manus,然后是强化学习的代表(OpenAI、Anthropic 几乎没注意到,DeepSeek 应该是),但是从纯粹的应用角度来说化公司中,Tinking Machine Lab 较为典型。他们还做的是强化学习,这是一种相对较慢的训练。事实上,这两个特征是不同的。是的,如果您认为上下文工程绝对是一件非常困难的事情,那么它的速度很快。缺点是系统范围的优化不一定针对单个功能。工程中最常见的问题是跷跷板。将特定过程应用于特定问题将开始降低另一个功能的性能。例如,最常见的权衡是需要更多时间或者模型必须更昂贵才能解决问题。或者,如果您将模型的注意力集中在某个特定方面,效果自然会转移到另一个方面,或者体验会发生变化。这就是上下文工程的问题所在。强化学习的好处是显而易见的。只要有独特的指标,模型就可以不断优化,不断优化评估指标。但这些指标很难确定。所以无论你是在写代码还是解决数学问题,你都需要找到最好的问题,而这个问题经常出现。事实上,该算法并不简单。在 700B (DeepSeek671B) 上执行强化学习需要克服许多挑战。目前,DeepSeek、Kimi 和 Byte 可能是中国唯一能够证明他们可以(并且能够)在如此大规模的模型上运行强化学习的公司。也许你看到的许多其他公司实际上正在小规模地进行强化学习。因此,虽然技术本身很复杂,指标也很难找到,但优化指标是很自然的事情。就像抖音推荐的视频,自然准确率更高。当然,这里也有和上面提到的上下文工程的比较。除非你做很多优化,否则时间会很慢。例如,创建一个 ap乘法中,我们牺牲了一些精度来将功耗降低到原来的 1/10。过程学习牺牲了一些效率,但减少了训练时间。您只需每 2-3 天训练一次,而需要 3-6 个月训练一次。王朝阳:其实所有马卡龙成员都非常关注粉色泡沫,但不太关注后期如何调整。陈凯杰:是的,这些东西对于用户来说是看不见的,所以除非有人问我不会主动说。然后,加速训练,赶上用户的重复率。自发布以来已经大约一个月了,在过去的一个月里它经历了许多迭代和功能。为什么这可能?这是因为我们的强化学习以降低的成本提供了显着的效率优化。所以我认为今天重要的比较是这两者之间的比较,而不是它会朝哪个方向发展。最后,它还有AGI问题。我想今天已经是通用人工智能。现在我们不是在向 AGI 努力,我们已经在从 AGI 开始工作了。 AGI有什么用?当然,你也可以说AGI应该做一切必要的事情来实现AGI。我认为它们不是很重要。目前的人工智能还不是很强大,但它正在进步,而且进步得非常快。我觉得这里面用的是什么价值观和场景其实更重要——与我相比,我们是否应得的问题。王朝阳:我觉得这个还是很有趣的。当您从产品角度考虑实现的 AGI 时,很容易理解为什么马卡龙是这样的。陈开济:是的。正如我之前提到的,我今天创建的小应用程序会记住看足球并记住踢足球。这反映了目前情报的缺乏。但我想大家对AGI的看法是,这个问题如果今年不解决,明年就会解决,或者即使明年解决了,也不会持续太久。拐子:你们这四格子之前提到的有点像我们的底层架构。每个人在某种程度上都是按照这个模型来思考的。正如马卡龙先生刚才提到的,有几点是大家最关心的,我认为主要有两个方向,我是同意的。我告诉大家,我们也是上下文工程路径比较典型的代表。上次我们推出 Neo 时,我们专注于无限的背景。我承认这种无限肯定是一种营销噱头,但在这种情况下的进步绝对比传统模型的可能性大10倍或100倍。因为我们也做了很多工程优化。分享两个小点。首先,我们在设计产品布局时,思考了这样一个场景:“人们如何写文章?”写文章时,首先要进行文献综述,然后写正文段落。我引用了很多文献,最后写出了最后自然段和第一段自然段落。并非所有事情都按顺序开始。一旦您写下它们,您就可以按类别下每个订单。更改。这就引出了我们当时最想包含在我们产品中的逻辑。首先,你的工作不必以与传统人工智能工作相同的方式完成。你的思维结构可能会变得混乱。跟踪与任务完成情况更一致的指标。这是必须在代理的上下文部分中测量的东西。每个任务的步骤都不同,但人工智能并不知道这一点。其次,一旦你最终完成了这项任务,你就需要减少它。目前有很多此类产品,例如 Cursor,可以对编写后的代码进行优化。然而,在优化过程中,我们发现过多轮的代码优化会导致模型上下文中的代币爆炸,成本非常高。我们想在这里进行哪些工程优化?我们应该选择哪种型号?什么米场景?为了适应任务场景,有很多任务要做。而这个调整并不是那么容易的。什么时候需要调整,什么时候不需要调整?是由倡议、用户还是我们发起的?这是一个项目中需要付出很大努力的事情。我们研究这个 Refine 模型已经大约一个月了。有很多场景需要测试,所以需要很长时间才能做好。我认为另一件事是,当谈到工具时,工具实际上是MCP。 MCP的概念非常流行。我帮你普及一下:在我这里的概念中,MCP是一个螺杆模型。统一的螺丝接口让您可以在这款凳子上使用所有螺丝。我们都希望有更多的工具出现。虽然ecosisMCP问题很受欢迎,但许多问题仍未解决。例如,您想要获取有关特定场景的信息或者您需要更好的信息源。当今的许多工具都可以解决这个问题。浏览器使用情况、计算机使用情况、电话使用情况或跟踪器、RPA 等。我想了解e 了解更多有关某事的信息。事实上,最后也是最重要的问题是需要获取准确、高质量的信息来源。 (这里)一方面我们需要解决技术,另一方面我们需要解决我前面提到的上下文。从技术上来说,解决起来相当困难。正如马卡龙所说,这只是时间问题。使用电脑和手机会消耗大量代币,而且非常昂贵。未来可能会出现一些不属于科幻小说的东西。因为很难想象代理或模型强大到足以控制屏幕。这是因为代理和模型完全基于人类与屏幕的交互方式。但是,如果我卸下显示器并留下计算机,它似乎可用。这是代理公司在选择这些工具并确定是否需要创建自己的工具时需要做的很多事情。因为当你构建了一个工具之后,第二天可能会发布一个更强大的模型,使你r 工具没用。这是很有可能发生的。我们应该使用什么工具?大模型制作者可以制作哪些工具?哪些工具是他们不能制造的?目前我们只考虑文本模型,但我们也在考虑各种多模态模型,例如照片、视频和 3D。未来,当像 Genie 这样的全球模型出现时,它们将成为代理生态系统的一部分。它们如何与您的架构中的某些内容相适应?这是一个模型的问题,一方面是它的(工具的协同控制)。 宰辛吉:我觉得这个问题的本质是每个人的场景不一样,就是每个人在实践中遇到的点不同,努力的方向不一样。我们分成三层。在实践中,第一层通常被忽略。特别是对于To C代理来说,内容分析能力(很容易)被忽略。 无论是各种复杂的Excel文档或流程图,还是各种音频和视频录音和屏幕录音,读懂戴尔看似很容易,但实际上却很难。人类是复杂的生物,因此我们在查看信息时会执行许多推理任务。例如,我们经常看到多个PPT,其中包含多个复杂的架构图(即level 1、level 2、level 3)。无论从侧面看还是从垂直方向看,这都是人类经常使用的表达方式。但实际上,该模型几乎没有能力理解此类信息。另一个例子是,如果有人要进行 PPT 讲座并录制屏幕。一个人听的时候,一方面需要看到PPT本身的信息,另一方面也看到这个人讲的信息,结合起来,推理思考,得到信息。这实际上是我们在很多方面的第一点。最基本的一点就是所谓的内容分析功能,这个功能往往被大家忽略,但现实中,在场景中对于需要高精度结果的ios,这是一个非常难以解决的情况。第二层处理上下文管理。除了正常的上下文管理之外,我们还将在不同的方向采取多项举措。例如,人们在工作中使用不同的数据并以不同的方式组织数据。以我们的产品为例。例如,我们是解决方案专家。他经常使用的材料之一是公司和产品演示。对于PPT中的此类介绍性信息,电影的每个段落和每个页面的上下文与前后的逻辑关系并不那么紧密。还有一类,是针对具体案例的最佳实践,可以作为PPT的参考案例。内容非常完整。这是一个非常完整的背景,首先它介绍了客户是谁,然后介绍了他们的背景和挑战,然后是旅程、客户意见、最终影响等。你无法从中提取信息并使用它随意。它需要重组和重建。当你真正作为这两类信息的代理人时,你会发现人类在处理这两类信息时,最初理解时和处理时的逻辑是完全不同的,理解后停止并产生。这实际上适用于某些场景。这意味着你必须成为里约热内卢的一名优秀经纪人。您应该期望在这个角色中可以获得丰富的知识和信息。将自己的知识转化为事先准备好的所谓“信息构建”或“组织生成方法”的算法和逻辑,并使其原样可用。这是保证准确性的重要前提。在第三层代理中,我认为他们都应该有某种内置的工作流程工具,无论是Macaron还是Flowith。这总结了每个人对特定场景的先验知识。这是因为,德根据具体情况,人类有足够的先验知识,并且可以非常有效地持续产生结果。在这种场景下,大家积累了大量的之前的pass,封装在一个类似MCP的工具中,调用给上层agent。这就是为什么每个人都在自己的工作上如此努力。工作流程中的封装之类的事情可能是一项非常基本的任务。有很多场景无法封装在工作流程中,需要更多工作。确保泛化。这包括数据注释、数据合成和各种其他任务。王朝阳:我们结束最后一次RockFlow的演讲吧。赖云池:我简单总结一下。在之前的文章中我在技术层面表达了很多。这个问题的性质取决于业务场景。你真的了解你的业务场景中定义的关键问题是什么吗?然后根据这个关键问题,找到最好的、最重要的技术方案,或者说最重要的技术改进它的要点。比如我们前面讲的智能体和多智能体就非常抽象,在架构设计上已经被划分成了很多不同的具体场景。但当涉及到我上面提到的购买力和订购计算等显而易见的事情时,[代理商]没有必要太过分。应该是一个非常清晰的工作流程,越少夸张越好。对于那些尚未与 RockFlow 进行交易的人。需要解释的是,我们(Bobby)提出的许多问题都是基于想象,无法编码到工作流程中。因此,它必须具有创造潜力,不能用产品来表达和定义这种需求。因此,(问题的)核心是从场景中抽象出需求,(然后)定义这个需求的主要问题,(最后)解决哪些主要技术点最能解决问题。因此,对于每个公司来说,我认为这是一个适应业务和场景的问题io。我想谈谈你的第二个问题。我认为AGI dit肯定会到来。我完全同意。一般来说,技术进步是今天或明天,或后天或明年。我们所有人现在所能做的就是在当前的技术水平下为我们的用户提供最好的产品。我认为我们大家在这个问题上相互鼓励是值得的。这就是为什么我一直这么说:我相信勇敢的人首先享受这个世界。单击“爱”即可。
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。

推荐文章

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注