生成式人工智能导论-杂项


本系列生成式人工智能导论博文基于国立台湾大学李宏毅老师发布的课程视频整理而来, 仅用作复习参考.
可以算是人工智能领域的入门课程.
需要明确的是, 李宏毅老师上传的课程已经是2024年的课程, 距今有两年的时间, 知识难免有过时的可能, 如果出现了这种情况, 博主会尽可能补足当前的状态.

生成式人工智能导论 杂项

我们在此前的文章梳理中, 事实上已经将大语言模型的运行逻辑, 训练过程等等内容都说完了. 尽管我们并未触及到很深入的细节, 但可喜可贺, 我们已经对全局性的知识框架有了系统的了解.

本篇博文会针对一些细节性的, 或者杂项进行相对应的梳理总结工作.

4.1 AI Agent

人们对于大模型的期待, 当然远远不止 文字接龙 这么简单.
我们回到第一章中提到的, 我们对人工智能的目标定义上: 让机器展现出智能. 我们希望, AI在面对一个任务时, 能够展现出像人一样的思考方式: 它能够自行做出任务拆分, 自行制定计划, 自行在计划发生改变时进行对应的行为变更.

AI Agent

从目前的研究中, 主要的重难点包括:

  • 推理 / 规划
  • 记忆
  • 工具使用

其实从2026年初的状况来看, 第一者与第三者都已经比较成熟了, 但就是这个记忆机制, 仍然经常会 “抽风” .

与此同时, 多智能体(Multi-Agent)也成为了主流, 它衔接了我们在上一章中第二个训练阶段的微调方向, 希望将AI训练成多方面的专才, 并让多个AI来协同工作.


文章作者: MUG-chen
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 MUG-chen !
  目录
加载中...