Dynamic LLM-Agent Network

在综述里看到的，介绍 Agents Communication 的结构 “Layered” 里提到的文章。 https://arxiv.org/abs/2310.02170 https://github.com/SALT-NLP/DyLAN. Abstract 集成多个 LLM agent 可以进一步提高性能。文章提出了一个智能体决策团队，基于 query 在动态交互的架构中交流...

Aug 2, 2024 文献阅读, Multi-Agent

Multi-Agent Debate 实现文本评估器

Chateval：通过多智能体辩论实现更好的基于 LLM 的评估器 https://arxiv.org/abs/2308.:07201 ABSTRACT LLM 可以代替人类进行文本作品评估评价，单一智能体评估和人类评估质量有差距。多智能体辩论的评估模式。构建了一个 ChatEval 来对模型的生成质量（开放性问题和自然语言生成 NLG）进行评估。不同的 role prompt 是必不...

Jul 26, 2024 文献阅读, Multi-Agent

Improving Factuality and Reasoning in LLM through Multiagent Debate

多智能体辩论提高语言模型的真实性和推理能力 https://arxiv.org/abs/2305.14325 Abstract 提出了一种改进回答的方法，多个语言模型在多轮次中提出它们自己的回答和推理过程并为此辩论，从而得到一个共同的最终答案。研究结果表明，这种方法在许多任务中都能显著提高模型的数学和策略性推理能力。这种方法提高了生成内容的事实性，减少了现在的模型容易产生的错误答案和...

Jul 25, 2024 文献阅读, Multi-Agent

综述：基于 LLM 的多智能体

https://arxiv.org/abs/2402.01680 Abstract 近年来，基于 LLM 的多智能体系统在复杂问题解决和世界模拟方面取得了很大的进步。文章目标是为了让读者对下面的问题拥有实质性见解：基于 LLM 的多智能体模拟了哪些环境？这些 agent 是怎么被 profiled（描述）的，他们之间如何交流？什么机制使 agent 的能力提高了...

Jul 19, 2024 文献阅读, Multi-Agent

Mixture-of-Agents

重点：看看方法，实验是怎么做的，怎么评估，用的什么 benchmark。 Abstract MoA 分层体系结构，每一层包含多个 LLM agent，每一层的 agent 借助前一层的 agent 输出作为辅助信息来响应。 MoA 模型在 AlpacaEval 2.0（用于评估预训练语言模型性能的工具）, MT-Bench（针对机器翻译任务的基准测试集合）和 FLASK（用于评估大型语...

Jul 13, 2024 文献阅读, Multi-Agent

2024 BUAA OS 理论复习笔记

2024 OS 理论复习笔记 [TOC] 1. 概论 1.1 操作系统的发展变化 1.1.1 批处理把用户提交的作业成批送入计算机，由作业调度程序自动选择作业运行，在没有人工参与的情况下，顺序执行一系列的程序。同一时刻只有一个软件执行，软件运行时，可以独占全部硬件资源，不支持多用户、多程序同时运行。联机：作业输入输出由 CPU 处理脱机：输入输出脱离主...

Jul 13, 2024 期末复习, 操作系统

BUAA-OS-lab6

lab6 实验报告思考题 Thinking 6.1 switch (fork()) { case -1: break; case 0: /* 子进程 - 作为管道的写者 */ close(fildes[0]); /* 关闭不用的读端 */ write(fildes[1], "Hello world\n", 12...

Jul 12, 2024 操作系统

BUAA-OS-lab5

lab5 实验报告思考题 Thinking 5.1 缓存机制的设计是为了提高效率，数据在发生改变时不立即写入内存，而是在 Cache 发生替换时才写入。这对于需要实时交互的外设来说会带来问题，因为如果写入 kseg0 部分，数据可能很久都不被真正写入内存中，引发错误。这种错误对于串口设备来说出现的可能性大，磁盘相对来说较小。 Thinking 5.2 一个磁盘块的大小为 4K...

Jul 12, 2024 操作系统

BUAA-OS-lab4

lab4 实验报告思考题 Thinking 4.1 内核在保存现场的时候会调用 SAVE_ALL 函数。这个函数的内容如下： .macro SAVE_ALL .set noat .set noreorder mfc0 k0, CP0_STATUS andi k0, STATUS_UM beqz k0, 1f ...

Jul 12, 2024 操作系统

BUAA-OS-lab3

lab3 实验报告思考题 Thinking 3.1 e->env_pgdir 代表当前进程的页目录的基地址。在 MOS 中，每个进程都有自己的页目录，用于存储该进程的页表信息。 PADDR(e->env_pgdir)：这个函数获取页目录的物理地址。PADDR是一个宏，用于将内核虚拟地址转换为物理地址。 PTE_V：这是一个标志位，表示页表项有效。PADDR(...

Jul 12, 2024 操作系统

Dynamic LLM-Agent Network

Multi-Agent Debate 实现文本评估器

Improving Factuality and Reasoning in LLM through Multiagent Debate

综述：基于 LLM 的多智能体

Mixture-of-Agents

2024 BUAA OS 理论复习笔记

BUAA-OS-lab6

BUAA-OS-lab5

BUAA-OS-lab4

BUAA-OS-lab3

Trending Tags