Zhixin Cai

智谱AI实习工作记录

智谱华章科技有限公司 AI 院,2024.9 ~ 2024.11 第一段实习,虽然碍于平日繁忙的学业压力,从事的是互联网打螺丝的工作,但还是记录一下工作内容,方便以后制作简历/与面试官有的聊,足够把这段经历利用起来。 算法题目改写复杂指令 题目来源:leetcode, SPOJ, Luogu 不把题目作为算法题目来解答,只是把它当作一个逻辑性的题目,对于给定的输入数据,经过逻辑推理推...

Self-Evaluation Guided Beam Search for Reasoning

让模型在推理的每一步进行自我评估和校正,结合随机性探索以提高多步骤推理的准确性和稳定性。 https://arxiv.org/abs/2305.00633 初步调研,没细看论文。 Abstract 将问题分解为中间步骤在大型语言模型(LLM)的推理中表现出色。然而,推理链的增长会带来不确定性和错误积累,从而难以获得准确的最终结果。为了解决多步推理中的不确定性挑战,我们引入了一种 逐步...