搜索

没有相关内容~

思维链CoT进化成思维图GoT，比思维树更优秀的提示工程技术诞生了
要让大型语言模型（LLM）充分发挥其能力，有效的prompt设计方案是必不可少的，为此甚至出现了promptengineering（提示工程）这一新兴领域。在各种prompt设计方案中，思维链（CoT）凭借其强大的推理能力吸引了许多研究者和用户的眼球，基于其改进的CoT-SC以及更进一步的思维树（ToT）也收获了大量关注。近日，苏黎世联邦理工学院、Cledar和华沙理工大学的一个研究团队提出了更进一步的想法：思维图（GoT）。让思维从链到树到图，为LLM构建推理过程的能力不断得到提升，研究者也通
2023-09-05评论:0访问次数:785
思维链如何释放语言模型的隐藏能力？最新理论研究揭示其背后奥秘
思维链提示（CoT）是大模型涌现中最神秘的现象之一，尤其在解决数学推理和决策问题中取得了惊艳效果。CoT到底有多重要呢？它背后成功的机制是什么？本文中，北大的几位研究者证明了CoT在实现大语言模型（LLM）推理中是不可或缺的，并从理论和实验角度揭示了CoT如何释放LLM的巨大潜力。最近的研究发现，思维链提示（ChainofThoughtprompting，简称为CoT）可以显著提升大语言模型（LLM）的性能，尤其适用于处理涉及数学或推理的复杂任务。不过尽管取得了很大成功，但CoT背后的机制以及如
2023-06-03评论:0访问次数:731
GPT-4 做「世界模型」，让LLM从「错题」中学习，推理能力显著提升
近期来，大型语言模型在各种自然语言处理任务中取得了显著的突破，特别是在需要进行复杂思维链（CoT）推理的数学问题上比如在GSM8K、MATH这样的高难度数学任务的数据集中，包括GPT-4和PaLM-2在内的专有模型已取得显著成果。在这方面，开源大模型还有相当的提升空间。为了进一步提高开源大模型处理数学任务的CoT推理能力，一种常见的方法是使用注释/生成的问题-推理数据对（CoT数据）对这些模型进行微调，这些数据对会直接教导模型如何在这些任务中执行CoT推理。最近，西安交通大学、微软和北京大学的研
2023-11-03评论:0访问次数:769
更有用的模型需要更深入地「逐步思考」，而不仅仅是「逐步思考」不够
最近，大型语言模型（LLM）以及它们的高级提示策略的出现，意味着语言模型的研究取得了重大进展，尤其是在经典的自然语言处理（NLP）任务中。其中一个重要的创新是思维链（CoT）提示技术，这种技术因其在多步骤问题解决中的能力而受到赞誉。CoT技术遵循了人类的顺序推理方式，在各种挑战中展现出了卓越的性能，包括跨领域、长期泛化和跨语言任务。CoT以其富有逻辑的、逐步推理的方法，在复杂问题解决场景中提供了至关重要的可解释性。尽管CoT已取得长足进展，但研究界对于其具体机制和有效原因尚未达成共识。这种知识差
2024-01-25评论:0访问次数:447
首个标注详细解释的多模态科学问答数据集，深度学习模型推理有了思维链
在回答复杂的问题时，人类可以理解不同模态的信息，并形成一个完整的思维链（Chain of Thought, CoT）。深度学习模型是否可以打开「黑箱」，对其推理过程提供一个思维链呢？近日，UCLA 和艾伦人工智能研究院（AI2）提出了首个标注详细解释的多模态科学问答数据集 ScienceQA，用于测试模型的多模态推理能力。在 ScienceQA 任务中，作者提出 GPT-3 (CoT) 模型，即在 GPT-3 模型中引入基于思维链的提示学习，从而使得模型能在生成答案的同时，生成相应的推理解释。G
2023-04-11评论:0访问次数:639

更多杂文

思维链CoT进化成思维图GoT，比思维树更优秀的提示工程技术诞生了

思维链如何释放语言模型的隐藏能力？最新理论研究揭示其背后奥秘

GPT-4 做「世界模型」，让LLM从「错题」中学习，推理能力显著提升

更有用的模型需要更深入地「逐步思考」，而不仅仅是「逐步思考」不够

首个标注详细解释的多模态科学问答数据集，深度学习模型推理有了思维链

php.cn