EEVEE: Towards Test-time Prompt Learning in the Real World for Self-Improving Agents
【arXiv】在本文中,我们提出了EEVEE ,这是第一个针对LLM代理的多数据集测试时提示学习框架,可在真实任务流下实现测试时提示学习。现有的方法主要是为单个数据集设置而设计的,而
gowthammahalingam/Banking-MCP-Server
【GitHub】使用Python、MySQL和Claude AI构建的银行MCP服务器。通过MCP工具实现对银行数据的自然语言访问。(⭐ 0 )
angel-carvajal/adcm
【GitHub】ADCM的开源Claude Code插件和技能—可重用AI工具包的公共市场,随着时间的推移不断增长。(⭐ 0 )
rxNxkolai/AgentTrace
【GitHub】适用于人工智能特工的开源飞行记录器。记录Claude Code会话的内容并写入可读收据。(⭐ 0 )
stacks-loops/bubbles
【GitHub】开源Claude Code行政助理,了解您如何自我破坏,不会让您躲避重要的工作。克隆,打个招呼,加入。(⭐ 1 )
Skill-RM: Unifying Heterogeneous Evaluation Criteria via Agent Skill
【arXiv】奖励模型( RM )为LLM培训后提供关键反馈信号,特别是在加强微调( RFT )和强化学习( RL )管道中。但是,当前的奖励评估依赖于基于规则的版本等异构标准
zarwak/MCP-practice2
【GitHub】“用于开源智能的MCP服务器。搜索GitHub存储库和PyPI包,比较Python依赖关系,通过技能发现开发人员,并确定趋势项目。包含指南,因此(⭐ 0 )
SeyhmusKaya/agent-symphony
【GitHub】Claude Agent SDK的桌面多Agent编排器。通过CodeGraph代码情报、Claude-Code级上下文COMPA (⭐ 4 ) ,指挥人工智能代理的层次结构—酋长、专家、顾问、工人
anthropic-claude-code-ai/free-claude-code-ai-desktop-app
【GitHub】claude code ai免费桌面应用api cli开源开放编码助手双子座替代下载github local llm ollama设置指南教程api 2026 (⭐ 85 )
takuya040321/claude-assets-public
【GitHub】开源Claude Code项目的公共共享资产(规则/技能/模板) (⭐ 0 )