今日刊

🤖 AI Agent 研究

TOPSkill-RM: Unifying Heterogeneous Evaluation Criteria via Agent Skill

【arXiv】奖励模型（ RM ）为LLM培训后提供关键反馈信号，特别是在加强微调（ RFT ）和强化学习（ RL ）管道中。但是，当前的奖励评估依赖于基于规则的版本等异构标准

查看原文

researchpaper

AlignAtt4LLM: Fast AlignAtt for Decoder-Only LLMs at IWSLT 2026 Simultaneous Speech Translation Task

【arXiv】我们介绍AlignAtt4LLM ，这是一款适用于英语到德语、意大利语和中文的IWSLT 2026同步语音翻译系统。系统是一个同步级联：强制对齐的Qwen3-ASR生成一个增量更新的源转录本，并且

查看原文

researchpaper

Agentic Chain-of-Thought Steering for Efficient and Controllable LLM Reasoning

【arXiv】大型语言模型通过扩展思维链推理提高了最终答案的准确性，但通常花费代币效率低下，几乎没有推理时间控制。现有的有效推理方法通过缩短时间来控制思维长度，

查看原文

researchpaper

Self-Refining Agentic Reinforcement Learning for Vision-Conditioned UAV Navigation

【arXiv】深度强化学习已显示出强大的潜力，使自主机器人能够学习复杂的导航任务。然而，它的实际使用仍然在很大程度上依赖于人类设计的奖励功能和重复的手动微调，

查看原文

researchpaper

⭐ GitHub 热门项目

TOPXiaofeiCY/anche-report-skill

【GitHub】用于指导绩效考核、工作报告、git提交摘要和Excel模板填写的开源Claude Code/Codex技能。（⭐ 0 ）

查看原文

githubopensource

nedzdead-dev/massive-agent-repo-1003

【GitHub】聚合—来自10个开源项目的1005个Claude Code子代理。原作者的全部功劳（见ATTRIBUTION.md ）。（⭐ 0 ）

查看原文

githubopensource

GoTolstoy/agent-skills

【GitHub】开源代理技能+托尔斯泰的Claude Code插件—通过托尔斯泰MCP创建营销视频/图像并重新组合您的库。（⭐ 0 ）

查看原文

githubopensource

🚀 模型与行业动态

TOPCyera eyes $12B valuation at 80x ARR multiple despite operating losses

这家网络安全公司即将获得由Evolution Equity Partners领投的3亿美元$一轮融资。

查看原文

industrytechcrunch

Uber caps employee AI spending after blowing through budget in 4 months

据报道，在优步鼓励员工尽可能多地使用人工智能之后，优步进行了裁员。

查看原文

industrytechcrunch

New Microsoft tool lets devs spin up AI behavior tests using text descriptions

微软周二结束了自适应规范驱动的评估和回归测试评分，这是一个用于启动人工智能评估的开源框架。

查看原文

industrytechcrunch

Martin Scorsese becomes the latest — and most unlikely — Hollywood voice for AI

需要注意的是，世界上最著名的在世导演之一将该技术仅用于情节提要。

查看原文

industrytechcrunch

Microsoft launches Scout, an OpenClaw-inspired personal assistant

在Build上推出的Microsoft Scout是一款新的人工智能助手，旨在将OpenClaw的强大功能和灵活性带入Microsoft 365系统。

查看原文

industrytechcrunch

🔥 社区热议

TOPMicrosoft CEO: We’re moving from OS and apps to agents instead

【Lobsters】热度: 4↑ | 4 评论 | 标签: ai, windows

查看原文

communitylobsterstech

strace-ui, Bonsai_term, and the TUI renaissance

【Lobsters】热度: 28↑ | 1 评论 | 标签: linux, ml

查看原文

communitylobsterstech

AI outperforms law professors in Stanford Law study

【HN】热度: 92 分 | 84 评论

查看原文

communitydiscussion

MAI-Code-1-Flash

【HN】热度: 389 分 | 178 评论

查看原文

communitydiscussion

Open Repair Data Standard – Open Repair Alliance

【HN】热度: 91 分 | 3 评论

查看原文

communitydiscussion

More than 6 out of 10 people turn to AI for psychological support

【HN】热度: 52 分 | 42 评论

查看原文

communitydiscussion

LLMs are not the black box you were promised

【HN】热度: 43 分 | 24 评论

查看原文

communitydiscussion

Gmail thinks I'm stupid, so I left

【HN】热度: 625 分 | 395 评论

查看原文

communitydiscussion

🤖 AI Agent 研究Research

⭐ GitHub 热门项目GitHub Trending

🚀 模型与行业动态Models & Industry

🔥 社区热议Community

🤖 AI Agent 研究

⭐ GitHub 热门项目

🚀 模型与行业动态

🔥 社区热议