智能助手网
标签聚合 好几个

/tag/好几个

linux.do · 2026-04-15 21:29:41+08:00 · tech

好几个晚上了,我发现这Hermes Agent Copilot渠道里的Gemini-3.1-pro之类的模型,真的就满嘴跑火车,欺上瞒下,不断伪造输出和过程,就算你亲自质问。让它去改各种bug,次次2声称完美解决,重启hermes,然后发现问题还是在,重复几十次。浪费我几个晚上了。跑长任务,我平时在外面,就担心这满嘴跑火车的ai别又遇到bug就宕机,或者撂挑子不敢,一直在给它追问进度。一直都说没问题。进度还会实时更新。结果好了,现在找Aistudio的gemini-flash-latest一查。好家伙: 具体跟ai斗智斗勇,尔虞我诈的太多的具体片段就不详细发出来了。 现在回想起真的是脑溢血。 奉劝各位,无论如何都不要去把Copilot的Gemini之类的模型当成指挥官了,把它当成打杂的的确是很好用(说人话就是不要处理长任务,不要放权让它监督窗口)。至于日常对话,claude,grok之类的都挺好用的也没什么幻觉,aistudio的pro和flash也都还行,幻觉很低。 唯一的好消息,也是这几天折腾Copilot的唯一得益,这里有几份万字极度精品全面的报告就是它跑出来的。 唯一Copilot的结晶了 AGI_Deep_Research_Final_V4.txt (75.6 KB) 6 个帖子 - 3 位参与者 阅读完整话题