智能助手网
标签聚合 最近

/tag/最近

linux.do · 2026-04-18 18:07:57+08:00 · tech

各位佬好,最近在重度使用 AI 辅助写代码,对 Claude 的需求比较大,但一直被渠道和网络稳定性折磨。想请教一下大家目前市面上各类接入方案的实际情况。 我自己了解过并且试过一些渠道,体验都一言难尽: 官方账号反代(C号/池子反代): 这个最大的痛点就是极容易封号。稳定性完全看脸,经常写代码写到一半号没了,心智负担太重。 谷歌 Antigravity (Antig) 反代: 延迟极高,经常卡得死死的。而且给的额度非常少,稍微跑点复杂的逻辑或者上下文一长就不够用了,完全没法满足高频使用的需求。 最近看到市面上还有很多人在说 AWS 渠道 ,我个人的盲区比较大,想重点请教一下懂行的老哥: AWS 渠道到底是什么? 是指通过 AWS Bedrock 申请调用的官方 API 吗?还是别的什么操作? 稳定性和风控: 这个渠道的封号风险大不大?延迟表现如何? 其他方案求荐: 除了上述这些,大家目前在日常高并发/大上下文的开发场景下,还有什么相对稳定靠谱的获取 Claude 额度的路子? 提前感谢各位大佬解惑! 1 个帖子 - 1 位参与者 阅读完整话题

linux.do · 2026-04-18 17:46:34+08:00 · tech

最近半年一直在折腾一个项目——用 AI 自动生成短视频。起因是身边做小生意的朋友总问我能不能帮忙剪视频发抖音,我想这事儿应该能自动化,就开始做了。 分享一下技术方案和踩过的坑,希望对有类似想法的朋友有参考价值。 整体架构 用户上传素材 + 输入文案 ↓ TTS 语音合成(MiniMax / 火山引擎) ↓ 根据语音时长自动分配素材时间轴 ↓ 云端渲染(转场、字幕、BGM) ↓ 成品视频 后端 FastAPI + MySQL,前端 Vue 3,视频渲染走云端 API,手机端用 Capacitor 套了个壳。一个人全栈,没有团队。 几个有意思的技术点 1. TTS 选型 试了一圈,最后主力用 MiniMax speech-2.8-hd,中文多音字准确率目前最好。火山引擎作为补充,主要是剪映生态的独有音色(奶气萌娃、广告解说这种)。Azure 的中文效果一般,Fish Audio 没深入测。 踩坑:TTS 返回的音频时长和文字长度不是线性关系,语气词、停顿都会影响。批量生成时如果对时长有严格要求,需要做重试机制。 2. 素材自动分配 这块逻辑最复杂。用户上传 N 个素材(视频+图片混合),系统要自动决定每个素材展示多久、从视频的哪个位置截取。 几个关键决策: 视频从中间 70% 区域截取(跳过开头 20% 和结尾 10%),因为大部分手机拍的视频开头都是晃动的 图片展示时长根据总时长动态计算,保证每张都出现,最少 1 秒/张 批量生成时用发牌算法分配素材,保证每条视频的封面帧不同 3. 批量生成去重 做矩阵号的核心需求是"一组素材生成几十条不重复的视频"。去重策略: AI 扩写多组文案时分配不同的切入角度(预定义了 30 个角度) 每条视频的素材起始偏移不同 视频截取位置随机化 第一个 clip 强制用不同素材保证封面不同 4. 浮点精度问题 这个坑最隐蔽。视频时间轴用浮点数计算,多个 clip 拼接时 accumulated 会漂移,导致素材重叠或出现缝隙。解决方案是每次用 round 后的值更新 accumulated: cs = round(clip_start, 1) ce = round(clip_end, 1) accumulated += (ce - cs) # 不是 accumulated += clip_dur 5. 实时语音输入 加了个语音输入功能,用户对着手机说文案直接转文字。技术上是浏览器 AudioContext 采集 PCM → WebSocket 传到后端 → 转发到阿里云 paraformer-realtime-v2。 踩坑:中间结果和最终结果的拼接如果处理不好会闪烁,最后用了"快照 + 增量"的方案解决。 技术栈汇总 层 技术 前端 Vue 3 + Vite + Capacitor 后端 Python 3.13 + FastAPI + SQLAlchemy 数据库 MySQL 8 存储 阿里云 OSS + CDN AI 文案 通义千问 TTS 火山引擎 语音识别 阿里云 paraformer-realtime-v2 目前自己和几个朋友在用,做餐饮和服装的,反馈还行。有兴趣的可以体验一下: https://zj.xinghepay.com ,Android 也有 APK https://media.xinghepay.com/xinghe/app/xhzj.apk 技术上有什么想聊的欢迎评论区交流,特别是视频处理和 TTS 这块,踩的坑比较多,能聊的也多 6 个帖子 - 5 位参与者 阅读完整话题

linux.do · 2026-04-18 16:21:24+08:00 · tech

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 事情的起因是,最近想玩一玩胶片摄影,但是奈何 Android 没有很好的测光软件,索性自己就vibe了一个,现已开源: https://github.com/JessieChan0730/com.lamameter.pro 目前 v1.1.0 版本已经实现了最基本的测光功能,接下来计划实现下面几个功能: 白平衡检测 估焦测距 分区曝光 目前部分界面的设计: 求求佬友们给给建议(无论是功能、UI还是BUG都可以) 。如果有佬友喜欢这个项目,觉得这个项目还不错的话,也可以帮忙提提issue或者点一点star​ 。感谢各位佬友的支持啦! 2 个帖子 - 2 位参与者 阅读完整话题

linux.do · 2026-04-18 16:01:52+08:00 · tech

各位大佬们,下午好,本人最近新购入一台macAir 16G 512内存本子准备大干一场,最近国外的模型不好调用,抽也抽不到,抢key也抢不到,哈哈我手太慢了,所有想能够在本地搭建一个 小型的模型供自己使用 gpt 或者御三家都可以的模型(我是小白,各位如果觉得离谱不要喷我),因为我的代码没有那么高深,所以日常够用就行,有的老友说,你可以去用在线模型呀,我最近用trae模型一直在排队,所有我就萌生了自己搭建一个模型的想法。 如果各位佬友们有那种保姆级的入门教程,如何快速搭建一套完整的模型的教程的话,可以分享一下,感激不尽。谢谢大家。 粗体文本 8 个帖子 - 8 位参与者 阅读完整话题

linux.do · 2026-04-18 15:29:32+08:00 · tech

大家好,最近在折腾一个具身智能比赛 ManipArena,想来求点建议,也看看有没有佬友愿意一起研究。 我现在研一,对具身智能挺感兴趣,但相关背景还比较弱,很多东西都在边做边补。暑假想找一段具身方向的实习,所以也有点焦虑简历上项目不够,想趁这段时间认真做一个能拿得出手的东西。 目前是在做一个具身智能比赛叫ManipArena,我选了 pi0.5 / OpenPI 这条线做 baseline,正在一点点把训练、推理、评测和比赛接口这些链路接起来。后面也打算继续做 LoRA 微调、baseline 对比,以及看看能不能做一些闭环评测。 不过我现在也有一些困惑: 像我这种基础一般的新人,做 ManipArena 这种比赛值不值得投入? 如果目标是找暑假实习,这类项目应该做到什么程度才比较有说服力? 应该优先把整个 pipeline 跑通,还是尽量做一点自己的改进? 有没有人也在看具身、机器人 policy、VLA、OpenPI 这些方向,愿意一起交流或者组队? 如果有前辈愿意提点一下方向、资料或者避坑建议,我会非常感谢。 如果有朋友正好也在做类似的东西,也欢迎直接回帖或者私信我,一起研究。 5 个帖子 - 4 位参与者 阅读完整话题

linux.do · 2026-04-18 13:59:12+08:00 · tech

最近大量有人反馈举报相关内容,遂作此帖,用以自查自己被举报的原因,在阅读此帖之前如果你有时间,最好去阅读一下社区准则(如果你还没读过),里面已经收录了,本贴仅仅是对其中最经常出现的进行汇总: https://linux.do/guidelines 然后在列举原因之前,我要说清楚,如果您被举报,在完成下表的自查后如果还不明白为什么被举报,您可以私信论坛管理员或者站长neo, 切勿发帖询问举报相关事宜过度占用论坛公共资源 ,发帖询问可能会导致论坛账号 封禁七天 ,如果你自己不小心发布了相关帖子,你可以暂时将其暂时移动到 深海幽域 ,然后举报自己的帖子,选择 其他原因 ,申请删帖(不会计入connect数据) ,或你见其他佬友不小心发布了类似帖子,您可以将其暂时移动到 深海幽域 ,然后回帖礼貌提醒对方自行删除。详见社区准则: 举报删帖的几种情况 其实举报删帖有好几种情况, 所有的举报都是人工审核通过的 ,不存在机器判定: 同意类(包括:同意但不处理,同意且隐藏,同意且删除等),被举报人会收到处置通知。被举报人的connect会记录举报数据 不同意类,被举报人不会收到通知。帖子不会被删除。 忽略类(包括:忽略且不操作,忽略且删除),被举报人会收到处置通知。但被举报人的connect不会被计入举报数据,收到的通知仅为提醒。 然后如果你的帖子被删除了,但是没有收到通知,则可能是在管理员巡查站内帖时发现违规,此时被删除时,不会收到通知,同时也不会被计入connect,因为帖子没有被举报。 首先看举报按钮中收录的举报原因: 偏离话题 一般出现在回帖的举报中,如果你的回帖和主帖没有太大关系,适用此项 尤其 抽奖 类,最新对于 抽奖 的举报处理方式进行了调整 详见: 进一步优化对抽奖帖回复被举报的处理方式 运营反馈 从 我发现我几乎所有的发言都被举报了,最近论坛内的言论有点风声鹤唳啊 继续讨论: [image] 虽然置顶公告和 社区准则 早就对举报异议做出了指引,但总有那不管不顾的非要跳出来直接发个帖子,大量占用公共资源。 我们可以把情况分为两种: 如果发帖人对举报异议不知情的,那么说明根本没看社区准则,可处理。 如果发帖人对举报异议知情的,那么说明他根本不在乎社区准则,可处理。 我这个人嘛,虽然在置顶… 不当言论 详见社区准则,包括但不限于 aff 链接:社区除了集中帖以外,不允许公开发布aff链接,即邀请码、邀请链接之类的,如果需要,需要私信获取 在跳蚤市场发布灰产来历的商品 网盘资源未发布在指定分区: 百度网盘 ,需要二级才会显示该标签,其他网盘需要三级 涉及政治相关内容 垃圾信息 求赞之类的、或者为了刷徽章、刷信任等级而发一些无意义的帖子,此类视为垃圾信息,然后一些过于水的帖子会被删帖,如签到站拿了一等奖之类的 相关案例: 凑字数 在20字新规出来后,通过凑字来达到20字(可能包括zsbd之类),另外如果远没有20字,通过贴图片达到20字可能也适用此项 AIGC 如果是人工智能生成的内容,论坛发出需要截图 违规推广 推广类帖子需要打上指定标签 公益推广 开源推广 扬帆起航 高级推广 之类,此项适用包括但不限于 在评论区引流其他站点、引流站外交易 公益站内部带赞助二维码,带QQ群之类(视为伪公益) 注意:除了 高级推广 以外,不可以发送QQ群等明显站外引流的内容 非法 黑产来历,包括但不限于:在评论区发虚拟卡、一些明显违法的 NSFW 内容(例如涉及未成年) 其他内容 不适用以上的其他需要注意的,如有你需要申请删掉自己的帖子,也可以选择此项 关于封禁 然后关于封禁,由于封禁案例还是比较少的,这部分原因我会慢慢统计,暂时说一些我知道的: 质疑举报:如上所说,发布相关帖子占用站内公共资源,所有举报都是人工审核后通过的,如果您有疑问,可以私信管理员 开团带节奏类 欺诈,引流站外交易但不售后,中转站爆雷,组车时称有售后但后续拒绝售后等等 搬运站内帖子到站外屡教不改等 批量调整帖子权限,甚至导致发帖人无法看到自己的帖子等类似关车门的行为 大量恶意举报帖子,浪费管理人员过多时间 还有一些出现过的情况:比如大量考古老帖子(回复将其顶上信息流) 公益站公告中引流付费站,视为伪公益 发了帖子引起舆情后,发帖人消失不回应 大量利用脚本刷账号数据,占用论坛服务器资源行为 12 个帖子 - 7 位参与者 阅读完整话题

linux.do · 2026-04-18 13:10:29+08:00 · tech

从 我发现我几乎所有的发言都被举报了,最近论坛内的言论有点风声鹤唳啊 继续讨论: 请不要把互联网上的戾气带来这里! 如果你对自己的帖子被举报处理有任何疑问,请查看 管理员列表 ,点击任何一位管理头像与之私信反馈即可。在与管理沟通之前发帖带节奏的,处理方式一律:删帖+封禁7天起+不予回应。 虽然置顶公告和 社区准则 早就对举报异议做出了指引,但总有那不管不顾的非要跳出来直接发个帖子,大量占用公共资源。 我们可以把情况分为两种: 如果发帖人对举报异议不知情的,那么说明根本没看社区准则,可处理。 如果发帖人对举报异议知情的,那么说明他根本不在乎社区准则,可处理。 我这个人嘛,虽然在置顶公告里嘴上说直接 删帖+封禁7天起+不予回应 但真面对这种发帖,又做不到把心一横直接处理。 上面有个前情帖子,大家可以看一下,我对那些叫屈的一一做了回复。事实就是这样,每天管理要拿出 90% 的精力,来给这 千分之一 不看规则/不守规则的人做解释、做处理。 所以,对于这些发帖人/帖子的处理优化势在必行!尤其是日甚的抽奖帖违规。 说一说接下来我们的处理方式: 对于在抽奖帖子回复凑字数 被举报 的,包括符号、英文等各种 对于在抽奖帖子回复直接复读、复制他人回复 被举报 的 对于在抽奖帖子回复与奖品无关 被举报 的 以上举报处理,我们将一律采用 删除回复+记录举报次数+永久禁言发帖账号 处理。 永久禁言不同于封号,你仍然可以登录浏览、可以私信、可以登录第三方网站,但不能回复帖子、不能发表主题。 不过,永久禁言后,你不再能参与抽奖帖,也不再能发帖带举报异议节奏。 被永久禁言后,如果你觉得自己确实没有出现上述抽奖回复行为,欢迎你随时私信管理进行申诉。申诉通过后,账号将解除禁言,清除禁言次数。 对,你想的没错,我们就是要针对性处理闭著眼睛抽奖的情况。如果奖品你不需要,请把奖品让给别的佬友;如果奖品你需要,就在抽奖帖说说你为什么需要参与并获得奖品。在社区闭著眼睛参与抽奖的日子,过去了。 [!warning] 一句话总结:非必要不参与抽奖。 47 个帖子 - 45 位参与者 阅读完整话题

linux.do · 2026-04-18 13:00:42+08:00 · tech

最近使用了一个双持插件EditorJumper,使用后感觉挺方便的,分享一下 插件的主要作用是在同一个文件中保持的光标位置和编辑上下文位置,按快捷键(win:Alt+Shift+O / mac:Option+Shift+P)在vscode系列和jetbrains系列编辑器间进行跳转。 我的使用场景是在 TraeCN/CodeBuddyCN 中进行 vibe Coding, 在 IDEA 中进行编辑和Git提交 个人习惯以及喜好吧, vscode系的编辑器中写代码总感觉有些别扭, GIT插件也怪怪的 jetbrains系列安装这个 (点击了解更多详细信息) vscode系列安装这个 (点击了解更多详细信息) 1 个帖子 - 1 位参与者 阅读完整话题