IT之家 4 月 18 日消息,大疆最近在官网宣布,4 月 21 日下午 14:00 将推出一款新品, 宣传语为“载”来点想象 。 和往常一样,大疆并没有直接公布这款新品的具体品类。不过从宣传图片剪影和官网分类来看, 这款新品应该是农业无人机 ,感兴趣的小伙伴们可以关注IT之家后续报道。
大疆pocket4值得买吗?前面没买3,现在出了4在想要不要买,平时可能会出去玩拍拍照 5 个帖子 - 5 位参与者 阅读完整话题
大疆 Osmo Pocket 4 云台相机 2026 年 4 月 16 日发布,标准版官方售价 2999 元。 今日 17:00 京东再次开放购买,有需求的小伙伴可以入手啦: 京东 大疆 Osmo Pocket 4 标准版 一英寸口袋云台相机 2999 元 直达链接 另外,大疆 Osmo Pocket 3 云台相机也在大促中,标准版官方售价 3499 元,今日仅需 2799 元即可入手: 京东 大疆 Osmo Pocket 3 标准版 一英寸口袋云台相机 2799 元 直达链接 Osmo Pocket 4 搭载全新 1 英寸 CMOS,结合 f/2.0 大光圈,动态范围提升至 14 级,支持 10-bit D-Log 色彩模式,慢动作录制规格升级至 4K/240fps,同步新增支持空间音频录制与变焦拾音功能,机身支持 OsmoAudio 直连 DJI 麦克风发射器,并可录制四声道音频。 该机搭载智能跟随 7.0,支持最高 4 倍距离的智能跟拍。机身同步升级智能对焦系统,新增“锁定主角追焦”与“登记主角优先”模式,新增的手势控制功能,无需触碰屏幕,简单手势即可启动或停止跟随、开始或结束录制。 该机针对人像肤色表现进行进一步调校,在不同场景与光线下都能呈现通透自然的肌肤状态。新增内置的美肤滤镜,可自定义调节磨皮效果、美白等级和肤色冷暖调,轻松优化人像表现。此外,本代产品还可搭配外置补光灯使用,小巧便携,支持三级色温与亮度调节,一键补光点亮面容。 京东 大疆 Osmo Pocket 4 标准版 一英寸口袋云台相机 2999 元 直达链接 京东 大疆 Osmo Pocket 3 标准版 一英寸口袋云台相机 2799 元 直达链接
IT之家 4 月 17 日消息,博主 @数码闲聊站 今天午间爆料称,绿厂(OPPO)的云台相机项目内部“今天开工会了”,该项目代号为“扶摇”,寓意“扶摇直上”, 大概率年内发布 ,目前保密程度“很高”。 评论区中,该博主进一步表示,这款产品将 对标大疆 Pocket 系列 ,“相信手机厂商的卷法吧。” 值得一提的是,近期大疆发布了 Osmo Pocket 4 云台相机新品,而双摄产品 Pocket 4P 也在即将发布的路上。不仅如此,影石 Insta360 Luna Ultra 云台相机的信息也频频曝光,预估配备 6 倍光学变焦镜头和可拆卸云台设计,正面对抗大疆 Osmo Pocket 4 系列。 更早之前的 2025 年 8 月,就曾有消息称 vivo 正积极布局 手持云台相机市场 ,2024 年年底立项,其首款产品已完成开模,按照该节奏,预计 2026 年能发布。这标志着 vivo 将其在移动影像领域的积累,正式延伸至影像配件 / 独立设备赛道。据IT之家了解,该产品定位为 vlog 相机,将聚焦于为创作者、Vlogger 和摄影爱好者提供更稳定、易用的手持拍摄解决方案,直接切入由大疆和影石等产品主导的快速增长市场。 相关阅读: 《 影石 Insta360 Luna Ultra 云台相机曝光:模块化设计,6 倍光学变焦镜头 》 《 大疆 Osmo Pocket 4 云台相机发布:搭 1 英寸传感器、支持智能跟随 7.0,2999 元起 》 《 大疆预热旗下双摄云台相机 Pocket 4P 即将发布,可与 DJI 生态链产品联动 》 《 消息称 vivo 入局手持云台相机赛道,首款产品预计明年发布 》
“IT早报”时间,大家好,现在是 2026 年 4 月 17 日星期五,今天的重要科技资讯有: 1、大疆 Osmo Pocket 4 云台相机发布:搭 1 英寸传感器、支持智能跟随 7.0,2999 元起 大疆新一代口袋云台相机 Osmo Pocket 4 正式发布,搭载全新 1 英寸传感器,动态范围达 14 级,支持 4K/240fps 慢动作。智能跟随升级至 7.0,新增手势控制与美肤滤镜。标准套装 2999 元,全能套装 3799 元。>> 查看详情 2、雷军拼了!亲自直播 15 小时,1265 公里中间只充一次电,新一代小米 SU7 北京到上海 小米创办人、董事长兼 CEO 雷军 4 月 16 日宣布,4 月 17 日早上六点半,将直播新一代小米 SU7 从北京到上海的长途续航测试,雷军本人全程参加并全程直播,大约十五个小时。>> 查看详情 3、黄仁勋呼吁中美加强 AI 合作,直言出口管制难遏中国算力 英伟达 CEO 黄仁勋 (Jensen Huang) 周三表示,Anthropic 最新网络安全大模型 Mythos 取得的突破表明,美国应寻求与中国加强合作,以便这全球两大经济体的 AI 研究人员能够就如何安全使用这一日益强大的技术达成共识。>> 查看详情 4、苹果 iPad mini 8 前瞻:OLED 屏首秀, iPhone Air 同款 A19 Pro 芯片 新机核心升级包括:搭载与 iPhone Air 同级的 A19 Pro 芯片、首次采用 OLED 屏幕并将尺寸微增至 8.7 英寸、通过取消扬声器开孔设计实现防水等级认证。>> 查看详情 5、苹果钱包支持用支付宝开通 NFC 交通卡,覆盖北京、上海、南京、长沙、厦门、苏州、昆明、青岛、石家庄、天津等 支付宝于 4 月 14 日发文宣布,苹果钱包支持用支付宝开通 NFC 交通卡。>> 查看详情 6、字节近亿元挖来 DeepSeek 核心员工?抖音集团副总裁李亮回应称报道不实 抖音集团副总裁李亮回应关于 DeepSeek 前研究员郭达雅以近亿元年薪加入字节 Seed 团队的传闻,称其为不实报道。李亮详细解释了 Seed 团队技术人员的薪资构成,包括现金、字节期权和豆包期权,并说明期权是四年期全部归属,未来收益与业务发展挂钩。>> 查看详情 7、网易股权曝光:丁磊持股 45.5%,身价超 2300 亿元 网易官方 4 月 15 日发布 20-F 文件,网易董事、CEO 为丁磊,独立董事分别为郑玉芬、唐徽、唐子期、陈觉忠、梁民杰,总法律顾问为 Paul W. Boltz, Jr,财务副总裁为莫斌。>> 查看详情 8、电子产品或将「改写」童年?皮克斯动画电影《玩具总动员 5》确认引进内地,档期待定 皮克斯官方微博 4 月 16 日宣布,动画电影《玩具总动员 5》2026 全国献映。这表明本片确认引进内地,但档期待定。根据官方预热文案来看,本片将深入探讨电子产品对孩子们童年的影响。>> 查看详情 9、腾讯《王者荣耀世界》移动端今日开服:与 PC 端数据同步、登录送“648” 腾讯《王者荣耀世界》移动端今日正式上线,首发 Android 和 iOS 平台(鸿蒙端已开启邀测),正式开服时间预计为 4 月 17 日 7:00。另外,本作支持 PC / Android / iOS 多端互通。>> 查看详情 10、阿里千问 Qwen3.6-35B-A3B 开源发布:30 亿激活参数实现顶尖智能体编程能力 阿里千问大模型推出全新开源 MoE 模型 Qwen3.6-35B-A3B,总参 350 亿但激活仅 30 亿,却在智能体编程和多模态任务上超越前代及部分稠密模型。支持多模态思考,已在 Qwen Studio 上线,并开放 API 及权重下载。>> 查看详情 11、售价 21.98 万元起,零跑 D19 豪华旗舰 SUV 上市 新车基于旗舰 D 平台打造,提供纯电和增程双动力选择。搭载高通骁龙 1280Tops 双 8797 芯片、VLA 辅助驾驶系统及零重力座椅等豪华配置,CLTC 续航最高达 720km。智能与豪华兼备,重新定义中大型 SUV 价值标杆。>> 查看详情 12、OPPO Pad Mini 平板规格公布:8.8 英寸 2.5K 屏、第五代骁龙 8 旗舰芯,4 月 21 日发布 OPPO Pad Mini 采用 8.8 英寸 2.5K OLED 明眸柔光屏,仅重 279g,搭载第五代骁龙 8 旗舰芯片,续航长达 22.7 小时,支持 5G 通信共享和 AI 手写笔功能。>> 查看详情 13、存储涨价潮下玩家将闲置微软 Xbox 扩展卡“变废为宝”,将其作为 PC 外接硬盘使用 存储涨价之际,有玩家发现闲置的 Xbox 扩展卡可通过转接器在 Windows 系统上识别使用,读取速度最高可达 1117MB/s,写入速度 1570MB/s,约为 SATA SSD 两倍,足以运行游戏和程序。不过格式化会破坏其与 Xbox 的兼容性,且专门购买并不划算。>> 查看详情 14、养完龙虾再养马,腾讯 QQ 宣布原生接入 Hermes Agent 腾讯 QQ 4 月 16 日宣布,Hermes Agent 官方文档更新 —— QQ Bot 插件已正式合入 Hermes Agent 官方。>> 查看详情 15、万事达卡为中国持卡人提供苹果 Apple Pay 跨境支付支持,借记卡 / 信用卡均可用 万事达卡与其中国境内银行卡清算机构万事网联 4 月 16 日联合宣布,中国境内发行的万事达卡品牌银行卡正式支持持卡人使用 Apple Pay 进行跨境交易支付。>> 查看详情 16、小屏史诗级增强:某厂 2nm 迭代新旗舰小屏新机曝光,预计为小米 18 Pro 博主 @数码闲聊站 4 月 16 日爆料:2nm 迭代新旗舰小屏是 2D 纯直屏形态,LIPO 极窄物理四等边,边框疑似比前代窄;新一代国产定制基材,大屏同款超清显示,1nit 低亮度,Pol-less 去偏光片,BT.2020 色域等新技术,小屏史诗级增强 >> 查看详情 17、华为官宣易烊千玺成为 Pura 90 系列全球代言人 易烊千玺还曾担任华为 nova 全球代言人,在去年帮助推广了 nova 14 和 nova 15 系列手机,如今合作再次升级。>> 查看详情 18、11.28 万元起,吉利银河星耀 7 轿车正式开启预售 新车预售价 11.28 万元起,提供四款配置。搭载千里浩瀚 H3 智能驾驶辅助方案,拥有 26 个传感器,支持 NOA 高速领航与全场景自动泊车。动力方面,综合功率 312 千瓦,零百加速 5.4 秒,并配备 e-AWD 智电四驱系统。>> 查看详情 19、广汽埃安 N60 纯电紧凑型 SUV 开启预售:标配 4D 毫米波雷达 + 激光雷达,11.58 万元起 在 4 月 16 日晚的广汽埃安品牌焕新发布会上,广汽埃安 N60 纯电紧凑型 SUV 正式发布并开启预售。新车标配 4D 毫米波雷达 + 激光雷达、搭载弹匣电池 2.0,预售价 11.58 万元起。>> 查看详情 20、24.98 万元起,智己 LS8 中大型增程 SUV 上市 新车提供 5/6 座布局,标配 520 线激光雷达和英伟达 Thor 芯片,搭载 IM AD ZETA L4 级智驾大模型,号称能解读交通手势、识别标识。内饰配备双大屏、零重力座椅及车载冰箱,续航最高超 1600 公里。>> 查看详情 21、网友担心新一代小米 SU7 京沪续航直播将遭抹黑,雷军回应称不能因为有黑稿就不说话了 4 月 16 日上午,小米创办人、董事长兼 CEO 雷军宣布将进行新一代 SU7 的续航测试直播。有网友担心直播后会引来一堆黑稿。对此,雷军回应称:“咋办呢?不能因为有黑稿,我们就不说话了?”>> 查看详情 22、消息称理想汽车 26 省份销售中台全员没年终奖,研发员工年终奖也大幅减少 理想汽车已于 4 月 10 日给全体员工发放了 2025 年全年年终奖,26 个销售省份的一线销售中台全员无年终奖,研发员工年终奖和去年同期相比也大幅减少。>> 查看详情 23、团购平台“李鬼”维修店冒充知名品牌引热议,学生修电脑被索要天价费用 浙江温州一学生因电脑进水,在团购平台误将仿冒京东的“JD 快修”认作官方,送修后被索要 6190 元天价费用。事后检测发现电脑根本未维修,故障照片也非原机。业内人士提醒,此类骗局常用仿冒官方、隐瞒报价、技术恐吓套路。>> 查看详情 24、比授予价提高 30.8%,消息称字节跳动启动“豆包股”首次回购 2025 年四季度,字节试点推进一项“豆包长期激励计划”,为豆包相关大模型业务建立了一套“虚拟股”机制,通过授予豆包股及类似字节期权的回购机制,加强对大模型人才的长期吸引和激励。>> 查看详情 25、提前预判走位:小米汽车副总裁李肖爽透露雷军 4 月 17 日早直播不开车,由同事轮流开 雷军 4 月 17 日早六点半将直播小米 SU7 从北京到上海的长途续航测试,全程约 15 小时。副总裁李肖爽透露雷军本人不开车,由同事轮流驾驶,强调安全第一。>> 查看详情 26、中端线开卷:消息称华为在评估万级大电池新手机,小米万级也在路上 博主 @数码闲聊站 4 月 16 日发文透露,“菊菊”在评估万级大电池新手机。结合博主过往爆料习惯及评论区讨论来看,预计是华为在评估万级大电池。博主感叹,中端线强势开卷了。>> 查看详情 27、迅雷云盘:未来 1 年未登录账号用户,初始存储免费空间调整为 10GB 2026 年 4 月 16 日至 2027 年 4 月 16 日期间,未登录迅雷账号的用户,初始存储免费空间将自 2027 年 4 月 16 日之后调整为 10GB。>> 查看详情 28、BOSS 直聘:警惕“高薪 AI 漫剧师”骗局,实为先付费卖课“招转培”割韭菜套路 BOSS 直聘发布公告,揭露近期涌现大量以“AI 漫剧师”“带货主播”等热门高薪职位为诱饵的“招转培”骗局。不法分子在招聘贴文中承诺“零基础高收入”,实则为诱导求职者缴纳 99 至 299 元不等的培训费或考证费后失联。>> 查看详情 29、二手平台转转集团拟于香港设立“国际业务总部” 转转集团目前已获得包括腾讯、小米、58 集团等企业或投资者支持,上一轮融资估值超 30 亿美元。>> 查看详情 30、格力朱磊称“真铜实料”不属于剽窃者,海信杨祥玺再次回怼 格力市场总监朱磊 4 月 14 日晚发文,直指海信空调“没有资格”在传播中自称“真铜实料”。随后,朱磊与海信空调品牌总监杨祥玺展开了“隔空对吵”。>> 查看详情 31、丝芭传媒创始人王子杰病逝:曾创立久游网,推出《劲舞团》等游戏 丝芭传媒创始人王子杰因突发心源性疾病于上海逝世,享年 63 岁。他早年留学日本,曾主导《心跳回忆》引进,后创立久游网推出《劲舞团》《劲乐团》,并一手打造了女子偶像团体 SNH48。>> 查看详情 32、小米 18 Pro 手机渲染图曝光:新增 AI 按钮,可控制汽车 / 智能家居 消息源 @leo_hefeng 4 月 15 日在 X 平台发布推文,分享了一组渲染图,展示了小米 18 Pro 手机,重点凸显机身侧面的 AI 按键,支持启动 AI 功能、控制智能家居及小米汽车。>> 查看详情 33、华为宣布杨幂成为鸿蒙智行享界品牌代言人 杨幂早在 2024 年就成为了享界车主。2025 年 10 月,享界汽车宣布沈腾和杨幂成为享界品牌大使。享界车型后续还 OTA 升级了车载语音助手小艺,支持杨幂音色。>> 查看详情 34、何小鹏:做汽车已经是一个巨大痛苦,现在没有任何想法涉足家电领域 小鹏 4 月 15 日晚举行小鹏 GX 技术发布会,首款全尺寸旗舰 SUV 车型 GX 开启预售,预售价 39.98 万元起。>> 查看详情 35、新增锁屏岛、一键闪记:OPPO 新一代 ColorOS 16 正式版升级计划公布 OPPO ColorOS 官方 4 月 16 日公布了新一代 ColorOS 16 的亮点功能与升级计划。>> 查看详情 36、红果短剧月活超 3 亿:消息称抖音电商架构调整,成立“红果电商”部门 2026 年 1 月,字节跳动旗下红果短剧 App 日活已经过亿,成为继今日头条、抖音、豆包、番茄小说之后,字节第五款日活过亿的独立 App。>> 查看详情 37、实际案例来了:新能源车主跟风改白色车牌,被记 9 分、罚 200 元 近期,柳州交管鱼峰二大队在电子监控巡查过程中,发现一辆新能源汽车悬挂的号牌颜色异常 —— 原本应为渐变绿色的新能源号牌几乎变成了白底黑字,在街上十分明显。>> 查看详情 38、格力市场总监朱磊回应海信质疑:参与新材料研究是分内事,最终选择坚持用铜 格力市场总监朱磊回应海信“又当又立”指责,称参与铝强化应用研究是行业分内事,但基于长期系统研究,格力最终选择坚持“两器两机”用铜,是为消费者守住底线。他质疑海信“含铜”证书未明确压缩机与风机电机绕组材质,并直言“一字可为师,一字可为贼”。>> 查看详情 今天就先聊到这里,IT早报,咱们明天见。
时隔两年半,大疆终于带来了 Pocket 这款破圈产品的继任者,相信屏幕前已经有很多“等等党”,持币等待这款产品好久了。那么今天,我们就来和大家聊聊,Pocket 4 相比 Pocket 3 的 7 大核心升级点。 点击关注IT之家B站账号
IT之家 4 月 16 日消息,大疆今日正式发布全新一英寸口袋云台相机 Osmo Pocket 4,该机搭载全新升级的一英寸 CMOS,拥有 14 级宽广动态范围,并支持 10‑bit D‑Log 专业色彩模式,定价为 2999 元起,IT之家整理价格如下: Osmo Pocket 4 标准套装:售价 2999 元,内含 Osmo Pocket 4 主相机、云台夹、1/4’’ 螺纹手柄、便携收纳袋、USB-C 至 USB-C PD 快充线(USB 3.1)等配件。 Osmo Pocket 4 全能套装:售价 3799 元,内含 Osmo Pocket 4 主相机、DJI Mic 3 发射器、补光灯、增广镜、迷你三脚架、收纳包、云台夹、1/4’’ 螺纹手柄、便携收纳袋、USB-C 至 USB-C PD 快充线(USB 3.1)等配件。 京东 大疆 Osmo Pocket 4 云台相机 2999 元起 直达链接 Osmo Pocket 4 搭载全新 1 英寸 CMOS,结合 f/2.0 大光圈,动态范围提升至 14 级,支持 10-bit D-Log 色彩模式,慢动作录制规格升级至 4K/240fps,同步新增支持空间音频录制与变焦拾音功能,机身支持 OsmoAudio 直连 DJI 麦克风发射器,并可录制四声道音频。 ▲ Osmo Pocket 4 拍照样张 该机搭载智能跟随 7.0,支持最高 4 倍距离的智能跟拍。机身同步升级智能对焦系统,新增“锁定主角追焦”与“登记主角优先”模式,新增的手势控制功能,无需触碰屏幕,简单手势即可启动或停止跟随、开始或结束录制。 该机针对人像肤色表现进行进一步调校,在不同场景与光线下都能呈现通透自然的肌肤状态。新增内置的美肤滤镜,可自定义调节磨皮效果、美白等级和肤色冷暖调,轻松优化人像表现。此外,本代产品还可搭配外置补光灯使用,小巧便携,支持三级色温与亮度调节,一键补光点亮面容。 官方同步上线适用于 Osmo Pocket 4 的保障计划 DJI Care 随心换,1 年版售价 219 元,提供 1 年内 2 次低价置换权益。而 2 年版售价 349 元,提供 2 年内 4 次低价置换权益。
IT之家 4 月 16 日消息,大疆今天在发布 Osmo Pocket 4 云台相机的同时,还透露将推出双摄版本 Pocket 4P。 从当前信息来看,单摄版本 Pocket 4 在上代轻便体积、简易操作、稳定出片的基础上,进一步提升了影像画质及用户交互体验;而双摄版本 Pocket 4P 则更可能作为满足长焦需求及更多进阶创作需求的拓展版本,在拍摄覆盖和综合性能方面提供更完整支持。 此外,大疆还透露 Pocket 4P 还将与大疆旗下其他产品实现更紧密的生态联动,带来更多超预期的协同可能。
Top: 此代码片段只支持流媒体中间件zlmediakit开源版,若对接srs,请自行修改,切勿直接copy使用 。 // 获取 SEI 帧信息 player.value.on(ZLMRTCClient.Events.WEBRTC_ON_REMOTE_STREAMS, function (e) { console.log("zml 收到流,准备拦截 SEI...", e.streams); const videoDom = videoRef.value; const stream = e.streams[0]; // 1. 尝试获取底层的 RTCPeerConnection // ZLMRTCClient 通常会将 pc 实例存储在 _pc 或 pc 属性中,我们需要“偷”出来 // 请在控制台打印 player.value 确认一下属性名,通常是 _pc console.log('player.value >>> ', player.value); const pc = player.value._pc || player.value.pc || player.value.peerConnection; if (pc) { // 2. 找到视频的接收器 (Receiver) const receivers = pc.getReceivers(); const videoReceiver = receivers.find(r => r.track && r.track.kind === 'video'); if (videoReceiver && videoReceiver.createEncodedStreams) { console.log("成功找到 VideoReceiver,开启 Insertable Streams 模式"); // 3. 创建编码流通道 (这才是真正的 H.264 数据,包含 SEI) const encodedStreams = videoReceiver.createEncodedStreams(); const { readable, writable } = encodedStreams; const transformer = new TransformStream({ transform(encodedChunk, controller) { // encodedChunk 是 EncodedVideoChunk (不是 VideoFrame 了!) // 这里的 copyTo 是安全的,因为它是编码后的数据块 const buffer = new Uint8Array(encodedChunk.data); // --- 调试:打印前 30 个字节的十六进制 --- const hex = Array.from(buffer.slice(0, 30)) .map(b => b.toString(16).padStart(2, '0').toUpperCase()) .join(' '); // ---------------------------------------- // 解析 SEI try { parseDJISEI(buffer); } catch (err) { console.info("SEI 没获取到", err); } // 继续传递数据,否则画面会卡住 controller.enqueue(encodedChunk); } }); // 4. 组装管道 readable .pipeThrough(transformer) .pipeTo(writable) .catch(err => console.error("Pipeline error:", err)); } else { console.warn("无法创建 EncodedStreams,可能是浏览器不支持或 SDK 限制"); } } else { console.warn("无法获取底层 RTCPeerConnection,无法拦截 SEI"); } // 5. 正常播放逻辑 (流已经被我们修改过了,直接播原来的 stream 即可) if (videoDom) { videoDom.srcObject = stream; videoDom.play().catch(e => console.error("Play failed", e)); } isLoading.value = false; // //获取到了远端流,尝试自动播放 // // console.log("zml 获取到了远端流,尝试自动播放 ===============", e.streams, videoDom); // // 直接调用播放(支持静音自动播放策略) // isLoading.value = false; // videoDom.play().catch((error) => { // console.error("zml 自动播放失败,可能需要用户交互触发:", error); // }); }); // ------ 开始解析 dji sei 帧 ----- /** * 修复版:自动兼容 String / Uint8Array / ArrayBuffer */ function parseDJISEI(data) { let rawBytes; // --- 1. 智能类型转换 --- if (typeof data === 'string') { // 去掉可能存在的 "0x" 前缀 if (data.startsWith('0x')) data = data.slice(2); const match = data.match(/.{1,2}/g); if (!match) return { error: "无效的 Hex 字符串" }; rawBytes = new Uint8Array(match.map(byte => parseInt(byte, 16))); } else if (data instanceof Uint8Array) { // Uint8Array rawBytes = data; } else if (data instanceof ArrayBuffer) { // ArrayBuffer rawBytes = new Uint8Array(data); } else { console.warn("[SEI解析] 收到不支持的数据类型:", data); return null; } // --- 2. H.264 防竞争字节处理 --- const buffer = removeH264EmulationBytes(rawBytes); const dataView = new DataView(buffer.buffer); let offset = 0; // --- 3. 寻找 SEI NALU (Type 6) --- // 遍历 buffer 寻找 NALU 头 while (offset < buffer.length - 4) { // 找 00 00 01 if (buffer[offset] === 0x00 && buffer[offset + 1] === 0x00 && buffer[offset + 2] === 0x01) { const nalType = buffer[offset + 3] & 0x1F; // 找到 Type 6 (SEI) if (nalType === 6) { // console.log("找到 SEI NALU,偏移量:", offset); // 这里我们要传入的是 Payload 的起始位置 // NALU 头通常是 4字节 (00 00 01 06) // 或者是 5字节 (00 00 00 01 06) -> 这种情况下 StartCode 是 4字节 let headerLen = 3; // 默认 00 00 01 if (offset > 0 && buffer[offset - 1] === 0x00) { headerLen = 4; // 是 00 00 00 01 } // 开始解析 Payload const payloadResult = parseSEIPayload(buffer, offset + 3 + 1, dataView); if (payloadResult) return payloadResult; // 只要解析到一个 AI 包就返回 } } offset++; } return { error: "未在当前包中找到大疆 AI 数据" }; } function parseSEIPayload(buffer, startOffset, dataView) { let offset = startOffset; while (offset < buffer.length) { // 读取 payload type let payloadType = 0; while (offset < buffer.length && buffer[offset] === 0xFF) { payloadType += 255; offset++; } if (offset >= buffer.length) break; payloadType += buffer[offset++]; // 读取 payload size let payloadSize = 0; while (offset < buffer.length && buffer[offset] === 0xFF) { payloadSize += 255; offset++; } if (offset >= buffer.length) break; payloadSize += buffer[offset++]; // 判断:是不是大疆自定义数据 (Type 0xF5 = 245) if (payloadType === 0xF5) { // console.log(`找到自定义 SEI (Type 0xF5), 长度: ${payloadSize}`); const payloadEnd = offset + payloadSize; // 在 Payload 内部寻找具体的 SubType (0x0007 - AI识别) // 内部格式通常为: [SubType(2Byte)] [SubLen(2Byte)] [Data...] let innerOffset = offset; while (innerOffset < payloadEnd - 4) { // 读取 2字节 SubType (Little Endian) const subType = dataView.getUint16(innerOffset, true); const subLen = dataView.getUint16(innerOffset + 2, true); innerOffset += 4; // 跳过头 if (subType === 0x0007) { // 命中目标!调用之前的结构体解析函数 const seiPayload = parseAIObjectData(dataView, innerOffset) console.log('结构体解析>>>>>>obj_group_count:', seiPayload.obj_group_count) console.log('结构体解析>>>>>>groups:', seiPayload.groups) } innerOffset += subLen; } offset += payloadSize; } else { offset += payloadSize; // 跳过其他无关 SEI } } return null; } function parseAIObjectData(dv, start) { let p = start; // 1. 解析顶层 Header (对应文档 image_9c8df1.png) const result = { version: dv.getUint8(p), // Offset 0: 版本号 time_stamp: dv.getUint32(p + 1, true), // Offset 1: 时间戳 (4字节) frame_type: dv.getUint8(p + 5), // Offset 5: 帧类型 (0无效, 1有效) // Offset 6: frame_ext[12] (12个字节的保留扩展区) // 这里我们通常不需要解析,直接跳过这 12 个字节 // 如果你需要,可以用 new Uint8Array(dv.buffer, p + 6, 12) 读取 track_id: dv.getUint16(p + 18, true), // Offset 18: 跟踪轨迹 ID (2字节) reserved2: dv.getUint8(p + 20), // Offset 20: 保留字节 obj_group_count: dv.getUint8(p + 21), // Offset 21: 后面紧跟的 Group 数量 groups: [] }; // 指针移动 22 字节 (1+4+1+12+2+1+1),指向 groups 数组的起始位置 p += 22; // 2. 循环解析 Group 数据 (对应文档 image_9c8dd7.jpg) for (let i = 0; i < result.obj_group_count; i++) { // 防止数组越界 if (p >= dv.byteLength) break; const groupType = dv.getUint8(p); // Group 类型 const groupCount = dv.getUint8(p + 1); // Group 内元素数量 p += 2; // 跳过 Group 头 const groupData = { type: groupType, count: groupCount, objects: [] }; // --- 分情况解析具体的 Object --- // 情况 A: 目标框 + 距离 (Type = 10) // 对应结构体: dji_ai_obj_2d_box_with_distance (大小 16字节) if (groupType === 10) { console.log('dji_ai_obj_2d_box_with_distance 触发') for (let j = 0; j < groupCount; j++) { if (p + 16 > dv.byteLength) break; // 安全检查 const obj = { id: dv.getUint16(p, true), // Offset 0: 目标 ID type: dv.getUint8(p + 2), // Offset 2: 目标类型 (人/车/船) type_desc: parseObjType(dv.getUint8(p + 2)), // 中文描述 state: dv.getUint8(p + 3), // Offset 3: 识别状态 cx: dv.getUint16(p + 4, true), // Offset 4: 中心 X (万分比) cy: dv.getUint16(p + 6, true), // Offset 6: 中心 Y (万分比) w: dv.getUint16(p + 8, true), // Offset 8: 宽 h: dv.getUint16(p + 10, true), // Offset 10: 高 distance: dv.getUint32(p + 12, true) // Offset 12: 距离 (毫米) }; groupData.objects.push(obj); p += 16; // 每个对象占 16 字节 } } else { for (let j = 0; j < groupCount; j++) { if (p + 3 > dv.byteLength) break; // 安全检查 const obj = { type: dv.getUint8(p), // Offset 0: 目标类型 type_desc: parseObjType(dv.getUint8(p)), // 中文描述 count: dv.getUint16(p + 1, true) // Offset 1: 数量 }; groupData.objects.push(obj); p += 3; // uint8(1) + uint16(2) = 3字节 } } result.groups.push(groupData); } return result; } // 目标识别枚举 function parseObjType(typeCode) { const types = { 0: "无效 (Invalid)", 1: "未知 (Unknown)", 2: "人 (Person)", 3: "车 (Car)", 4: "船 (Boat)" }; return types[typeCode] || `未知类型(${typeCode})`; } function removeH264EmulationBytes(bytes) { const newBuffer = []; for (let i = 0; i < bytes.length; i++) { if (i >= 2 && bytes[i] === 0x03 && bytes[i-1] === 0x00 && bytes[i-2] === 0x00) { continue; } newBuffer.push(bytes[i]); } return new Uint8Array(newBuffer); } // ------- 结束解析 dji sei 帧 --------- 1 个帖子 - 1 位参与者 阅读完整话题
上云官方文档地址: 上云API 文档版本:1.0 3 个帖子 - 2 位参与者 阅读完整话题
IT之家 4 月 14 日消息,大疆发文,官宣旗下全新麦克风产品及手机云台产品将于 4 月 21 日 20:00 发布,预计两款产品分别为 Mic Mini 2 麦克风及 Osmo Mobile 8P 手机云台。 IT之家注意到,此前两款产品均已曝光,其中 Mic Mini 2 麦克风整体重量 15g,采用 2.4GHz 数字传输技术,开阔场景下理论传输距离可达 400 米,内置全指向麦克风,默认支持 48kHz / 24-bit 规格音频录制,配备 AI 降噪算法,可削弱风声和环境噪声,支持 32-bit 浮点音频。 其他方面,该产品充满电时单次录制时长可达 11-14 小时,配充电盒总续航可达 48 小时,使用 USB-C 接口充电,60-80 分钟即可充满,接收器适配 Lightning 接口和 USB-C 接口,兼容苹果安卓手机,也可兼容相机,支持蓝牙,可通过 DJI Mimo App 进行无线监听,内置 8GB 存储,可本地备份录音。 而 Osmo Mobile 8P 手机云台预计将延续折叠设计,机身重量预计控制在 320 克左右,并内置约 250 毫米的磁吸延长杆,便于自拍与低角度运镜。产品同时将在硬件层面进行“专业化”微调,采用优化后的三轴增稳系统,配备更高扭矩的电机。 续航方面,新机型据称可达 12 小时,支持快速充电及手机反向充电功能,以满足全天候拍摄需求。
IT之家 4 月 14 日消息,DJI 大疆创新发布微博,官宣旗下 Lito X1 系列无人机将于 4 月 23 日 20:00 发布。 IT之家注意到,此前相应无人机已现身美国 FCC 认证文件,该无人机代号 SS3-DGP14,有望替代 Mini 5 Pro,主打进阶影像创作。无人机有望搭载新一代 O5 图传系统,不仅支持超过 20 公里(12.4 英里)的图传距离,还可能通过 SDR 技术整合 5G 蜂窝网络。 在飞行安全性方面,Lito X1 预估配备由鱼眼光学镜头、类 LiDAR 传感器(10 米探测范围)及红外模块组成的 360° 全向避障系统,并支持“嘿,起飞”语音控制及动作感应。 续航方面,Lito X1 预计提供两种电池方案:标准版续航约 30 分钟(保持 <250g),长续航版(Plus)可达 50 分钟。
IT之家 4 月 13 日消息,消息人士 Igor Bogdanov 今天在 X 平台发文,放出大疆 Osmo Pocket 4 Pro 手持云台相机的谍照。 从照片中可以看到,Osmo Pocket 4 Pro 的云台模组体积较大, 采用双摄设计 ,有望重点强化变焦性能。底部的屏幕则是与现有 Pocket 产品线没有太大差别。 不过需要注意的是,我们目前还不清楚这款相机的具体配置、发布时间。 据IT之家此前报道 ,大疆 Osmo Pocket 4 系列运动相机将于 4 月 16 日 20:00 发布,产品主打“一寸万象、光影随行”。
IT之家 4 月 13 日消息,据雷峰网今日报道, 消费级 3D 打印品牌“智能派”即将完成新一轮数亿元融资 。本轮融资由深创投领投,美团龙珠、美团战投、高瓴资本等机构跟投,或将覆盖不同层面的潜在合作。 IT之家查询公开信息获悉,深圳市智能派科技有限公司成立于 2015 年,专注于研发、生产和销售消费级 3D 打印机、激光雕刻机、STEM 套件等产品。 深圳市智能派科技有限公司于 2025 年 11 月发生工商变更 ,注册资本增加至约 643.96 万元,新增杭州疆御科技咨询有限公司、 深圳市大疆创新科技有限公司 为股东。 雷峰网报道还提到,大疆投资智能派的消息公布后,还有消息称 大疆派遣了一个研发团队支援智能派 ,这无异于为资本市场注入了一剂强心针。大量机构随后闻风而动,各展所长。 知情人士透露,美团在此轮融资中份额不低,资金分别通过北京龙珠、福建龙珠和美团战投三个主体注入。 美团创始人王兴十分看好消费级 3D 打印赛道 ,曾亲自飞往深圳洽谈项目。这也是美团近半年来,继投资“快造”之后第二个消费级 3D 打印机项目,两个项目分别由美团内部不同的团队推进。
IT之家 4 月 12 日消息,大疆 Osmo Pocket 4 运动相机将于 4 月 16 日 20:00 发布,该公司持续在各大社交平台预热这款 Vlog 相机。例如,该公司暗示 Osmo Pocket 4 将比前代产品拥有更大的存储空间。在此前不久,大疆也展示了 Osmo Pocket 4 的慢动作视频拍摄能力。 尽管大疆此次一反常态地高调宣传,但目前仍对 Osmo Pocket 4 的诸多细节保密。伊戈尔 · 博格丹诺夫仍在该相机正式发布前提前曝光了新品的一些信息,本周早些时候,这位爆料者分享了近十张图片,不仅展示了 Osmo Pocket 4 本体,还曝光了其多款配件。 如今,博格丹诺夫又详细披露了大疆的两款配件套装。该爆料者似乎暗示,Osmo Pocket 4 将标配大疆全新的 LED 补光灯,同时还包含带 1/4 英寸螺口的手柄、发射器、迷你三脚架以及广角镜头。 相比之下,创作者套装(Creator Combo)则会额外配备多款配件,包括收纳包、便携袋、固定夹、两个防风罩以及发射器磁吸充电线。目前消息显示,Osmo Pocket 4 起售价预计为 499 美元(IT之家注:现汇率约合 3415 元人民币),创作者套装售价则可能升至 649 美元(现汇率约合 4441 元人民币)或 749 美元(现汇率约合 5126 元人民币)。
IT之家 4 月 11 日消息,博主 @智慧芯片案内人 今天在微博透露,Pocket 4(大疆 Pocket 4)的目标应该是超千万, 也可能是一英寸 CMOS 出货量最大的单品 。 据IT之家此前报道 ,大疆 Osmo Pocket 4 手持云台相机将于 4 月 16 日 20:00 发布,主打“一寸万象、光影随行”。 此前爆料显示 ,该机标准版仍延续大疆 Osmo 家族经典造型,上方配备一枚单摄,下方则是一个可旋转屏幕,屏幕下方的转轴则配有多枚实体按键,其中一枚是变焦按键,另一枚则是自定义 C 键。而 Pro 版本有望采用双摄配置。
文|张子怡 编辑|袁斯来 4月16日,大疆正式发布全新一英寸口袋云台相机Osmo Pocket 4。 作为大疆影像产品线中的现象级单品,本代产品在维持便携形态的基础上,通过提升影像规格并降低售价,以应对日益激烈的短视频硬件市场竞争。 影像性能是此次升级的核心。Pocket 4搭载了全新一英寸CMOS,动态范围提升至14级,并支持10-bit D-Log专业色彩模式。 最显著的性能跨越体现在高帧率拍摄上,设备支持4K/240fps慢动作录制,这一指标已媲美万元级专业影像设备。针对人像拍摄这一核心场景,Pocket 4优化了肤色调校算法,并新增内置美肤滤镜以及支持三级色温调节的外置补光灯配件。 此外,针对前代产品存储依赖存储卡的痛点,大疆此次内置了107GB存储空间,并支持800MB/s的导出速度。 在智能功能上,升级后的智能跟随7.0算法配合2倍无损变焦,解决了远距离追焦的精准度问题。智能对焦系统也引入了“登记主角优先”模式,确保在复杂环境下已登记的拍摄主体始终处于焦点中心。 大疆同步预告了2026年的新品计划——搭载双摄影像系统的Osmo Pocket 4P。有分析认为,4P版本的推出意在通过物理焦段的覆盖,彻底解决口袋云台相机在长焦端的劣势,以此防守影石(Insta360)Luna等潜在竞品的冲击。 价格策略是本次产品发布的另一大重点。Pocket 4标准套装售价为2999元,全能套装售价3799元,分别较上一代Pocket 3的首发价格降低了500元和700元。这种“增配降价”的打法在云台相机市场极其罕见。 此次定价调整背后也是行业格局的剧变。IDC数据显示,2025年度全球云台相机出货量同比增长超100%,这一高增速市场已吸引了包括影石、GoPro在内的实力厂商跟进,甚至手机厂商如OPPO也已立项对标产品。 大疆选择在此时主动挑起价格战,旨在利用其成熟的供应链规模效应压低行业利润率,拉高新入局者的门槛。随着Pocket 4的发布,手持影像设备行业正从单纯的“卷参数”转向“卷价格与专业化转型”并行的下半场。
作者 | 乔钰杰 编辑 | 袁斯来 陪伴机器人走向同质化的当下,什么样的产品能吸引人? 今年年初的CES 2026上,一款身着橙色连体衣的小型机器人COCOMO,意外成为外媒镜头频频捕捉的对象。 略带“异质感”的外星宠物气质,37度接近人体的温度,创新的分体式设计既可被抱起,又能主动跟随,吸引了不少现场观众在展台前试玩体验。 同一展台上,团队还带来了另一款更轻量���桌面陪伴机器人INU。INU被定义为一款“桌面外星小狗”,通过尾巴摇摆和身体扭动作出反馈,是一个为工作环境打造的更小、更固定的桌面伴侣。 这两款产品,均来自陪伴机器人公司Ludens AI。 Ludens AI的创始人薛立君,曾任特斯拉和大疆工程师,后加入FITURE创始团队并负责AI体系搭建。“但机器人一直是我的兴趣所在”薛立君在与硬氪的采访中说道。 硬氪获悉,目前,Ludens AI已完成两轮融资,天使轮由线性资本领投、清水湾基金跟投,天使+轮则由日本PKSHA Algorithm Fund和清水湾基金共同参投,两轮融资金额达数千万元。 在CES现场,不少观众通过COCOMO与INU,直观感受到了机器人从“功能型”走向“关系型”的变化。正如外媒在报道中评价称,“它不是一个试图完成任务的AI助手,而是一个通过温度、动作与非语言表达建立情感连接的机器人伙伴。” 对于家庭陪伴机器人这一品类,Ludens AI没有做功能的叠加,而是试图从“空间”出发重新理解需求——家庭并不是一个统一场景,而是由不同位置、不同注意力密度构成的空间,因此,机器人也不应是单一产品,而应形成一个能够覆盖不同空间节点的产品矩阵。 在这一逻辑下,COCOMO与INU形成了清晰分工。 COCOMO被定义为“日常机器人玩伴”,是一个为家庭开放空间设计的自主移动个体。其具备10个自由度及200度广角视野,能够在空间中游走、跟随用户,并在无人交互时依然保持一定程度的“存在行为”。 “我们不希望机器人是一个承载了很多功能的的工具,而是一个有生命感的个体。”薛立君介绍称,“比如COCOMO也有自己的生活,会自己在空间里到处走走,观察这个世界,它的交互并不是完全以人为中心的。” 相比之下,INU则被刻意设计在桌面这一固定场景中。它不会主动进入用户生活的每一个角落,而是在工作、学习等场景中提供恰到好处的轻陪伴——有存在感,但不打扰。 (图源/企业) 交互方式上,Ludens AI同样延续了“重陪伴、轻功能”的逻辑,COCOMO并不会说人类的语言。它拥有一套自己的AI语言体系,通过哼声与动作来表达情绪,而不是通过明确语义进行沟通。 “现在很多陪伴机器人本质上只是一个Chatbot,当一个机器人直接对你说‘我爱你’,其实是有强烈违和感的,”薛立君认为,“但当你某一天突然意识到它某个发音代表“我爱你”,那一刻的情感是被‘发现’的,这种感动的瞬间能让人与机器人的连接更真实、更深,这是我们产品设计的交互哲学。” Ludens AI希望人能在长期的使用中与机器人逐渐建立更深的连接,这一理念同样体现在外观设计上。 无论是COCOMO的“外星宠物感”,还是INU带有陌生感的单眼造型,都没有选择传统意义上的“幼态”或“拟人”,而是强调一种更具审美耐久性的表达。 “机器人首先是一个长期存在于用户生活空间里的物件,它的审美耐久性,某种程度上比功能更重要。”薛立君表示,“INU的设计是一种‘奇怪的可爱’,它不是第一眼取悦你,而是能让你持续产生兴趣,不会快速审美疲劳。” (图源/企业) 产品之外,支撑这一切的,是Ludens AI构建的一整套完整技术体系。 不同于大量依赖云端模型的AI硬件,Ludens AI选择将复杂的感知与决策能力部署在端侧AI。这不仅保证了交互的实时响应,也从底层解决了隐私问题——机器人可以在不联网的情况下完成绝大多数情感交互。 具体技术架构上,团队围绕“非语言情感交互”构建了一整套多模态能力体系。 声音层面,通过音素级的情感语音生成,机器人能够以哼声、节奏变化等方式传递细腻情绪,而不依赖具体语义;认知层面,通过多模态记忆机制,人与机器人之间的互动片段、偏好理解与行为模式能够被整合,机器人能够记住关系并逐渐形成相对稳定的“多模态性格”;触觉层面,通过多层复合材料结构,机器人的外壳能维持在接近人体的温度区间,并在高频接触中动态变化,从而在物理层面消解传统机器的“冷感”。 更底层的,是Ludens AI自研的一套面向陪伴机器人的边缘原生AI系统Klara OS。这一系统能够在设备端完成感知、认知与行为生成的统一调度,使机器人能够在低延迟条件下,对环境、声音、动作等多模态信息进行实时理解。 正是基于这套系统能力,INU这样一个最初源于灵感的产品,得以在两周内就完成从原型到展示的快速演进。未来,Ludens AI也将基于Klara OS这一能力平台,持续推出更多形态的机器人产品。 据了解,COCOMO和INU计划于今年登陆众筹平台,正式进军海外市场。 在陪伴机器人同质化严重的当下,Ludens AI真正想回答的,不是机器人能做什么,而是它能与人建立怎样的关系。从端侧AI到自研操作系统,从非语言情感交互到多场景产品矩阵,这套技术体系的终点不是功能,而是让机器人真正成为生活空间里有存在感的一员。 它能否真正成为家庭的一员仍待时间验证,但相比“玩具化”的陪伴设备,这是一种把机器人带入真实生活环境的更进一步尝试。
作者 | 张子怡 编辑 | 袁斯来 36氪获悉,个性化制造品牌UNICUS(原方仔照相馆,深圳千帜科技有限公司)于近日完成新一轮融资。融资金额达数百万美金。本轮由线性资本领投,九坤创投、天际资本跟投,元一资本担任独家财务顾问。公司创始团队及Maker赛道头部公司创始人以个人身份参与跟投。 本轮资金将主要用于积木生成大模型训练、AI Agent的研发以及海外市场的拓展,持续构建“AI驱动的个性化制造”核心能力体系。 过去两年,生成式AI的爆发大多集中在数字世界,而UNICUS选择让AI走进物理工厂。基于自研的全自动化设计及生产系统,UNICUS率先探索出一套由技术驱动的定制化玩具规模量产路径。 长期以来,全球积木市场由乐高(LEGO)等巨头主导,年营收规模已达700亿元。然而,传统积木本质上是“IP驱动的标准化工业”,无论是迪士尼城堡还是星球大战系列,用户购买的是既定框架内的文化符号。 在UNICUS创始人兼CEO徐豪看来,每个人生命中的高光时刻、难忘回忆,以及与家人和宠物相伴的珍贵瞬间,才是最真实、也最独特的“个人IP”。 (图源/企业) 只是,在定制化行业存在着悖论:个性化意味着“反规模化”。传统定制高度依赖人工,大模型出现前,用户上传照片后,往往还需要设计师在后台花上一到两天手工修正、匹配素材库,最终成品的表现力也常常受限于设计师个人经验。高昂的时间成本和结果的不确定性,让定制产品难以走向大众消费。 过去五年,UNICUS通过长期的市场教育、不断的技术打磨,深度融合AI生成与柔性制造,让用户仅需上传一张照片,即可获得一件专属的实物作品——记录每个人生命中的重要时刻。 去年年中,UNICUS自研积木大模型LEGO Maker正式投入使用,这是首个采用自回归网络进行通用乐高积木模型生成的大模型,相关成果已发表于世界顶级计算机图形学期刊Transactions on Graphics。该模型将每个积木拼装编码成token进行逐个预测,能够支持数千类积木零件,从图片与文字直接生成结构稳定、可物理制造和拼装的积木模型,实现了个性化产品的规模化定制。 借助LEGO Maker 大模型,UNICUS的产品将不再局限于“基于照片生成定制积木”的单一模式,而是能够通过与用户的对话及图片输入,理解人物背后的故事与特质,进一步生成更丰富、更专属的场景化效果。 例如,用户可以输入“她喜欢滑雪,是一个记者......”,AI会结合图片特质与语言描述,自动规划出带有滑雪场景、特定职业配饰的立体积木方案。这也让 UNICUS的产品从单一人偶,进化为更具场景感和叙事性的“3D立体写真”。 在后端生产方面,UNICUS选择自建柔性工厂。定制化制造的难点不在于注塑,而在于分拣和印刷。UNICUS拥有约1700种标准积木零件,如何从这些零件中快速、准确地为每一个互不相同的订单配齐上百个组件,是工业界公认的难题;而在印刷端,真正的挑战在于:积木不同表面的形状、曲率和排布方式各不相同,但产线仍需高效完成每一笔订单都不同的个性化印刷。这对印刷方案生成、设备控制和生产节拍都提出了很高要求。 在早期,UNICUS曾经历过人工抓取零件的阶段,效率极低。随后,团队通过自研的柔性分拣系统和震动盘装置解决了这一痛点。系统会自动根据AI生成的指令,从数千个通道中自动分发所需零件。此外,针对千人千面的图案,UNICUS研发了自动化印刷与机器视觉质检系统,实现了日产近万件不同产品、最快18 小时发货的交付能力,整体效率较传统模式提升约10倍。 本轮融资后,UNICUS将继续深挖“AI for CAM”(计算机辅助制造)领域,让AI直接生成制造方案,进一步夯实其在个性化制造领域的护城河。 团队方面,创始人兼CEO徐豪是香港中文大学计算机图形学博士,深耕3D生成式设计算法领域逾十年,以第一作者身份在SIGGRAPH等国际图形学顶级会议发表多篇论文,团队累计获得国内外专利50余项。联合创始人李承,香港科技大学自动化博士,师从李泽湘教授,前大疆无人机智能产线研发负责人,负责硬件设备与柔性制造体系的搭建。 创始人QA: 硬氪:2022年公司曾面临巨大的压力,当时决定把形象从“方脸”改为“圆脸”,这个决策背后是怎么考量的? 徐豪: 那时候确实挺难的,研发投入大但销售没跟上,下个月工资都快发不出来,裁员裁了一半。我当时意识到:对我们这样的技术团队来说,自动化流程、算法能力、生产效率当然重要,但用户最终买单的,还是产品本身是否足够好看、是否符合他们的审美。我们当时引以为傲的“方脸”方案,从技术上看已经做得不错,但它并不符合大多数中国消费者的主流审美。 所以,改成“圆脸”其实是一个非常沉重的决定。因为这不是简单地换一个模型,而是意味着从工厂开模、算法重构,到前端内容和营销表达,整条链路都要重新来过,几乎没有回头路。当时团队是靠个人信用借款硬撑过来的。好在“圆脸”版本上线后,很快在小红书上爆发,半年之后,公司终于实现了自负盈亏。 硬氪:作为一个科学家背景的团队,下场自建工厂和摸索供应链,最深刻的体会是什么? 徐豪: 最大的体会是“柔性制造”真的没捷径。传统工厂只愿意接标品大单,没人愿意为你每一个都长得不一样的订单去调产线,所以我们第一天起就在“手搓”工厂。 我们自己设计图纸、写控制代码、调优分拣设备。比如积木颗粒很小,每个订单需要的零件完全不同,我们得自己做震动盘装置来替代人工。这种从写代码到去产线拧螺丝、管工人的转变,让我们积累了最深的业务Know-how,这是纯软件公司很难补齐的。 硬氪:自研积木大模型LEGO Maker的初衷是什么?相比通用模型,它解决了什么核心问题? 徐豪: 2024年我们决定自研,是因为市面上的通用大模型还无法直接生成满足物理约束的积木结构布局。我们要把每个积木颗粒定义为Token,用我们积累的百万量级的3D模型数据训练一个自回归网络,让AI像写文章一样“写”出一个物理世界能拼起来、不会垮掉的结构。 AI最大的改变是转化率。以前100个人进店,只有3个人愿意先付款、然后等我们调一两天效果图。现在20秒内,AI就能出一个打动你的效果图。这种“所见即所得”的体验,显著提升了用户转化率。 硬氪:对于未来产品和AI技术的结合,你们有哪些更深远的规划? 徐豪: 我们正在研发面向CAM(计算机辅助制造)的多模态AI Agent。未来AI不只是生成一张好看的3D模型,它要直接生成工厂机器能读懂的制造指令——怎么分拣、怎么印刷、怎么生成对应的制造工艺路径。 产品层面,我们要往“3D写真”走。以后你可以跟AI聊天,它了解你的特质,比如你家小猫的花纹、你喜欢的穿搭场景。我们要做的,不只是积木,而是立体的、复合材质的“数字写真”,让每个人都能以最精致的实物形态定格自己的重要时刻。 投资人观点: 线性资本表示: “我们一直高度关注Generative AI在实际场景中的落地机会。UNICUS用AI重构个性化设计与制造能力,精准切中定制化消费场景的应用。团队敏锐捕捉到市场需求后,率先打通了从生成算法到柔性工厂的全栈闭环,不仅实现设计生产一体化,也跑通了早期商业验证。我们相信,随着AI让个性化设计与制造变得规模化可行,这背后蕴含着能诞生‘AI时代的乐高’的巨大机会。期待UNICUS持续定义AI驱动下的新消费产品范式。”