智能助手网
标签聚合 百度

/tag/百度

linux.do · 2026-04-15 13:41:25+08:00 · tech

ERNIE图像 ERNIE-Image 是百度 ERNIE-Image 团队开发的开源文本转图像模型。它基于单流扩散变换器 (DiT),采用潜在扩散 (LDM) 框架,拥有 80 亿个参数。该模型自带一个轻量级的提示增强器,可以将简短的输入扩展为更丰富、更结构化的提示,从而更好地发挥模型的性能。ERNIE-Image 仅使用 80 亿个 DiT 参数,就实现了开源权重文本转图像模型中最先进的性能——而且它的设计不仅注重视觉效果,更注重可控性:准确的内容呈现与美观同样重要。在实践中,它尤其擅长复杂的指令跟踪、精确的文本渲染和结构化图像生成——而这些领域正是许多现有开源权重模型的短板。 yiyan.baidu.com Introducing ERNIE-Image huggingface.co ERNIE-Image - a baidu Collection The serieas of image generation models, including text2img、img2img. huggingface.co baidu/ERNIE-Image · Hugging Face We’re on a journey to advance and democratize artificial intelligence through open source and open science. huggingface.co baidu/ERNIE-Image-Turbo · Hugging Face We’re on a journey to advance and democratize artificial intelligence through open source and open science. 在线体验: huggingface.co ERNIE Image - a Hugging Face Space by baidu ERNIE-Image Demo 注:下列图片是通过示例提示词生成的 7 个帖子 - 6 位参与者 阅读完整话题

www.ithome.com · 2026-04-15 10:24:14+08:00 · tech

IT之家 4 月 15 日消息,百度文心大模型团队今日宣布正式开源文生图模型 ERNIE-Image。据该团队介绍,该模型参数量仅 8B,24GB 显存的消费级显卡即可生成媲美顶级商业模型的超真实、复杂图像。 当前,ERNIE-Image 的模型权重、推理代码已在 Hugging Face 全部开源,遵循 Apache2.0 协议,已经支持并上线 ComfyUI Workflow,同时联合 Unsloth 推出 GGUF 量化方案。 IT之家附官方详细介绍如下: ERNIE-Image 是由百度文心大模型团队开发的一款开源文生图模型。它基于单流 Diffusion Transformer(DiT)架构,并配有一个轻量级 Prompt Enhancer,用于将简短输入扩展为更丰富、更结构化的描述。在仅有 8B DiT 参数规模的前提下,达到了开源文生图模型中的领先水平。 整体来看,它在复杂指令跟随、文字渲染和结构化图像生成方面表现突出,适合海报、漫画、多面板布局等需要较强控制能力的内容生产场景。同时,模型也覆盖了从写实摄影、设计感图像到风格化表达在内的多种视觉风格。 经过电影网、凤凰网、蜻蜓 FM、瑛麒动漫、蜂鸟 AI 等 30 多个知名企业、社区和创作平台,20 位艺术创作设计师为期两周的内测与反馈,今天,我们正式开源 ERNIE-Image 模型,参数量仅 8B,24GB 显存的消费级显卡即可生成媲美顶级商业模型的超真实、复杂图像。 01.重新定义消费级开源文生图边界 在指令遵循、文字渲染能力上,ERNIE-Image 从容驾驭复杂细节约束、多主体关系和知识密集型描述;更在中英日韩多语言生成中实现了字形清晰与笔画精准,无论是海报排版、学术图表的严谨逻辑,还是漫画分镜的叙事张力,皆能保持完美的布局组织与画面秩序,这两项能力在开源模型中均排名第一。 以小搏大,消费级可跑的架构设计,仅 8B 参数在多项 benchmark 上全面超越同类开源模型,媲美商用模型诸如 NanoBanana 系列。极致的参数效率优化,将高精度生成的门槛降至 24GB VRAM 的消费级 GPU 即可流畅运行,显著降低研究与部署门槛,打造每一位创作者触手可及的开源工具。 在风格表现上,ERNIE-Image 风格覆盖广,创意边界宽,支持写实摄影与风格化视觉表达,包括动漫、二次元、电影感胶片、分镜截图、老照片等多元风格,尤其在角色一致性和情绪表达上表现突出。 当前,ERNIE-Image 的模型权重、推理代码已在 Hugging Face 全部开源,遵循 Apache2.0 协议,已经支持并上线 ComfyUI Workflow,同时联合 Unsloth 推出 GGUF 量化方案,欢迎大家使用体验,尽情创作! 02.国际基准通杀,开源全面 SOTA 我们在多个公开的国际基准上对 ERNIE-Image 进行了全面评估,包括用于通用图像生成的 GenEval、OneIG(中英文),以及用于复杂指令与文字渲染的 LongText-Bench。 评估结果表明,在所有开源模型中,ERNIE-Image 的综合表现处于领先位置,展现出其在通用图像生成、双语理解、复杂指令执行等各类任务中的强大能力。尤为突出的是,在文字渲染能力上,ERNIE-Image 取得了开源模型的 SOTA 效果,与 NanoBanana 等商业闭源模型同处第一梯队。 03.用文字创造画面 Showtime

linux.do · 2026-04-14 16:00:53+08:00 · tech

师范课设需要,打算借鉴借鉴,求助佬友帮忙下载 。如下4个文件: ABB工业机器人虚拟仿真与离线编程高职PPT全套完整教学课件精选全文 - 百度文库 工业机器人离线编程与仿真一体化教程 项目三 工业机器人涂胶任务编程与仿真 - 百度文库 工业机器人离线编程-软件安装及基本应用 - 百度文库 工业机器人离线编程与仿真-课件 - 百度文库 感谢感谢,十分感谢帮忙下载的佬友 1 个帖子 - 1 位参与者 阅读完整话题