可规模化的高质量文字图像生成

主讲人:赵世天 | 上海人工智能实验室科研助理

  • 开课时间

    2025.05.20 20:00

  • 课程时长

    100分钟

  • 学习人数

    217人次学习

立即报名
添加助教,入群交流,领取课件

立即报名

可规模化的高质量文字图像生成

如何生成高美学、准确的文字图像一直是图像生成领域里一个重要的问题。本次报告聚焦于文字图像生成领域的经典工作回顾,以及讲者团队在该方向下的相关工作——LeX-Art:一套文字图像生成系统。其中,讲者团队从数据合成角度增强了文生图基础模型在生成高美学、准确文字图像上的能力,推出了​​LeX-10K​​数据集、​​LeX-Enhancer​​提示增强模型,以及​​LeX-FLUX​​和​​LeX-Lumina​​文生图模型,在文本渲染上达到SOTA。并且提出​​LeX-Bench​​评测基准和​​PNED​​指标,用于系统评估文本生成质量。

直播精华文稿暂未上传
直播课件暂未上传
模型压缩与部署 模型压缩与部署 进阶
机器学习 计算机视觉 机器学习 计算机视觉 进阶