基于图像的三维建模
基于图像的三维建模
  • 学习有效期
  • 学习人数
  • 永久有效
  • 334
  • 承诺服务
  • 课程满意度
课程价格 ¥499.00

VIP专享价

0.00

开通会员享限时特惠 >>
课程介绍

计算机视觉是一门研究如何使机器“看”的科学,具体地说,是指用摄影机和计算机代替人眼和人脑对目标进行分割、检测、跟踪、识别和建模的过程。在实际应用中,计算机视觉处理的结果往往是人工智能和大数据的源泉。本次课程,从计算机视觉的基础图像处理出发,逐步学习计算机视觉的核心:图像(视频)的理解以及三维建模。

 

课程讲师

隋博,中科院自动化所助理研究员,模式识别与智能系统博士,博士期间的主要研究方向是三维计算机视觉与计算机图形学,研究课题是基于图像的三维建筑模型重建,在顶级国际期刊 IEEE TVCG等主流期刊会议以第一作者发表文章多篇。同时,基于博士期间的研究成果,研发若干三维重建相关系统并申请专利。

 

课程目录

1. 特征点的检测与匹配
    1.1 特征点的检测
          1.1.1 特征检测子
          1.1.2 特征描述子
          1.1.3 常用特征点及其特性
    1.2 特征匹配
          1.2.1 距离度量
          1.2.2 匹配策略
          1.2.3 高效匹配
    1.3 实践: C++ 实现Sift 特征检测与匹配
2. 双目立体视觉

    2.1 针孔相机模型
          2.1.1 内参矩阵
          2.1.2 外参矩阵
          2.1.3 径向畸变
    2.2 对极几何
          2.2.1 对极约束
          2.2.2 本质矩阵、基础矩阵与单应矩阵
          2.2.3 相机参数的恢复
    2.3 本质/基础矩阵的优化
          2.3.1 直接线性变换法
          2.3.2 非线性优化
          2.3.3 基于RANSAC的鲁邦方法
    2.4 实践: C++实现基础矩阵的优化与相机姿态参数的恢复
3. 从运动到结构Ⅰ

    3.1 基础知识
          3.1.1 三角量测(Triangulation)
          3.1.2 PnP问题
    3.2 捆绑调整(Bundle Adjustment)
          3.2.1 基本原理
          3.2.2 雅阁比矩阵
          3.2.3 Levenberg-Marquardt优化算法
    3.3 实践:基于Ceres优化库实现捆绑调整
4. 从运动到结构Ⅱ

    4.1 基本概念
          4.1.1 图像连接图
          4.1.2 Tracks
          4.1.3 模型选择
    4.2 常用的架构
          4.2.1 增量运动恢复结构
          4.2.2 全局运动恢复结构
          4.2.3 分层运动恢复结构
          4.2.4 三种方法的比较
    4.3 运动恢复结构存在的问题
          4.3.1 尺度不确定性
          4.3.2 动态物体
          4.3.3 重复结构
          4.3.4 非朗伯面
    4.4 实践: C++实现增量运动恢复结构
5. 稠密重建

    5.1 基础知识
          5.1.1 极线搜索
          5.1.2 光度一致性约束
          5.1.3 可视性约束
    5.2 多视角立体技术
          5.2.3 基于空间patch扩张的方法
          5.2.4 基于深度融合的方法
    5.3 实践:C++实现基于深度融合的稠密重建
6. 点云到网格的重建

    6.1 三维模型的表述方式
          6.1.1 三角网格
          6.1.2 矩阵表达
          6.1.3 半边结构
          6.1.5 OpenGL中的数据结构
    6.2 德劳内三角剖分(Delaunay Triangulation)
    6.3 基于隐函数的三维模型重建
          6.3.1 八叉树 Octree
          6.3.2 隐函数拟合
          6.3.3 Marching Cube
          6.3.4 常用的方法
    6.4 实践: C++ 实现高斯隐函数重建与网格生成
7. 
纹理图像的创建与编辑
    7.1 OpenGL纹理模型的渲染
          7.1.1 纹理图像
          7.1.2 纹理坐标
          7.1.3 OpenGL 纹理模型渲染实例
    7.2 网格可视性计算与优化
          7.2.1 碰撞检测模型
          7.2.2 图像细节信息
          7.2.3 MRF模型的构建
          7.2.4 MRF 模型的快速优化
    7.3 纹理坐标的计算
          7.3.1 半封闭(2.5D)的场景
          7.3.2 网格参数化
    7.4 实践: C++ 实现网格的可视性计算与优化
8. 纹理图像的创建与编辑 Ⅱ

    8.1 多视角图像拼接
    8.2 纹理图像的颜色调整
          8.2.1 非线性颜色矫正
          8.2.2 伽马矫正
    8.3 纹理图像的编辑
          8.3.1 泊松图像编辑
    8.4 实践:C++实现纹理图像的非线性颜色矫正

 

课程目标 

通过这门课之后,掌握常用的数学优化方法、三维理论知识、C++代码架构以及图像图形可视化等技能,并最终可以手动搭建一个多视角图像的三维建模系统。优秀学员达到企业实习或者就业的水平。

 

课程特色 

实践认真:课程核心算法,逐行代码实现,而不调用现成的函数库
答疑及时:课程讨论区答疑,并建有微信答疑群,与讲师直接沟通
作业细致:根据每章节知识点,精心设计作业,并课后批改

 

先修课程 

     高等数学、线性代数、概率论、C++编程、Linux

授课教师

助理研究员

关于课程

学习方式

1、2018年9月1日开课;

2、课程的课件、代码及其它学习资料将于每周五晚上 7 点之前更新,便于课前预习;课程视频将于每周末晚 7 点更新,一年之内可以随时看回放; 

3、每一讲均布置作业,由讲师和助教批改并公布作业完成情况;

4、报名课程后将加入微信答疑群,与讲师直接沟通,实时答疑;

5、如需缓存视频,可下载深蓝学院安卓版APP或IOS版APP;

6、请同学们留出 4 个小时左右的时间用于课程习题,以更好的吸收课程知识。

推荐课程

  • 暂无推荐课程