第1章 绪论 1
1.1 视觉感知与彩色模型 1
1.1.1 视觉感知 1
1.1.2 彩色模型 3
1.2 图像和视频的数字化 8
1.2.1 图像的数字化 8
1.2.2 视频的数字化 10
1.3 图像和视频分析的相关概念 10
1.3.1 数字图像处理 10
1.3.2 图像分析 11
1.3.3 视频分析 12
1.4 图像与视频分析的研究内容 13
1.4.1 图像与视频场景分割 13
1.4.2 图像与视频场景特征描述 14
1.4.3 图像/视频中的目标识别 15
1.4.4 场景描述与理解 16
1.5 图像与视频分析的应用 17
1.5.1 工业方面的应用 17
1.5.2 医学图像分析 18
1.5.3 遥感领域应用 18
1.5.4 军事公安领域的应用 19
1.5.5 交通 20
1.5.6 其他 21
1.6 小结 22
参考文献 22
第2章 图像分割技术 24
2.1 图像与视频分割概述 24
2.2 几种经典图像分割方法 25
2.2.1 基于边缘的分割 25
2.2.2 基于阈值的分割 32
2.2.3 基于区域的分割 37
2.3 基于形态学分水岭的分割 39
2.3.1 形态学图像处理基本概念和运算 39
2.3.2 基于分水岭的分割 43
2.4 基于聚类的分割 46
2.4.1 C-均值聚类方法 46
2.4.2 模糊C-均值聚类方法 47
2.5 基于图论的图像分割方法 49
2.5.1 基本原理 49
2.5.2 GraphCut及其改进图像分割方法 50
2.5.3 其他基于图的分割方法 55
2.6 偏微分图像分割 56
2.6.1 Snakes及其改进模型 57
2.6.2 水平集(Level Set)方法 58
2.6.3 基于变分水平集的图像分割 62
2.7 多特征融合的图像分割 63
2.8 彩色图像分割 64
2.8.1 直方图阈值法 64
2.8.2 彩色空间聚类法 65
2.8.3 融合颜色和空间信息的彩色图像分割 66
2.9 视频对象分割 68
2.9.1 基于时空的视频对象分割 68
2.9.2 基于运动的视频对象分割 71
2.9.3 交互式视频对象分割 79
2.9.4 基于高斯混合模型的自适应阴影检测 79
2.10 小结 82
参考文献 82
第3章 特征描述与提取 86
3.1 概述 86
3.1.1 视觉特征 87
3.1.2 图像内容 87
3.1.3 图像特征 87
3.1.4 图像特征提取 89
3.1.5 特征选择 89
3.2 常用的低层视觉特征 90
3.2.1 颜色特征描述 91
3.2.2 纹理特征描述 96
3.2.3 形状特征描述 127
3.2.4 局部特征描述 150
3.2.5 视觉特征的比较 182
3.3 其他低层特征提取 183
3.3.1 图像代数特征 183
3.3.2 图像变换系数特征 184
3.3.3 基于统计信息的特征提取 184
3.4 图像中层语义描述 185
3.4.1 视觉词包(Bag-of-Visterms,BOV) 185
3.4.2 语义主题 188
3.5 图像高层语义特征描述 189
3.5.1 语义提取模型 190
3.5.2 语义关联 192
3.5.3 高层语义描述推理 193
3.6 运动特征描述 199
3.6.1 基于MPEG-7的运动特征描述 201
3.6.2 非参数模型 202
3.6.3 参数模型 206
3.6.4 基于特征的运动估计 210
3.7 小结 210
参考文献 211
第4章 分类器设计 218
4.1 概述 218
4.1.1 生成模型 218
4.1.2 判别模型 220
4.1.3 混合生成—判别模型 221
4.2 常见分类器 222
4.2.1 贝叶斯分类器 222
4.2.2 SVM分类器 228
4.2.3 强化学习分类器 235
4.2.4 神经网络分类器 250
4.2.5 基于点集Voronoi图的分类器 256
4.2.6 最近邻凸包分类器 258
4.2.7 遗传算法和免疫算法的分类器 262
4.2.8 基于稀疏表示的分类器 265
4.3 多分类器集成 267
4.3.1 集成学习的有效性和条件 268
4.3.2 基分类器产生方法 269
4.3.3 多分类器集成系统结构 270
4.3.4 多分类器设计方法 272
4.3.5 分类器的选择准则 273
4.3.6 Adaboost分类器 274
4.4 小结 279
参考文献 280
第5章 基于SVM的文档图像版面分析 286
5.1 概述 286
5.1.1 版面分析发展历程 286
5.1.2 版面分析方法分类 288
5.2 文档图像倾斜检测 290
5.2.1 倾斜校正方法概述 290
5.2.2 改进的最近邻链倾斜检测算法 292
5.3 简单背景下版面分割 298
5.3.1 基于边缘检测的连通区构造 298
5.3.2 结合连通区和游程平滑版面分割 299
5.3.3 文本区域二值化 303
5.4 复杂背景下版面分割 304
5.5 阅读顺序未知的纯文本图像版面分析 306
5.5.1 已有算法分析 307
5.5.2 基于SVM的复杂纯文本图像版面分析算法 308
5.6 小结 312
参考文献 312
第6章 基于显著性和LDA主题模型的图像场景分类 315
6.1 基于语义生成模型的图像场景分类概述 315
6.2 基本术语 317
6.3 图像中的主题模型 318
6.4 基于主题模型的场景分类方法基本框架 319
6.5 基于显著性的主题模型场景分类 319
6.5.1 视觉词包表示 320
6.5.2 视觉词包生成 321
6.5.3 基于频域显著性的视觉词包生成 322
6.5.4 统计可视单词的词频表 327
6.5.5 改进LDA模型在图像上的实现 327
6.6 本章小结 340
参考文献 340
第7章 运动目标检测与跟踪 342
7.1 概述 342
7.2 基于背景差分的目标检测 345
7.2.1 背景建模概述 345
7.2.2 单高斯背景建模 347
7.2.3 高斯混合背景建模 347
7.2.4 引入二型模糊的混合高斯背景建模 351
7.3 非参数核密度估计的运动目标检测 356
7.3.1 经典方法 357
7.3.2 基于时间窗的核密度估计运动检测 358
7.3.3 聚类差分核密度估计算法 363
7.4 检测结果后处理 366
7.5 运动目标跟踪 367
7.5.1 Kalman预测与全局特征匹配跟踪 368
7.5.2 基于Mean Shift的目标跟踪 373
7.5.3 改进的Mean Shift跟踪方法 377
7.5.4 基于粒子滤波的跟踪 378
7.5.5 抗遮挡目标跟踪 385
7.5.6 基于角点抽样的互遮挡多目标跟踪 392
7.6 小结 399
参考文献 399
名词索引 404
· · · · · · (
收起)