当前位置:首页 > 百科

多媒体信息检索与管理

2009年清华大学出版社出版的图书,作者是冯大淦,萧允治,张宏江。

  • 书名 多媒体信息检索与管理
  • 作者 冯大淦,萧允治,张宏江 著,
  • 译者 刘晓冬 译
  • 出版社 清华大学出版社
  • 出版时间 2009年11月1日

陈封数虽曲切

  本书适用读者很广泛。对于想学习和了解计算机多媒体信息检索和管理的本科生、研究生,本书可作为他们的教材或教学参考书。对于那些从事计算机多媒体信息检索和管理工程领域的研究开发人员、技术服务人员和用户等,本书也是一本很好的参考书。

  本书是一本关于多媒体信息检索和来自管理领域的经典著作,倾注了该领域世界众多知学者的研究成果和贡献,在国外许多重点大学作为计算机专业本科生和研究生的教材。本书填补了我国在该研究领域译著的空白。本书从理论基础和实践应用两个方面对当前流行的多媒体信息检索和管理领域的技术和系统进行了完整和详细地介绍。全书共分两大篇,即技术基础篇和应用篇,共21章,内容包括对于数字音频音乐、图像和视频基于内容检索的一套完整的技术;多媒体低级特征提取和高级语义描述,以及最新的MPEG一7标准;多媒体认证和水印;广泛的实际应用(例如,数字图书馆、医学图像和生物特征识别等)。

目录

  第1章基于内容的图像检索基础 3

  1让义刘事的跟府.1引言 3

  1.了农吧孩历英江小征般动2图像内容描述符 4

  1.2.1颜色 5

  1.2.2纹理 8

 360百科 1.2.3形状 12

  1.2.4空间信息 15

  1.3相似度测量和索引方案 15

  1.3.1相似度连怕混容较/距离测量 15

  1.3.2索引方案 17

  1.4用户交互 18

  1.4.1查询说明 18

  1.4.2相关反馈 18

  1.5性能评价 19

  1有张伟远放西植国乡.6结论 20

  参考文献 21

  第2章基于内容的视频分析、检索和浏览 26

  2.1引言 26

  2.2视频结构分析 27

  2.2.1镜源长怎妈线假急希头边界检测 28

  2.2.2场景分组 30

  2.2.3情节分割 30

  2.3视频内容表达 31

  2.3.1基于关键帧的表达 32

  2.3.2基于镜流陆圆谓地头的表达 32

  2足安要迫己日度这看洲肉.4视频提取和视频摘要 39

  2.4.1关键帧抽取 39

  2.4.2视频高亮验演手刚显示 41

  2.5基于内效言场裂容的视频检索和浏览 42

  2.5.1相似性度量 42

  2.5.2镜头聚类 44

  2.5.3浏览方案 44

  2.6结论 46

  致谢 47

  参考文献 47

  第3章基于内容的图像检索的相关反馈 51

  3.1引言 51

  3.2一映载何相关反馈算法 52

连演百  3.2.1经典算法 52

  3.2.2作为学习帝状问题的相关反馈 53

  3.2.3带记忆的相关反馈 56

  3.3一个集成相关反馈框架 57

  3.3.1语义网络 波封杀58

  3.3.2集成和跨模态查询和检索 59

  3.3.3概率传播方案 60

 造轮艺批胜家 3.3.4实验结果 61

  3.4结论 62

  致谢 63

  参考文献 63

  第4章结构和语义层次的视频分析和摘要 66

  4.1引言 66

  4.2场景分析 67

  4.2.1计算场景定义 67

  4.2.2方法 69

  促果菜种4.3事件分析 71

  4.3.1方法 71

  4.4视频摘要 73

  4.4.1图像故事板 73

  4.4.2缩略视频 74

  4.4.3"最优"摘要存在吗 77

  4.5结论 78

  致谢 79

移也种把钱们  参考文献 79

  第5章数字音频和音乐的基于内容的检索 83

  5.1引言 83

  5.2音频特阿育朝省在管许质密征抽取 84

  5.2.1声学特征 84

  5.2.2主观/语义特征 85

  5.3一般音频分类和检索 86

  5.3.1基于内容的音频分割 86

  5.3.2基于内容的音频检索 87

  5.4音乐内容分析 88

  5.4.1音乐分割 88

  5.4.2音乐类型分类 89

  5.4.3音乐摘要 89

  5.4.4乐器鉴定 90

  5.4.5音乐标注 91

  5.5基于内容的音乐检索 92

  5.6案例研究 93

  5.6.1基于内容的音频检索 93

  5.6.2基于内容的音乐哼唱检索 97

  5.7结论 100

  5.7.1从录音中提取旋律 100

  5.7.2检索精度 101

  5.7.3基于Web的搜索引擎 101

  致谢 101

  参考文献 101

  第6章MPEG-7多媒体内容描述标准 105

  6.1引言 105

  6.2背景和应用 106

  6.2.1MPEG背景 106

  6.2.2MPEG-7应用 107

  6.3MPEG-7结构 109

  6.3.1MPEG-7组成部分 109

  6.3.2MPEG-7基本结构 109

  6.3.3MPEG-7可扩展性 110

  6.4MPEG-7概念模型 111

  6.5MPEG-7描述定义语言 112

  6.6MPEG-7多媒体描述方案 113

  6.6.1基本元素 114

  6.6.2内容描述工具 114

  6.6.3内容组织、导航和访问、用户交互 114

  6.6.4分类方案 115

  6.6.5例子 115

  6.7MPEG-7音频描述工具 119

  6.7.1低层次音频工具 119

  6.7.2高层次音频工具 120

  6.7.3例子 120

  6.8MPEG-7视觉描述工具 122

  6.8.1颜色 122

  6.8.2纹理 122

  6.8.3形状 123

  6.8.4运动 123

  6.8.5定位 123

  6.8.6人脸 123

  6.8.7例子 123

  6.9MPEG-7的未来 125

  参考文献 125

  第7章多媒体认证和水印技术 129

  7.1引言 129

  7.2多媒体认证范例 131

  7.2.1需求 131

  7.2.2对多媒体认证系统的攻击 132

  7.3多媒体认证方案 133

  7.3.1使用脆弱水印的硬多媒体认证 133

  7.3.2使用半脆弱水印的软多媒体认证 137

  7.3.3基于内容的认证 140

  7.4结论 147

  参考文献 147

  第8章索引和检索高维视觉特征 151

  8.1引言 151

  8.2R树家族 154

  8.3CSS+树 155

  8.3.1CSS+树的一般结构 155

  8.3.2CSS+树的批量加载 156

  8.3.3CSS+树的动态行为 158

  8.3.4同其他层次化结构的比较 160

  8.4处理不同的距离度量 161

  8.4.1用加权欧氏距离进行k-nn搜索的方法 162

  8.4.2到高维空间的扩展 163

  8.4.3实验结果和讨论 163

  8.5降维 164

  8.5.1使用混合联想神经网络降维 165

  8.5.2降维结果 166

  8.6结论 168

  参考文献 169

  第9章多媒体数据库的语义数据建模机制 172

  9.1引言 172

  9.2语义和多媒体数据建模技术 174

  9.2.1多媒体数据库技术 174

  9.2.2面向对象的视图机制 174

  9.2.3动态对象模型 175

  9.3MediaView:一种语义建模机制 176

  9.3.1概貌 176

  9.3.2MediaView的基本原理 177

  9.3.3视图算子 180

  9.3.4视图推导机制 181

  9.4MediaView的应用 184

  9.4.1多媒体查询 184

  9.4.2"媒体地图"中的导航 186

  9.4.3存储和索引的优化 187

  9.5结论 187

  参考文献 188

  第10章可视化数据库系统中基于特征的检索 190

  10.1引言 190

  10.2可视化数据库系统设计 191

  10.3元数据层次 193

  10.3.1特征索引 194

  10.3.2聚类和模板 196

  10.3.3异类特征的聚类 196

  10.4异类特征的查询 199

  10.4.1使用异类特征排序图像 200

  10.4.2合并异类特征 202

  10.4.3相关反馈的集成 202

  10.5结论 203

  致谢 204

  参考文献 204

  第2部分应用篇

  第11章数字图书馆 209

  11.1数字图书馆定义 209

  11.2数字图书馆创新工程(第一阶段) 211

  11.3DLI项目 212

  11.3.1卡内基梅隆大学"视频的全内容搜索和检索" 212

  11.3.2伊利诺斯大学乌尔班纳-香巴尼分校"科学文献的联合知识库" 215

  11.3.3斯坦福大学"异类服务中的互操作机制" 217

  11.4DLI二期 219

  11.4.1以人为中心的研究 220

  11.4.2基于内容和馆藏的研究 220

  11.4.3以系统为中心的研究 221

  11.4.4建立测试平台 221

  11.4.5总结 222

  11.5结论 222

  参考文献 222

  第12章数字图书馆的可扩展存储 225

  12.1引言 225

  12.2动机 226

  12.3主题领域 226

  12.4本地文件系统 227

  12.5工作负载研究 227

  12.6本地文件系统性能问题 230

  12.6.1高速缓存 230

  12.6.2聚集和分裂 231

  12.6.3块尺寸和分配 231

  12.6.4日志结构的方法 232

  12.7磁盘阵列 232

  12.8网络化存储 236

  12.8.1智能磁盘 237

  12.8.2并行文件系统 238

  12.8.3分布式文件系统 239

  12.9结论 241

  参考文献 241

  第13章数字图书馆的对象知识库 247

  13.1引言 247

  13.2数字对象与文件 248

  13.3命名和定位 249

  13.3.1唯一性与定位依赖性 249

  13.3.2统一资源名称 250

  13.3.3可扩展的对象定位 251

  13.4可靠性冗余编码 252

  13.5元数据 253

  13.5.1桶 254

  13.5.2条款和条件 254

  13.6数字对象知识库 255

  13.6.1KAHN-WILENSKY及其扩展 256

  13.6.2其他的知识库方法 257

  13.7结论 258

  参考文献 259

  第14章万维网上的信息发现 263

  14.1引言 263

  14.2Web结构挖掘 267

  14.2.1权威和枢纽 267

  14.2.2锚点 268

  14.2.3网页排名 271

  14.3Web日志挖掘 272

  14.3.1用户模型 272

  14.3.2因特网GLOSS 273

  14.4结论 276

  参考文献 276

  第15章协同多媒体信息系统 278

  15.1引言 278

  15.1.1协同多媒体信息系统定义 279

  15.1.2多媒体信息系统的分类 279

  15.2协同多媒体信息系统回顾 280

  15.2.1多媒体会议 280

  15.2.2集成工具集 283

  15.3体系结构实例 285

  15.3.1MARRATECH 285

  15.3.2多媒体交互式远程学习系统 286

  15.3.3会议纪要系统 287

  15.3.4TEAMSMART 287

  15.4管理问题 289

  15.5结论 291

  参考文献 291

  第16章图片存档及通信系统、图像管理和影像信息学 297

  16.1图片存档及通信系统(PACS)基础 297

  16.1.1PACS组件 297

  16.1.2医学图像 299

  16.1.3术语和标准 300

  16.1.4IHE和PACS数据流 301

  16.1.5HIS/CMS和电子病历 301

  16.2图像数据通信和管理 302

  16.2.1图像通信 302

  16.2.2大尺度图像数据管理 305

  16.3影像信息学 307

  16.3.1医学影像信息学基础设施 307

  16.3.2NCM-神经外科病人数据的管理 309

  16.4总结 311

  16.5结论 311

  致谢 312

  参考文献 312

  第17章医学数据基于内容的检索 313

  17.1引言 313

  17.2一维医学数据基于内容的检索 314

  17.3二维医学数据基于内容的检索 315

  17.4三维医学数据基于内容的检索 316

  17.5四维医学数据基于内容的检索 318

  17.5.1示踪剂动力学特征提取和数据压缩 319

  17.5.2四维功能图像检索系统 321

  17.5.3案例研究 323

  17.6结论 324

  致谢 325

  参考文献 325

  第18章使用掌纹图像的生物特征检索 329

  18.1引言 329

  18.2动态特征选择 335

  18.3分式判别函数 336

  18.4分层掌纹匹配 337

  18.5实验结果 340

  18.6结论 341

  致谢 342

  参考文献 342

  第19章在人脸数据库中查找人脸 344

  19.1人脸识别:综述和挑战 344

  19.1.1自动人脸识别的应用 344

  19.1.2人脸识别系统的结构 345

  19.2特征脸 346

  19.3复杂背景中的人脸检测 347

  19.3.1颜色空间 347

  19.3.2类似人脸区域的分割 348

  19.4面部特征检测和提取 352

  19.4.1提取人脸轮廓 353

  19.4.2变形模板 355

  19.5从人脸数据库中搜索人脸 358

  19.5.1基于特征脸的人脸识别 358

  19.5.2使用豪斯多夫距离度量的人脸识别 359

  19.6结论 363

  参考文献 364

  第20章活体植物识别的数据管理 366

  20.1引言 366

  20.1.1植物识别和智能信息处理 367

  20.1.2植物数据管理 367

  20.2植物学家识别植物的方法 367

  20.3植物识别和植物数据管理系统 369

  20.3.1Lucid:多媒体知识管理工具 369

  20.3.2Uconn植物数据库 369

  20.3.3CalFlora:维管植物数据库 370

  20.3.4计算机辅助植物识别系统 370

  20.4植物图像处理和特征提取 371

  20.4.1叶子图像处理 371

  20.4.2花图像处理 375

  20.5叶子与花的图像检索 377

  20.5.1叶子图像检索 377

  20.5.2花图像检索 381

  20.6结论 384

  参考文献 384

  第21章广播视频的快速启动与交互式检索 387

  21.1引言 387

  21.2通用广播方案 389

  21.2.1锥形广播方案 390

  21.2.2摩天楼广播方案 390

  21.2.3贪心磁盘节约型广播方案 390

  21.3预取模式--积极的与适时的 391

  21.4快进和向前跳读 392

  21.4.1短程快进广播方案 393

  21.4.2主动缓冲区管理方案 395

  21.4.3镜像锥形广播方案 396

  21.4.4向前跳读 397

  21.5暂停-重新开始、倒带和向后复位 397

  21.6结论 398

  致谢 398

  参考文献 399

标签:

  • 关注微信
上一篇:第九防线

相关文章