当前位置：首页 > 百科

多媒体信息检索与管理

百科
2023-02-28

2009年清华大学出版社出版的图书，作者是冯大淦，萧允治，张宏江。

书名多媒体信息检索与管理
作者冯大淦，萧允治，张宏江著，
译者刘晓冬译
出版社清华大学出版社
出版时间 2009年11月1日

简陈封数虽曲切介

　　本书适用读者很广泛。对于想学习和了解计算机多媒体信息检索和管理的本科生、研究生，本书可作为他们的教材或教学参考书。对于那些从事计算机多媒体信息检索和管理工程领域的研究开发人员、技术服务人员和用户等，本书也是一本很好的参考书。

　　本书是一本关于多媒体信息检索和来自管理领域的经典著作，倾注了该领域世界众多知学者的研究成果和贡献，在国外许多重点大学作为计算机专业本科生和研究生的教材。本书填补了我国在该研究领域译著的空白。本书从理论基础和实践应用两个方面对当前流行的多媒体信息检索和管理领域的技术和系统进行了完整和详细地介绍。全书共分两大篇，即技术基础篇和应用篇，共21章，内容包括对于数字音频音乐、图像和视频基于内容检索的一套完整的技术;多媒体低级特征提取和高级语义描述，以及最新的MPEG一7标准;多媒体认证和水印;广泛的实际应用(例如，数字图书馆、医学图像和生物特征识别等)。

目录

　　第1章基于内容的图像检索基础 3

　　1让义刘事的跟府.1引言 3

　　1.了农吧孩历英江小征般动2图像内容描述符 4

　　1.2.1颜色 5

　　1.2.2纹理 8

　360百科　1.2.3形状 12

　　1.2.4空间信息 15

　　1.3相似度测量和索引方案 15

　　1.3.1相似度连怕混容较/距离测量 15

　　1.3.2索引方案 17

　　1.4用户交互 18

　　1.4.1查询说明 18

　　1.4.2相关反馈 18

　　1.5性能评价 19

　　1有张伟远放西植国乡.6结论 20

　　参考文献 21

　　第2章基于内容的视频分析、检索和浏览 26

　　2.1引言 26

　　2.2视频结构分析 27

　　2.2.1镜源长怎妈线假急希头边界检测 28

　　2.2.2场景分组 30

　　2.2.3情节分割 30

　　2.3视频内容表达 31

　　2.3.1基于关键帧的表达 32

　　2.3.2基于镜流陆圆谓地头的表达 32

　　2足安要迫己日度这看洲肉.4视频提取和视频摘要 39

　　2.4.1关键帧抽取 39

　　2.4.2视频高亮验演手刚显示 41

　　2.5基于内效言场裂容的视频检索和浏览 42

　　2.5.1相似性度量 42

　　2.5.2镜头聚类 44

　　2.5.3浏览方案 44

　　2.6结论 46

　　致谢 47

　　参考文献 47

　　第3章基于内容的图像检索的相关反馈 51

　　3.1引言 51

　　3.2一映载何相关反馈算法 52

连演百　　3.2.1经典算法 52

　　3.2.2作为学习帝状问题的相关反馈 53

　　3.2.3带记忆的相关反馈 56

　　3.3一个集成相关反馈框架 57

　　3.3.1语义网络波封杀58

　　3.3.2集成和跨模态查询和检索 59

　　3.3.3概率传播方案 60

　造轮艺批胜家　3.3.4实验结果 61

　　3.4结论 62

　　致谢 63

　　参考文献 63

　　第4章结构和语义层次的视频分析和摘要 66

　　4.1引言 66

　　4.2场景分析 67

　　4.2.1计算场景定义 67

　　4.2.2方法 69

　　促果菜种4.3事件分析 71

　　4.3.1方法 71

　　4.4视频摘要 73

　　4.4.1图像故事板 73

　　4.4.2缩略视频 74

　　4.4.3"最优"摘要存在吗 77

　　4.5结论 78

　　致谢 79

移也种把钱们　　参考文献 79

　　第5章数字音频和音乐的基于内容的检索 83

　　5.1引言 83

　　5.2音频特阿育朝省在管许质密征抽取 84

　　5.2.1声学特征 84

　　5.2.2主观/语义特征 85

　　5.3一般音频分类和检索 86

　　5.3.1基于内容的音频分割 86

　　5.3.2基于内容的音频检索 87

　　5.4音乐内容分析 88

　　5.4.1音乐分割 88

　　5.4.2音乐类型分类 89

　　5.4.3音乐摘要 89

　　5.4.4乐器鉴定 90

　　5.4.5音乐标注 91

　　5.5基于内容的音乐检索 92

　　5.6案例研究 93

　　5.6.1基于内容的音频检索 93

　　5.6.2基于内容的音乐哼唱检索 97

　　5.7结论 100

　　5.7.1从录音中提取旋律 100

　　5.7.2检索精度 101

　　5.7.3基于Web的搜索引擎 101

　　致谢 101

　　参考文献 101

　　第6章MPEG-7多媒体内容描述标准 105

　　6.1引言 105

　　6.2背景和应用 106

　　6.2.1MPEG背景 106

　　6.2.2MPEG-7应用 107

　　6.3MPEG-7结构 109

　　6.3.1MPEG-7组成部分 109

　　6.3.2MPEG-7基本结构 109

　　6.3.3MPEG-7可扩展性 110

　　6.4MPEG-7概念模型 111

　　6.5MPEG-7描述定义语言 112

　　6.6MPEG-7多媒体描述方案 113

　　6.6.1基本元素 114

　　6.6.2内容描述工具 114

　　6.6.3内容组织、导航和访问、用户交互 114

　　6.6.4分类方案 115

　　6.6.5例子 115

　　6.7MPEG-7音频描述工具 119

　　6.7.1低层次音频工具 119

　　6.7.2高层次音频工具 120

　　6.7.3例子 120

　　6.8MPEG-7视觉描述工具 122

　　6.8.1颜色 122

　　6.8.2纹理 122

　　6.8.3形状 123

　　6.8.4运动 123

　　6.8.5定位 123

　　6.8.6人脸 123

　　6.8.7例子 123

　　6.9MPEG-7的未来 125

　　参考文献 125

　　第7章多媒体认证和水印技术 129

　　7.1引言 129

　　7.2多媒体认证范例 131

　　7.2.1需求 131

　　7.2.2对多媒体认证系统的攻击 132

　　7.3多媒体认证方案 133

　　7.3.1使用脆弱水印的硬多媒体认证 133

　　7.3.2使用半脆弱水印的软多媒体认证 137

　　7.3.3基于内容的认证 140

　　7.4结论 147

　　参考文献 147

　　第8章索引和检索高维视觉特征 151

　　8.1引言 151

　　8.2R树家族 154

　　8.3CSS+树 155

　　8.3.1CSS+树的一般结构 155

　　8.3.2CSS+树的批量加载 156

　　8.3.3CSS+树的动态行为 158

　　8.3.4同其他层次化结构的比较 160

　　8.4处理不同的距离度量 161

　　8.4.1用加权欧氏距离进行k-nn搜索的方法 162

　　8.4.2到高维空间的扩展 163

　　8.4.3实验结果和讨论 163

　　8.5降维 164

　　8.5.1使用混合联想神经网络降维 165

　　8.5.2降维结果 166

　　8.6结论 168

　　参考文献 169

　　第9章多媒体数据库的语义数据建模机制 172

　　9.1引言 172

　　9.2语义和多媒体数据建模技术 174

　　9.2.1多媒体数据库技术 174

　　9.2.2面向对象的视图机制 174

　　9.2.3动态对象模型 175

　　9.3MediaView:一种语义建模机制 176

　　9.3.1概貌 176

　　9.3.2MediaView的基本原理 177

　　9.3.3视图算子 180

　　9.3.4视图推导机制 181

　　9.4MediaView的应用 184

　　9.4.1多媒体查询 184

　　9.4.2"媒体地图"中的导航 186

　　9.4.3存储和索引的优化 187

　　9.5结论 187

　　参考文献 188

　　第10章可视化数据库系统中基于特征的检索 190

　　10.1引言 190

　　10.2可视化数据库系统设计 191

　　10.3元数据层次 193

　　10.3.1特征索引 194

　　10.3.2聚类和模板 196

　　10.3.3异类特征的聚类 196

　　10.4异类特征的查询 199

　　10.4.1使用异类特征排序图像 200

　　10.4.2合并异类特征 202

　　10.4.3相关反馈的集成 202

　　10.5结论 203

　　致谢 204

　　参考文献 204

　　第2部分应用篇

　　第11章数字图书馆 209

　　11.1数字图书馆定义 209

　　11.2数字图书馆创新工程(第一阶段) 211

　　11.3DLI项目 212

　　11.3.1卡内基梅隆大学"视频的全内容搜索和检索" 212

　　11.3.2伊利诺斯大学乌尔班纳-香巴尼分校"科学文献的联合知识库" 215

　　11.3.3斯坦福大学"异类服务中的互操作机制" 217

　　11.4DLI二期 219

　　11.4.1以人为中心的研究 220

　　11.4.2基于内容和馆藏的研究 220

　　11.4.3以系统为中心的研究 221

　　11.4.4建立测试平台 221

　　11.4.5总结 222

　　11.5结论 222

　　参考文献 222

　　第12章数字图书馆的可扩展存储 225

　　12.1引言 225

　　12.2动机 226

　　12.3主题领域 226

　　12.4本地文件系统 227

　　12.5工作负载研究 227

　　12.6本地文件系统性能问题 230

　　12.6.1高速缓存 230

　　12.6.2聚集和分裂 231

　　12.6.3块尺寸和分配 231

　　12.6.4日志结构的方法 232

　　12.7磁盘阵列 232

　　12.8网络化存储 236

　　12.8.1智能磁盘 237

　　12.8.2并行文件系统 238

　　12.8.3分布式文件系统 239

　　12.9结论 241

　　参考文献 241

　　第13章数字图书馆的对象知识库 247

　　13.1引言 247

　　13.2数字对象与文件 248

　　13.3命名和定位 249

　　13.3.1唯一性与定位依赖性 249

　　13.3.2统一资源名称 250

　　13.3.3可扩展的对象定位 251

　　13.4可靠性冗余编码 252

　　13.5元数据 253

　　13.5.1桶 254

　　13.5.2条款和条件 254

　　13.6数字对象知识库 255

　　13.6.1KAHN-WILENSKY及其扩展 256

　　13.6.2其他的知识库方法 257

　　13.7结论 258

　　参考文献 259

　　第14章万维网上的信息发现 263

　　14.1引言 263

　　14.2Web结构挖掘 267

　　14.2.1权威和枢纽 267

　　14.2.2锚点 268

　　14.2.3网页排名 271

　　14.3Web日志挖掘 272

　　14.3.1用户模型 272

　　14.3.2因特网GLOSS 273

　　14.4结论 276

　　参考文献 276

　　第15章协同多媒体信息系统 278

　　15.1引言 278

　　15.1.1协同多媒体信息系统定义 279

　　15.1.2多媒体信息系统的分类 279

　　15.2协同多媒体信息系统回顾 280

　　15.2.1多媒体会议 280

　　15.2.2集成工具集 283

　　15.3体系结构实例 285

　　15.3.1MARRATECH 285

　　15.3.2多媒体交互式远程学习系统 286

　　15.3.3会议纪要系统 287

　　15.3.4TEAMSMART 287

　　15.4管理问题 289

　　15.5结论 291

　　参考文献 291

　　第16章图片存档及通信系统、图像管理和影像信息学 297

　　16.1图片存档及通信系统(PACS)基础 297

　　16.1.1PACS组件 297

　　16.1.2医学图像 299

　　16.1.3术语和标准 300

　　16.1.4IHE和PACS数据流 301

　　16.1.5HIS/CMS和电子病历 301

　　16.2图像数据通信和管理 302

　　16.2.1图像通信 302

　　16.2.2大尺度图像数据管理 305

　　16.3影像信息学 307

　　16.3.1医学影像信息学基础设施 307

　　16.3.2NCM-神经外科病人数据的管理 309

　　16.4总结 311

　　16.5结论 311

　　致谢 312

　　参考文献 312

　　第17章医学数据基于内容的检索 313

　　17.1引言 313

　　17.2一维医学数据基于内容的检索 314

　　17.3二维医学数据基于内容的检索 315

　　17.4三维医学数据基于内容的检索 316

　　17.5四维医学数据基于内容的检索 318

　　17.5.1示踪剂动力学特征提取和数据压缩 319

　　17.5.2四维功能图像检索系统 321

　　17.5.3案例研究 323

　　17.6结论 324

　　致谢 325

　　参考文献 325

　　第18章使用掌纹图像的生物特征检索 329

　　18.1引言 329

　　18.2动态特征选择 335

　　18.3分式判别函数 336

　　18.4分层掌纹匹配 337

　　18.5实验结果 340

　　18.6结论 341

　　致谢 342

　　参考文献 342

　　第19章在人脸数据库中查找人脸 344

　　19.1人脸识别:综述和挑战 344

　　19.1.1自动人脸识别的应用 344

　　19.1.2人脸识别系统的结构 345

　　19.2特征脸 346

　　19.3复杂背景中的人脸检测 347

　　19.3.1颜色空间 347

　　19.3.2类似人脸区域的分割 348

　　19.4面部特征检测和提取 352

　　19.4.1提取人脸轮廓 353

　　19.4.2变形模板 355

　　19.5从人脸数据库中搜索人脸 358

　　19.5.1基于特征脸的人脸识别 358

　　19.5.2使用豪斯多夫距离度量的人脸识别 359

　　19.6结论 363

　　参考文献 364

　　第20章活体植物识别的数据管理 366

　　20.1引言 366

　　20.1.1植物识别和智能信息处理 367

　　20.1.2植物数据管理 367

　　20.2植物学家识别植物的方法 367

　　20.3植物识别和植物数据管理系统 369

　　20.3.1Lucid:多媒体知识管理工具 369

　　20.3.2Uconn植物数据库 369

　　20.3.3CalFlora:维管植物数据库 370

　　20.3.4计算机辅助植物识别系统 370

　　20.4植物图像处理和特征提取 371

　　20.4.1叶子图像处理 371

　　20.4.2花图像处理 375

　　20.5叶子与花的图像检索 377

　　20.5.1叶子图像检索 377

　　20.5.2花图像检索 381

　　20.6结论 384

　　参考文献 384

　　第21章广播视频的快速启动与交互式检索 387

　　21.1引言 387

　　21.2通用广播方案 389

　　21.2.1锥形广播方案 390

　　21.2.2摩天楼广播方案 390

　　21.2.3贪心磁盘节约型广播方案 390

　　21.3预取模式--积极的与适时的 391

　　21.4快进和向前跳读 392

　　21.4.1短程快进广播方案 393

　　21.4.2主动缓冲区管理方案 395

　　21.4.3镜像锥形广播方案 396

　　21.4.4向前跳读 397

　　21.5暂停-重新开始、倒带和向后复位 397

　　21.6结论 398

　　致谢 398

　　参考文献 399

标签：

关注微信

上一篇：第九防线

下一篇：清洁凌乱的教室

相关文章