海量多媒体内容分析与检索
基本信息 | 基本内容与基本要求 | 教学安排 | 选用教材 | 有关说明
基本信息
英文名称: TB-Level Multimedia Content Analysis, Understanding and Retrieval
学分学时: 40学时
开课学期: 春季学期
开课学院: 计算机学院
课程类型: 硕士生、博士生选修课
先修课程: 掌握基本的机器学习和统计分析理论
主讲教师: 庄越挺教授 吴飞副教授
[TOP]
基本内容与基本要求
对包括文本、图像、视频、音频所蕴涵内容的进行分析、理解与检索,可以在视频监控、人机交互、搜索引擎构建和数字图书馆等流域得到广泛应用。本课程主要介绍海量文本、图象、视频、音频和图形的分析和处理的理论与技术,具体包括海量数据物理存储机制、文本信息链接分析与摘要生成、视觉特征(包括纹理、颜色、形状、运动、几何)和听觉特征(包括时域和频域)提取、多媒体高维特征索引与降维技术、信息检索相关反馈模型、视频结构化与聚类分析、多媒体内容理解方法(含产生模型隐马尔可夫链Hidden Markov Model、区别模型支持向量机Support Vector Machine以及集成学习模型AdaBoosting)、多媒体融合分析与自动标注。
在授课过程中,为了理论联系实际,课程中也会结合近几年来国际著名会议上所发表的文章,介绍若干理论在人脸识别、语音识别和文本分类方面的最新进展和实际应用。
[TOP]
教学安排
- 采用多媒体投影教学。
- 每周4学时。
- 安排机器学习、多媒体分析、计算机视觉等顶级会议和期刊论文阅读。
[TOP]
选用教材
- 庄越挺 潘云鹤 吴飞, 《网上多媒体信息分析与检索》,2002年,7-302-05584-X / TP·3299,清华大学出版社出版
- ACM Multimedia、Neural Information Processing Systems(NIPS), International Conference of Machine Learning (ICML), SIG IR(Information Retrieval)、VLDB(Very Large Database)等会议上相关论文
[TOP]
有关说明
为了增加同学们对海量多媒体内容理解与检索理论的深入了解,课程中将讲解部分开放源代码。
[TOP]
|