研究方向
  研究课题
  研究设备
  研究成果


  指导教师
  开设课程
  团队成员


  实验室
  研究中心
  合作计划
  相关专委会


  浙江大学
  PCM2006
  TVants电视蚂蚁



海量多媒体内容分析与检索

基本信息 | 基本内容与基本要求 | 教学安排 | 选用教材 | 有关说明

基本信息

英文名称: TB-Level Multimedia Content Analysis, Understanding and Retrieval
学分学时: 40学时
开课学期: 春季学期
开课学院: 计算机学院
课程类型: 硕士生、博士生选修课
先修课程: 掌握基本的机器学习和统计分析理论
主讲教师: 庄越挺教授   吴飞副教授

[TOP]

基本内容与基本要求

   对包括文本、图像、视频、音频所蕴涵内容的进行分析、理解与检索,可以在视频监控、人机交互、搜索引擎构建和数字图书馆等流域得到广泛应用。本课程主要介绍海量文本、图象、视频、音频和图形的分析和处理的理论与技术,具体包括海量数据物理存储机制、文本信息链接分析与摘要生成、视觉特征(包括纹理、颜色、形状、运动、几何)和听觉特征(包括时域和频域)提取、多媒体高维特征索引与降维技术、信息检索相关反馈模型、视频结构化与聚类分析、多媒体内容理解方法(含产生模型隐马尔可夫链Hidden Markov Model、区别模型支持向量机Support Vector Machine以及集成学习模型AdaBoosting)、多媒体融合分析与自动标注。

   在授课过程中,为了理论联系实际,课程中也会结合近几年来国际著名会议上所发表的文章,介绍若干理论在人脸识别、语音识别和文本分类方面的最新进展和实际应用。

[TOP]

教学安排

  • 采用多媒体投影教学。
  • 每周4学时。
  • 安排机器学习、多媒体分析、计算机视觉等顶级会议和期刊论文阅读。

[TOP]

选用教材

  • 庄越挺 潘云鹤  吴飞, 《网上多媒体信息分析与检索》,2002年,7-302-05584-X / TP·3299,清华大学出版社出版
  • ACM Multimedia、Neural Information Processing Systems(NIPS), International Conference of Machine Learning (ICML), SIG IR(Information Retrieval)、VLDB(Very Large Database)等会议上相关论文

[TOP]

有关说明

   为了增加同学们对海量多媒体内容理解与检索理论的深入了解,课程中将讲解部分开放源代码。

[TOP]



教师开设课程

 
Copyright ©2005 浙江大学数字媒体计算与设计实验室 All rights reserved.