【课程简介】
本课程讲解了各类经典数据集的特点、规模与应用场景。从人工智能“以数据为驱动”的本质出发,强调数据集在模型训练、评估与技术进步中的基础作用。内容涵盖手写数字与汉字识别数据集(如MNIST、HCL2000)、彩色图像数据集(如CIFAR、ImageNet、COCO)、文本与对话数据集(如SQuAD、GLUE)以及其他多领域开放数据集。通过解析不同数据集的标注方式、任务类型与挑战,课程揭示了数据集如何为算法研究提供统一基准,推动计算机视觉、自然语言处理等方向的发展。
【专家简介】
乔媛媛 北京邮电大学
美国麻省理工学院访问学者,教育部强国行专项行动团队负责人。在复杂数据分析领域深耕多年,科研成果已在各省市得到应用,获得省部级科学技术进步奖2项。获得全国高校人工智能教育大会优秀案例特等奖,全国电信类高校教师智慧教学案例一等奖,北京青教赛二等奖、最受学生欢迎奖等。主编《人工智能导论(文科版)》《人工智能导论(通识版)》中英双语数字教材,青少年科普教材《人工智能核心-神经网络》等。