总机电话:010-64522026   编辑部:010-62178764   邮发代码:82-418   刊号:ISSN1671-4350   定价:16.00

[新技能]人工智能与项目式学习:探秘图像分类,实现动物足迹识别——实践取向的大单元教学设计解析

文_祁荣宾 刘啸宇 王怡婷/上海人工智能实验室

2024-02/总第335期

阅读数2

选题背景

国家对人工智能教育高度重视,将其作为义务教育和普通高中课程标准的重要内容。《普通高中信息技术课程标准(2017年版2022年修订)》在必修模块和选择性必修模块均设计了人工智能的课程内容。随着新一代人工智能技术的迅猛发展,中小学人工智能教育,尤其是高中阶段,不应仅局限于培养人工智能工具的使用者和体验者,更应适度引导学生深入理解这些新技术背后的原理,从而培养他们运用人工智能的思维方式实践和创新。

本文以动物足迹识别为主题,开展了实践取向的大单元教学设计。野生动物,尤其是那些被列入保护动物名录的,由于数量稀少,其行踪往往难以追踪,足迹识别技术提供了一种非侵入性方法监测珍贵的野生动物。


课程设计

课程目标

针对足迹识别问题,能选用合适的方式,收集和整理数据;理解图像边缘特征和图像方向梯度直方图特征(HOG特征);掌握K最近邻算法。通过亲历监督学习实现图像分类的完整过程,理解数据和特征对模型性能的重要性,提升应用人工智能思维解决问题的能力。

课程内容

通过创设真实情境,引导学生分析问题,设计解决方案。围绕监督学习解决问题的技术路线为:采集动物足迹数据—提取图像特征—训练模型—测试模型—评价模型—迭代优化,最终实现动物足迹的识别和迁移应用。本单元围绕监督学习有三大核心概念:数据、特征、模型。将三大核心概念从前到后顺次连接,体现了采用监督学习解决问题的过程。模型评价后,如性能不满意,则反向连接至数据端,体现了监督学习迭代优化的过程。

课时安排

本单元共计6课时,内容环环相扣,层层递进。课时安排见表1。

56b-1.jpg

教学准备

在本单元的教学中,采用了上海人工智能实验室浦育平台提供的动物足迹数据集、AI体验工具、Python运行环境和算力资源。


实施过程

体验足迹分类

在实践任务3中,将通过体验足迹分类归纳机器学习的一般过程。首先,教师利用浦育平台的AI体验工具演示老虎和鹿的足迹识别过程。从浦育平台获取该足迹数据集,并分别上传多张图像样本,标记上对应老虎和鹿的类别标签,进行图像分类模型的训练和测试。在自主体验环节,学生可选择任一足迹图像进行测试。实验结果显示,该模型能够准确识别出老虎的脚印,且其分类置信度,即分类为老虎类别的可信程度非常高。尽管这个过程没有明确展示足迹特征和模型的具体表达方式,但教师可引导学生提出这些关键信息和步骤,并在后续的任务中逐步学习和实践。

足迹特征的提取

图像数据在人类眼中通常具有具象性和语义概念。看到一张图片,我们能直接识别出其中的内容。然而,对于计算机来说,图像通常被表示为0—255之间的数字组成的三维矩阵。要理解图像中包含的信息,需要借助机器学习等方法提取其中的语义信息。特征提取就是这样一个过程,它通过压缩图像的冗余信息并提取关键特征,从而形成有意义的语义信息。

在实践任务6中,教师将引导学生观察一张笑脸的像素画图像(图1)。通过对照图像与其底层数据表达,学生能发现图像的关键信息主要集中在笑脸轮廓边缘。为了进一步探究这个问题,可鼓励学生尝试用数学方法寻找图像的边缘。 接下来,学生借助网络资源自主学习提取图像边缘特征的方法。最后,学生在实验平台上使用边缘卷积核,通过程序自动提取图像边缘特征(图2、图3)。在这个过程中,学生有机会观察和感知提取的边缘特征维度与原始数据大小之间的关系。

202402xjn1-3.jpg

图1 笑脸像素画与其数字化表达

在理解卷积运算原理的基础上,教师将在实践任务7中引导学生探索进一步压缩信息的方向梯度直方图方法。首先,学生在实验平台上直接采用方向梯度直方图方法提取特征,并探究不同的检测单元大小对图像HOG特征提取的影响。接着,学生观察和分析特征维度随参数变化的情况,从而更深入地理解这一过程。

202402xjn1-2.jpg

图2 老虎足迹原图(a)、提取的边缘特征图(b)、HOG特征图(从c到e检测单元大小依次为8、16、32)

202402xjn1-2a.jpg

图3 鹿足迹原图(a)、提取的边缘特征图(b)、HOG特征图(从c到e检测单元大小依次为8、16、32)

实现动物足迹分类

在理解K最近邻算法原理后,在任务9中,运用该算法实现动物足迹分类。先将数据集按一定比例拆分为训练集和测试集,确定检测单元大小,分别提取训练集和测试集的HOG特征,训练KNN模型,确定K值,最后进行模型测试,并记录结果。如果分类准确率不理想,可引导学生从数据集规模、数据质量、数据分布、特征数据维度、检测单元大小等多方面分析并优化模型。在任务12的迁移应用中,提供了Python代码模板,可实现行人识别、手写数字识别等多种任务(图4)。

202402xjn1-8.jpg

图4 代码与课程分享(左:足迹识别课程;中:行人识别代码;右:手写数字识别代码)


学习成果

本课程在江苏省常州市的部分高中进行了教学,并多次迭代优化。学生在学习和实践过程中感受如下:如果背景太杂,不利于HOG特征提取和识别;本单元的方法适合区分轮廓边缘特征比较明显的事物;K最近邻算法对高维特征的分类准确率不高。

在迁移应用中,有学生收集了更多的真实足迹图、手绘足迹图、野生动物图像等进行分类。在选择分类方法时,除了K最近邻算法,还选择了决策树、支持向量机、感知器等方法进行测试比较。


反思与提高

本单元的教学设计展现出了机器学习中监督学习的每一个关键过程,使得学生能理解其工作原理及作出决策的依据,能更好地信任监督学习的结果。教学设计中选用的边缘特征和方向梯度直方图,以及K最近邻算法,因为要兼顾学生认知阶段需要更好的可解释性和可具象性的内容,在模型性能测试上不太理想,后续可设计用深度神经网络提取特征,或直接采用深度神经网络进行端到端的训练学习。本单元涉及较多的人工智能学科术语,以及Python环境下的探究实践,需要一些编程和人工智能的通识了解等前置知识作铺垫。


以下平台可使用同一账号密码登录,点击开始同步密码

确认