4月15日,《数字技术与软件——文创产业前沿技术》系列讲座在文创学院A7-200举办。本期讲座荣幸邀请到了上海交通大学集成电路学院(信息与电子工程学院)教授、博士生导师倪冰冰作为主讲嘉宾。倪冰冰以“生成式大模型与艺术”为主题,带领同学们回顾了AI发展发展历史的潮起潮落,深入剖析了从图像识别到内容生成的底层逻辑,并对未来“世界模型”的构建及产业现状展开了探讨。
倪冰冰指出,人工智能的发展史是一部与世界经济周期紧密相关的“三起三落”史。倪冰冰通过生动的类比,阐释了智能系统的构成,并深入浅出地介绍了人工智能的三要素:算法、数据与算力。正是在数据爆发式增长的驱动下,依托计算硬件的指数级性能提升和深度学习算法的突破性进展,基于深度神经网络的人工智能系统才实现了从理论到应用的关键性跨越。
在技术原理部分,倪冰冰详细解析了计算机视觉的演进历程。他从早期依赖人工提取特征的局限性讲起,逐步引入了卷积神经网络(CNN)的革命。CNN通过共享权重的卷积核自动提取局部特征,大幅降低了参数量。倪冰冰进一步阐释了生成式模型的核心机制,包括生成对抗网络(GAN)以及核心原理为“去噪”的扩散模型(Diffusion)。他特别强调了Transformer架构的出现是这一进程的转折点,该架构基于注意力机制(Attention Mechanism),无需依赖重复和卷积,摆脱了对人工标注数据的依赖,极大地降低了训练时间并提升了并行化能力。
在探讨AI与艺术的融合时,倪冰冰不仅展示了AI在声音创作、图像生成、视频制作等领域的创新实践,更对当前产业现状进行了深刻的批判性反思。他重点剖析了Sora模型面临的高维空间采样困境及数据训练的局限。当前AI产业虽表面繁荣,实则面临着严峻的“Token经济”挑战。模型训练与推理成本高昂,却难以创造出匹配的商业价值,导致大量“高消耗、低产出”的现象。“Token经济”需要从盲目生产转向高价值生产,从像素生成到时空交互的跃迁,寻找产业真实价值方向。
倪冰冰对人工智能的未来潮流展开了畅想。他提出,未来的终极形态是“世界模型”——不仅仅是生成一段视频,而是构建一个可交互的数字世界,能够理解物理规律、空间逻辑,并允许用户进行深度交互。未来世界或许只有两种人:AI从业人员和创意从业人员。AI无法替代的是人类的审美判断力与创造力。在交流与互动后,现场师生以热烈的掌声为本次系列讲座画上圆满句点。