本报讯 记者张一迪报道:11月17日,上海人工智能实验室联合商汤科技、香港中文大学、上海交通大学共同发布新一代通用视觉技术体系“书生”(INTERN),旨在系统化解决当下人工智能视觉领域中存在的任务通用、场景泛化和数据效率等一系列瓶颈问题。
“书生”,是一个代表通过不断学习、积累,进而获得各方面才能的形象。可以看出,将该体系命名为“书生”是希望它可以像读书人一样孜孜不倦地学习、不断地积累,最终能够在通用视觉领域达到融会贯通的水平,实现灵活高效的模型部署。
据介绍,“书生”由七大模块组成,包括3个基础设施模块、4个训练阶段模块,由“基础能力”培养开始,逐步向“专家能力”“通用能力”攻关,最终达到具备“迁移能力”的水平。商汤科技研究院院长王晓刚表示:“书生”通用视觉技术体系是基于SenseCore商汤AI大装置的一次新技术路径探索。
商汤一直致力于通用视觉领域的技术探索与应用场景的落地。在今年7月举办的2021世界人工智能大会上,商汤科技联合创始人、首席执行官徐立在演讲时正式介绍了商汤打造的新型人工智能基础设施——SenseCore商汤AI大装置,该装置由算力层、平台层、算法层三部分架构组成。商汤AI大装置旨在通过它对海量数据进行拆解和碰撞,深入挖掘潜在价值,从而打破认知和应用的边界。
从落地应用上来说,商汤希望通过AI底层基础设施,驱动城市中的商圈、园区、街道等各类场景,实现虚拟与现实的智能化连接,推动物理世界的全面数字化转型,用数字化、智能化的手段来解决城市管理中存在的长尾问题。例如,在面对自然灾害、城市警情等时,从发现、报警、执行到结案,都可以用人机交互的方式实现一站式解决。
商汤在做的是,将现实世界产生的问题,导入到虚拟世界中,通过人工智能手段达到快速、高效、全面的解决能力。商汤AI大装置就好比是一座“技术基站”,“书生”是在此基础上,面向通用视觉领域而生的技术分支,将在智慧城市、智慧医疗、自动驾驶等多领域场景中,发挥泛化能力,解决大量小数据、零数据等样本缺失的细分和长尾场景需求问题。