4月12日,中央电视台《新闻联播》专题报道了毕业于中科大少年班的陈云霁、陈天石兄弟俩,以及他们所开创的人工智能芯片事业——寒武纪,人工智能芯片由此进入公众的视野。
人脑计算速度不如电脑早已人所共知,但在理解能力、创造能力、性能功耗比等方面,人脑又远超电脑。 1956年,约翰·麦肯锡在美国达特茅斯计算机大会上提出“人工智能”一词,此后模拟人脑开发出更强大的人工智能系统,便成为世界科技前沿的一大研究方向。
然而,在近60余年的发展历程中,人工智能发展起起伏伏,多次出现曙光,又多次陷入沉寂。 2016年,随着“阿尔法狗”完胜多位人类棋手,通过建立、模拟人脑神经网络进行分析学习的深度学习技术成为人工智能领域新的曙光,以深度学习为核心技术的人工智能再次在全球炙手可热。
不过,“阿尔法狗”基于通用处理器构建起来的人工智能系统身躯十分庞大,不但使用了约170个图形处理器和1200个中央处理器,还需要海量机房设备、数万瓦的功耗以及高昂的运维成本。
之所以需要如此庞大的身躯,是因为深度学习的基本操作是神经元和突触的处理,而传统的处理器指令集是为了进行通用计算发展起来的,其基本操作为算术操作(加减乘除)和逻辑操作(与或非),往往需要数百条甚至上千条指令才能完成一个神经元的处理,深度学习的处理效率不高。谷歌训练一个识别猫脸的深度学习神经网络甚至需要使用上万个X86 CPU核运行7天。
这样的系统,在我们日常工作、生活中进行推广应用,显然不太现实。因此,开发出一款适合深度学习的深度神经元网络专用处理器,让智能机器的体积大幅缩小,性能不降反升成为一个重要的研究课题。陈云霁、陈天石兄弟领衔的寒武纪团队给出了世界首创的中国解答。
寒武纪开发的DianNaoYu指令直接面对大规模神经元和突触的处理,一条指令即可完成一组神经元的处理,并对神经元和突触数据在芯片上的传输提供了一系列专门的支持。基于DianNaoYu指令集设计的深度学习专用处理器,就是给电脑创造出模仿人类大脑多层大规模人工神经网络的芯片。
2016年世界互联网大会上,“寒武纪1A”正式发布,这是世界上首款模拟人脑神经元和突触的深度神经元网络处理器,性能非常强大,每秒可以处理160亿个神经元和超过2万亿个突触,但功耗只有市场上最先进智核芯片的1/10,能效比主流CPU和GPU有两个数量级的提升,具有较强的市场竞争优势,被大会评为全球15项“世界互联网领先科技成果”之一。
“我们的优势集中在人脸识别、声音识别等人工智能方面。比如,摄像头、手机或个人电脑、高性能服务器嵌入 ‘寒武纪’IP核或芯片后,将极大提高处理速度。 ”陈云霁说。
“普通处理器就好比瑞士军刀,虽然通用,但不专业。厨师如想做出像样的菜肴,就必须使用专业菜刀,而专门的深度学习处理器就是这把更高效、更快捷的‘菜刀’。”陈天石形象地说。用世界上首款模仿人类神经元和突触进行深度学习的处理器,开启人工智能的新纪元,是陈氏兄弟的愿景,因此他们用地球生命演化史上著名的“寒武纪大爆发”来命名他们的这颗人工智能芯片。(吴茂乾)



