印象2021|人工智能风起云涌
现在,人工智能经过几年的开展,再也没有最初的神秘感。回忆2021年,无论是人工智能技能仍是工业有许多值得称道的研讨和落地效果。AI根底理论研讨逐渐深化,多模态、机器学习、天然言语处理、核算机视觉、芯片和根底科学等范畴都有不错的研讨引发火热评论。假如你还把目光停留在语音辨认、图画辨认、智能阅片、病毒测序……那么下面这些前沿的技能和工业研讨信任你会感兴趣。
DeepMind机器学习结构帮忙发现两个数学新猜测
英国《天然》杂志12月1日宣布了由人工智能公司DeepMind开发的一个机器学习结构,该结构现已帮忙发现了纯数学范畴的两个新猜测。这项研讨展现了机器学习能够支撑数学研讨,这也是核算机科学家和数学家初次运用人工智能来帮忙证明或提出纽结理论和表明论等数学范畴的杂乱定理。
纯数学研讨工作的要害方针之一是发现数学方针间的规则,并运用这些联络构成猜测。从20世纪60年代起,数学家开始运用核算机帮忙发现规则和提出猜测,但人工智能体系没有遍及运用于理论数学研讨范畴。
此次,DeepMind团队和数学家一同建立了一个机器学习结构,用于帮忙数学研讨。团队还表明,他们的结构能鼓舞未来数学和人工智能的进一步协作。
索尼发布感存算一体化规划近光学传感器AI-ISP芯片
跟着物联网、零售、才智城市等工业的开展,在相机产品中搭载AI处理才能的需求快速增加。边际端芯片的AI处理才能能够处理只在云核算体系中呈现的问题,如推迟、云端通讯、处理开支,以及隐私问题等。当时商场对边际端智能相机要求包含小型、低功耗、低本钱、易布置等,但现在传统的CMOS图画传感器只能输出原始图画数据。因而,在规划具有AI才能的智能相机时,将图画信号处理器(ISP)、神经网络处理才能、DRAM等结合在一同十分重要。
在2021 IEEE世界固态电路会议(ISSCC)上,索尼发布了其背照式堆叠型CMOS图画传感器芯片,芯片能耗比到达4.97TOPS/W。经过将图画传感器、CNN处理器,以及ISP、DSP、内存等子体系进行堆叠规划,在单芯片上完成完好的AI图画处理才能。
TRFold引领国内核算生物学包围
2021年7月,DeepMind揭露了AlphaFold2的源代码,并在尖端科技杂志Nature上宣布论文论述了AlphaFold2的技能细节。同一天DavidBaker也揭露了RoseTTAFold的算法,并将研讨效果经Science注销。
这次开源在生物学界掀起了巨大的波涛,意味着生物学家有时机脱节先进设备的掣肘,而这些设备往往都十分贵重,只要经费足够的大学或研讨组织才有条件装备。尔后,那些小型团队或许个人研讨者也能参加到蛋白质的研讨中来。
我国人工智能企业天壤自研的深度学习蛋白质折叠猜测渠道TRFold在依据CASP14(2020年第14届世界蛋白质结构猜测比赛)蛋白质测验集的企业内测中,取得82.7/100的效果(TM-Score),现已超越来自华盛顿大学的生物学家DavidBaker团队研发的RoseTTAFold81.3/100的效果,仅次于AlphaFold2的91.1/100的效果。在400个氨基酸的蛋白链猜测时,TRFold仅耗时16秒。这是现在国内一切揭露蛋白质结构猜测模型中取得的最好效果,它标志着我国核算生物学范畴的体现现已处于世界第一队伍。
在新冠肺炎疫情大盛行的布景下,全球生命科学范畴正面对转型,AI+生命科学元年正在敞开。信任在未来几年内,将有很多的组织和公司加入到技能立异与生命科学研讨的热潮中。
DeepMind宣布言语模型社会损害评价论文
2021年12月,DeepMind宣布论文,研讨预练习言语模型带来的道德和社会损害。研讨者首要探求了模型在六大方面的不良影响,并谈到两个道德和社会影响方面需求研讨者继续重视。一是当时的基准测验东西缺乏以评价一些道德和社会损害。例如,当言语模型生成错误信息,人类会信任这种信息为真。评价这种损害需求更多与言语模型进行人机交互。二是关于危险操控的研讨仍然缺乏。例如,言语模型会学习复现和扩大社会成见,可是关于这一问题的研讨仍处于前期阶段。
MIT-IBM 联合试验室依据果蝇大脑构建神经网络学习NLP使命
2021年3月,MIT-IBM 联合试验室的研讨者依据果蝇大脑中的老练神经生物学网络模体(Motif), 将结构进行数学形式化后构建神经网络。该网络能够学习语义表征,生成静态的、依赖于上下文的词嵌入。依据试验,该网络的功能不只能够与现有NLP办法相媲美,内存占用率也更小,需求的练习时刻更短。在上下文单词使命中,果蝇网络的体现比GloVe高出近 3%,比Word2Vec高出6%以上。
OpenAI提出大规划多模态预练习模型DALL·E和CLIP
在大数据、大参数和大算力的支撑下,预练习模型能够充沛学习文本中的表征,把握必定的常识。假如模型能够学习多种模态的数据,在图文生成、看图问答等视觉言语(VisionLanguage)使命上具有更强体现。
2021年1月,OpenAI一起发布了两个大规划多模态预练习模型——DALL·E和CLIP。DALL·E能够依据短文本提示(如一句话或一段文字)生成对应的图画,CLIP则能够依据文本提示对图片进行分类。OpenAI表明,研发多模态大模型的方针是打破天然言语处理和核算机视觉的边界,完成多模态的人工智能体系。
谷歌提出多使命一致模型MUM
2021年5月,谷歌在2021IO大会上揭露了多使命一致模型(MultitaskUnifiedModel,MUM)的开展状况。MUM模型能够了解75种言语,并预练习了很多的网页数据,拿手了解宽和答杂乱的决策问题,并能够从跨言语多模态网页数据中寻觅信息,在客服、问答、营销等互联网场景中具有运用价值。
华为诺亚试验室等研讨者提出动态分辨率网络DRNet
深度卷积神经网络晓畅选用精密的规划,有着很多的可学习参数,在视觉使命上完成很高精确度要求。为了下降将网络布置在移动端本钱较高的问题,近来开掘在预界说架构上的冗余现已取得了巨大的效果,但关于CNN输入图画清晰度的冗余问题还没有被彻底研讨过,即当时输入图画的清晰度都是固定的。
2021年10月,华为诺亚试验室、我国科学院大学等组织研讨者提出一种新式的视觉神经网络DRNet(DynamicResolutionNetwork)。依据每个输入样本,该网络能够动态地决议输入图画的清晰度。该网络中设置了一个清晰度猜测器,其核算本钱简直能够疏忽,能够和整个网络一起进行优化。该猜测器能够对图画学到其需求的最小清晰度,甚至能够完成超越曩昔辨认准确率的功能。试验成果显现,DRNet能够嵌入到任何老练的网络架构中,完成明显的核算杂乱度下降。例如,DR-ResNet-50在完成相同功能体现的前提下能够下降34%的核算,比较ResNet-50在ImageNet上提高1.4个点的功能一起能够下降10%的核算。
澜舟科技等研发中文言语模型“孟子”
2021年7月,澜舟科技-立异工场团队与上海交通大学、北京理工大学等单位联合研发了中文言语模型“孟子”,参数规划仅10亿,在CLUE中文了解评测的总排行榜,以及分类排行榜和阅览了解排行榜均位列第一。其间,总排行榜分数打破84分,迫临人类基准分数(85.61)。
北京大学团队提出模仿灵长类视网膜中心凹编码机理的脉冲视觉模型
深度学习支撑机器视觉在曩昔十年取得了巨大进步,但与生物视觉比较还存在巨大距离,例如对立进犯软弱、核算杂乱度随分辨率线性增加等。近来,北京大学团队提出了模仿灵长类视网膜中心凹编码机理的脉冲视觉模型,推翻了沿袭近两个世纪的相机和视频概念,专利取得中美日韩欧授权,研发了比人类视觉和影视视频快千倍的脉冲视觉芯片和相机,用一般器材完成了高铁会车、瞬态电弧、风洞激波等高速物理进程的接连成像,并结合脉冲神经网络,在笔记本算力条件下完成了超高速方针的实时检测盯梢和辨认,在硬件和算力适当的状况下将机器视觉功能提高了三个数量级。
团队还深化研讨了生物视网膜编码杂乱动态场景的神经网络结构和信号编码机理,提出并完成了一种依据卷积循环神经网络(CRNN)的视网膜编码模型,能够高精度地猜测大规划视网膜神经节细胞对动态天然场景的呼应,可学习出视网膜神经节细胞感触野的形状及方位,模型结构更挨近生物视网膜,能够运用更少的参数学习出精度更高的编码模型。还提出了评价影响时空杂乱度和感触野时空规则性的定量目标,试验成果提醒了网络的循环衔接结构是影响视网膜编码的要害因素,这一模型不只具有生物学价值,并且对规划新一代脉冲视觉模型、芯片甚至研发视网膜假体都具有重要意义,论文已在《细胞·形式》(Cell·Patterns)宣布。
注:部分内容参阅自北京智源人工智能研讨院《智源人工智能前沿陈述》