问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

实现人工智能的“想象力”

发布网友 发布时间:2023-04-02 23:50

我来回答

1个回答

热心网友 时间:2023-05-05 18:38

【51CTO.com快译】 首先请在脑海中想象一只橙色的猫。然后,想象同一只猫,皮毛已经变成了煤黑色。现在,想象这样一只猫在长城上昂首阔步。

在上述一系列想象活动中,你大脑中的一系列神经元会基于你之前对世界的认知,快速呈现出不同的图像。也就是说,作为人类,其实很容易一个具有不同属性的对象。但对于计算机来说,尽管深度神经网络在某些任务上取得了可以与人类表现相匹敌甚至超越的突破,但始终无法与人类的“想象力”相抗衡。

如今,一个来自南加州大学的研究团队开发出了一种新的人工智能,可以利用类人的能力想象出某个前所未有的具有不同属性的物体。这篇以Zero-Shot Synthesis with Group-Supervised Learning为题的论文于今年5月7日发表在ICLR2021(深度学习领域的顶级学术会议)会上。

“我们受到人类视觉泛化能力的启发,尝试在机器上模拟人类的想象力,”该研究的主要作者葛云浩说,“人类可以通过不同的属性(例如形状、姿势、位置、颜色)来分离所学知识,然后将它们重新组合,从而想象出一个新的物体。我们的论文试图用神经网络来模拟这个过程。”

人工智能的泛化

假如,你想创建一个生成 汽车 图像的人工智能系统。理想情况下,你可以为算法提供一些 汽车 图片,从而让它可以从不同角度生成各种型号、外形、颜色的 汽车 ,从保时捷到庞蒂亚克到皮卡,不一而足。

这是人工智能长期追求的目标之一:创建可以进行推理的模型。达成这一目标就意味着,给定几个示例,模型就能够提取基本规则,并将它们应用到大量前所未见的新示例中。但机器通常是根据样本特征进行训练的,比如像素,而不考虑对象的属性。

关于“想象”的科学

在这项新研究中,研究人员试图用一种“退纠缠(disentanglement)”的概念来克服这一*。“退纠缠”可以用于“深度伪造(deepfake)”,葛云浩提到,通过“退纠缠”人的脸部表情和特征进行“换脸”,人们可以合成新的图像和视频,用另一个人替换原主身份,同时保留原来的动作。与之相似,新方法采用一组样本图像——而不是像传统算法那样一次一个样本——并挖掘它们之间的相似性以实现所谓的“可控退纠缠表征学习”。然后通过重新组合这些知识来实现“可控的新图像合成”,或者你可以称之为“想象”。

他以《变形金刚》为例进行了说明:它可以在电影中取材——威震天的形状、大黄蜂的颜色、纽约时代广场的背景。合成结果就是一辆大黄蜂颜色的威震天 汽车 在时代广场上飞驰,即使训练期间并没有出现过这个样本。

这个过程类似于人类的推理:当一个人看到一个物体的颜色时,我们可以轻松地通过用新颜色替换原始色来将其应用于任何其他物体。使用他们的技术,这个团队生成了一个包含 156 万张图像的新数据集,有助于该领域的未来研究。

理解世界

虽然“退纠缠”并不是个新点子,但研究人员表示,他们的框架几乎可以和任何类型的数据或知识兼容,这就扩大了应用机会。比如,通过将敏感属性从等式中完全移除,将种族和性别相关知识分解,从而推进人工智能更加公平。

再比如,在医学领域,它可以帮助医生和生物学家发现更多有用的药物,通过将药物功能与其他特性分开,然后将它们重新组合以合成新药;在自动驾驶领域,允许自动驾驶 汽车 想象并避免在训练过程中从未见过的危险场景,从而推进创建更安全的人工智能。

计算机科学教授洛伦·伊蒂说:“深度学习已经在很多领域展示了无与伦比的性能和前景,但这往往是通过浅层模仿达成,并没有更深入地了解使每个个体独一无二的属性。这种新的‘退纠缠’方法第一次真正释放了人工智能系统的想象力,使它们更接近人类对世界的理解。”

原文链接:Enabling the 'imagination' of artificial intelligence

【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
太平盛世专辑曲目 梦见自家灶台缺个角 如何看待宝马3系? - 知乎 为什么缺爱的女人婚姻难幸福快乐 求一些好看的架空言情小说,最好是以第一人称为视角的。小白文请绕。 带双目相机的无人机有哪些 禄莱1982年后 工业3d相机国内有哪些靠谱的厂商,特别是在阳光和弱光环境 海康全新双目单线相机 | 消盲区、抑杂光,引领3D检测新突破 10米范围内实现零盲区大FoV深度测量,奥比中光发布Gemini 2双目... 芳的拼音组词部首 苹果5s有哪些功能,详细点的,如何使用。 银行静态码一次交易限额2万? 梦见别人家地陷墙塌的预兆 合阳那里有卖甲醇的 现代生态建筑建筑工程介绍? 合阳县城关中学的介绍 耳机参数对比。。迷茫不太清楚!(声音大小) 壁挂炉关闭的正确方法 酒精多久过期 从下面两题中任选一题作文。(1)撇和捺互相支撑就成了“人”,在人生的... 撇捺人生 60升热水器多少斤水 一块太古方糖的尺寸是多少厘米 You get mad是什么意思? he is mad和he get mad区别? get mad=get angry吗? 怎么查询别人是哪年注册的? 不是oppo手机怎么用可币卷 怎么查询一个用了多久? 热的“可乐姜汤”真的可以治疗感冒发烧吗? 领克01与VV7哪个好 中国银行的易汇通是哪一信息技术的应用案例 空调店开业对联 蓝蓝的天空彩色的气球快活的什么 求《快乐节拍123》歌词 朋友生日快乐祝福语(藏头诗,祝汤慧生日快乐)急用谢谢!!! 求藏头诗(彭首志生日快乐) 祝娜娜生日快乐 谁能帮我编首藏头诗 意思要好 描写孩子们春游开心的句子 烦~~真丝领带到底要怎样保养啊? 掊敛的解释 想买ipad,主要用于存照片拍视频,哪款合适?16G的会不会太小?求帮忙... 亲们!帮我推荐一台主要用于视频的平板电脑。像素要好点,价格不要太高... 我想买个平板,想看视频,出门可以照相,内存稍大点,买什么牌子的 长春德惠路附近有宝宝玩的吗 长春长影世纪城有适合8岁孩子玩的项目吗 ...是七天多的好友!!转让出来“对方暂无创建同规模群的资格”求解... QQ群:提示我还有两个群的建群资格一个高级一个普通,为什么我建群的时候... 手机qq钱包里的京东购物网址出错,显示page or site not found