云知声怎么样?它家业务主要涉及哪些领域?
发布网友
发布时间:2022-04-25 20:04
我来回答
共2个回答
热心网友
时间:2022-06-17 00:39
云知声在AI人工智能领域的实力和口碑都非常不错。作为一家物联网人工智能服务企业,云知声以算法、算力和大数据为“三驾马车”,基于AI大脑,可按照客户需求快速搭建“硬件+软件+平台+服务”全栈式智能物联解决方案,涉及领域主要包括智能家居、智慧酒店、智慧社区、智慧园区、智慧交通、智慧文旅,并且还在智慧医疗领域不断深耕与探索,皆取得了不俗的成绩。
热心网友
时间:2022-06-17 00:39
这家当前在国内语音交互领域处于第一梯队的AI企业,诞生于2012年6月。那时候,AI创业在行业中尚属稀缺,深度学习也尚未完全成熟,就连Alpha Go大战李世石也发生在四年之后。
▲云知声技术与应用迭代图
但是在那时候,云知声就已经一头扎入了AI交互方案的研发,并在2012年底,就完成了包括语音云、深度学习及超算平台的三驾马车构建,率先将深度学习应用到语音识别产业服务中,通过深厚扎实的技术研发奠定了在行业中的广泛影响力。
接着在2014年初,云知声又提出了“专注物联网人工智能服务”的定位,以及面向物联网的“云端芯”概念和产品体系构想,并在此后数年中,不断打磨智能交互技术能力和应用服务体系,进一步完成了包括远场、降噪、唤醒、语用计算、流式交互等物联网智能交互功能完善和量产应用,并拓展口语评测、车载后装市场、医疗等多个领域的行业应用。
值得一提的是,云知声作为算法和软件起家的公司,2014年就意识到智能交互与物联网结合是大势所趋,并提出了“云端芯”的产品体系构想。经历四年的研发,才正式于2018年5月推出了首款面向物联网的AI芯片UniOne雨燕(Swift),宣告了“云端芯”闭环的完成,也开启了“云+芯”的商业扩张与应用落地的加速阶段。
而所谓“云端芯”一体化方案,是云知声为智能物联网产业,提供从“智能交互”到“应用服务”的全套基础架构:
1、云——云知声的Athena智慧大脑,为行业应用提供认知计算、领域定制、个性化的内容服务平台,以及基于用户行为数据的快速学习迭代能力
2、端——物联网智能交互和应用,针对领域应用进行快速定制
3、芯——为AI交互与应用,提供高性能、低成本的边缘计算能力
其中“雨燕”芯片,是云知声通用ARM芯片模组完成智能家居语音交互产品验证情况下,推出的高性能、低成本、一体化芯片解决方案。“雨燕”架构内置的uDSP单元,可支持多麦克降噪和声源定位;DeepNet单元则是云知声完全自主研发的深度神经网络处理器(NPU),实现语音识别、理解、合成所需的深度学习计算加速。这两个核心单元,浓缩了云知声在语音交互能力上的多年积累与经验,为市场提供了极具竞争力的方案。
▲云知声雨燕芯片
此外,云知声在“雨燕”集成语音交互核心技术能力基础上,为用户提供可定制的交互源码、工具以及云端AI服务能力,将人机交互部分代码对用户开源,用户可以根据不同的产品形态需求,定制相应的交互模式。
正是基于这种灵活开源的架构设计,雨燕在高效和可靠支撑当前的语音交互和定制化能力的同时,保持对算法演进的灵活性,进一步可以完成快速的产品迭代以及定制化开发能力。
截至当前,云知声已经确立起了包括语音、语义以及图像为代表的AI技术体系、以雨燕为代表的AI边缘计算芯片以及Atlas为代表的超算平台三大技术体系,形成了“云端芯”一体化的产品架构,并实现在智能家居、车载、医疗、教育四大应用领域的规模化验证。
梁家恩将云知声的这种技术与产品的构想和实现能力,归纳为云知声的AI哲学,并用“全栈”和“硬核”两个关键词进行概括:
全栈——既包括从感知、表达到认知的完整AI技术图谱,也包括贯穿技术、产品与产业闭环的全栈AI产业能力,可以把技术创新和整个产业应用需求价值的闭环打通。
硬核——是从底层感知、认知和表达技术,到AI芯片和超算平台的硬核技术实力,解决AI技术产业化应用中的难题。
在他看来,云知声从语音交互技术起家,能够在不到七年的时间内,拓展出包括语用计算、图像识别、机器翻译等全栈技术体系,并在四大领域拓展产业应用,在很大程度上受益于其高效的技术研发体系和平台——基于Atlas超算平台的三层“金字塔型”研发体系构建:
▲云知声的AI技术图谱
首先是位于金字塔最底层的异构超算和存储集群DeepFlow——它具备上千块GPU计算资源,超过一亿亿次每秒的浮点计算能力,以及PB量级的分布式存储,可以为上层的超算平台以及应用提供高密度的计算以及存储能力。
其次是位于中间层的大规模机器学习超算平台Atlas——能高效调度DeepFlow提供的分布式并行计算和存储能力,实现大规模数据的机器学习试验和优化,这是上层AI技术应用优化的共性基础。
最后是位于最顶层的云知声AI应用技术体系,包括:DSP(信号处理)、ASR(语音识别)、TTS(语音合成)、FID(人脸识别)、OD(物体检测)、NLU(自然语言理解)、DM(对话管理)、NLG(自然语言生成)、NMT(神经网络机器翻译)、AVS(音像合成)等多种算法,其快速拓展和迭代优化,都是基于Atlas平台。
梁家恩将Atlas平台称为云知声AI技术拓展和演进的“高铁”,基于Atlas超算平台和AI技术功底,云知声在图像和机器翻译等技术延伸方面得心应手,用不到一年的时间,就实现从零到一到技术延展,并在国际评测集上取得领先的成绩,包括WMT2018世界机器翻译评测第三名,人脸识别标准评测数据库LFW和MegaFace上,分别取得了99.80%和99.47%的成绩,而且参与每个方向评测的只有2~3人,效率非常高。
得益于这种高效、灵活的金字塔结构的技术研发体系和平台,云知声才能在2018年400人规模下,实现了从语音技术向信号、图像、翻译、知识图谱、智能芯片等全栈技术的快速拓展,以及“云端芯”产品体系在多个行业应用中的规模化商业应用。
不过,梁家恩最后也表示,为支撑产业技术挑战,云知声还联合包括自动化所、西北工业大学、杜克大学等院校进行联合研发,并携手中国中医科学院、上师大等高校,推动在医疗、教育等行业的应用研究,也是云知声在技术和人才储备方面的一大灵活体现。
二、AI商业化的杀手锏:用产品化思维解决行业问题
历数云知声的四位创始人:董事长兼CTO梁家恩与副总裁康恒都取得了中科院自动化所的博士学位,CEO黄伟与副总裁李霄寒则是毕业于中科大的博士,同时,在Moto、盛大等企业有多年产业界实战经验。
创始人全数知名高校与研究院所的博士出身,公司78%都是研发人员,这是云知声在技术研发方面一个巨大的优势,但是在梁家恩看来,AI技术能力对AI产业化而言只是个基础。技术领域从0到1很难,从1到10也充满挑战,但对整个产业而言,还需要跨越从10到100以上的挑战——即产品化、商业化和模式创新,才算真正带来产业的变革。
过去两次AI浪潮,基本上都是学术AI的“自嗨”,第三次AI浪潮,技术基础、产业基础和需求都日渐成熟,产业力量成为引领行业变革的主力,而云知声相信,产业机遇就在问题背后。
因此,相比很多同行企业,云知声更早的将AI技术产品化,并与行业应用结合。从2014年云知声提出“专注物联网人工智能服务”的定位以来,不断将AI技术与物联网应用结合,以“云端芯”一体化解决方案,积极拓展智能家居、汽车、医疗、教育等产业应用,5年过去,云知声在这些产业应用方向均取得了丰硕的成果。
首先,智能家居领域,成为云知声“云端芯”一体化方案构想落地的首选场景。物联网和智能家居,对行业而言并非新概念,在上世纪90年代就提出的构想,但一直没有实现,云知声认为主要问题在于“人机交互”和“应用服务”的核心问题没有得到有效解决。
云知声的“云端芯”一体化解决方案,将云端智能服务、智能技术算法、硬件模组/芯片、终端交互逻辑合为一体,让专业度很高的智能交互与应用方案,能根据客户需求和应用场景,进行快速定制和优化,极大提升了规模化落地的效率。梁家恩打了一个形象的比方,这就像从为合作伙伴提供水泥与铲子,变成了直接为他们铺路,而合作伙伴只需要根据自己的意愿来对路面进行简单的布置以及刷漆。
而在当前,云知声在这一领域的合作伙伴已经覆盖了格力、海尔、美的、奥克斯、长虹、京东、华帝、海信等几乎所有主流家电企业。在战略融资阶段,云知声还获得了来自高通、京东、360、美的等一众产业资本的联合投资,并在业务方面完成了相应的产业布局。
其次,云知声从2015年起,还积极拓展在智能车载后装市场应用,同样以“云端芯”产品体系,为客户提供包括智能后视镜、智能车机等智能语音交互整体解决方案,主要挑战是车载噪声、导航和娱乐媒体等优化。