问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

AI系统架构之算法平台设计

发布网友 发布时间:2022-11-17 02:53

我来回答

1个回答

热心网友 时间:2024-09-20 18:47

明确需求之后,算法平台的设计就比较明确了,业界可以参考的例子包括*的fblearner和Uber的Michelangelo(如下图)。

可以看到,算法平台包含几个环节:

* 数据准备

主要是如何准备数据,并且管理数据在离线、近线和在线模式之间的分布。

* 模型训练和评估

主要是使用各种基础平台(Spark/Tensorflow/Xgboost等)训练模型,从数据中获取可以应用的模型和规则。

训练出来的模型,需要进行验证和评估,评估包括在训练集、测试集和时间外验证集上的表现,检查模型的性能表现(KS、AUC等)、拟合程度和时间衰减。

* 模型服务与业务整合

在离线选择好模型之后,就可以把它放到线上做实际的应用了,在真实系统中验证假设是否成立。

落地路径:线上系统-》到训练平台

在充满遗留系统的老企业或者人力不足的新企业,往往需要从线上系统开始。对于训练过程,经常看到成立几年的数据团队,还在使用单机电脑训练模型,在数据量不大的场景,半人肉的训练短期是可以接受的,考虑到单机版的sklearn、keras这么流行,也可以理解这一点。

从收益角度来看,AI系统的最大价值体现在与业务结合的部分,例如促进增长、降低成本等,其次才是对人效的提升,例如自动运营、自动训练。看清楚这一点,也就认同了从线上到线下的落地路径。

线上系统设计

线上系统包含两个部分,一部分负责模型打分,也就是inference,另外一部分是策略,以及与业务系统对接。

inference部分面临的问题,是如何支持各种不同的建模工具,例如sas、python、spark等等,如果对性能并发要求不高,就可以使用pmml的对应语言实现,快速上线获取短期胜利。

策略部分,一般可以映射成规则,使用drools这样的规则引擎实现,可以解决最初一段时间的绝大部分需求。

热心网友 时间:2024-09-20 18:47

明确需求之后,算法平台的设计就比较明确了,业界可以参考的例子包括*的fblearner和Uber的Michelangelo(如下图)。

可以看到,算法平台包含几个环节:

* 数据准备

主要是如何准备数据,并且管理数据在离线、近线和在线模式之间的分布。

* 模型训练和评估

主要是使用各种基础平台(Spark/Tensorflow/Xgboost等)训练模型,从数据中获取可以应用的模型和规则。

训练出来的模型,需要进行验证和评估,评估包括在训练集、测试集和时间外验证集上的表现,检查模型的性能表现(KS、AUC等)、拟合程度和时间衰减。

* 模型服务与业务整合

在离线选择好模型之后,就可以把它放到线上做实际的应用了,在真实系统中验证假设是否成立。

落地路径:线上系统-》到训练平台

在充满遗留系统的老企业或者人力不足的新企业,往往需要从线上系统开始。对于训练过程,经常看到成立几年的数据团队,还在使用单机电脑训练模型,在数据量不大的场景,半人肉的训练短期是可以接受的,考虑到单机版的sklearn、keras这么流行,也可以理解这一点。

从收益角度来看,AI系统的最大价值体现在与业务结合的部分,例如促进增长、降低成本等,其次才是对人效的提升,例如自动运营、自动训练。看清楚这一点,也就认同了从线上到线下的落地路径。

线上系统设计

线上系统包含两个部分,一部分负责模型打分,也就是inference,另外一部分是策略,以及与业务系统对接。

inference部分面临的问题,是如何支持各种不同的建模工具,例如sas、python、spark等等,如果对性能并发要求不高,就可以使用pmml的对应语言实现,快速上线获取短期胜利。

策略部分,一般可以映射成规则,使用drools这样的规则引擎实现,可以解决最初一段时间的绝大部分需求。

热心网友 时间:2024-09-20 18:48

明确需求之后,算法平台的设计就比较明确了,业界可以参考的例子包括*的fblearner和Uber的Michelangelo(如下图)。

可以看到,算法平台包含几个环节:

* 数据准备

主要是如何准备数据,并且管理数据在离线、近线和在线模式之间的分布。

* 模型训练和评估

主要是使用各种基础平台(Spark/Tensorflow/Xgboost等)训练模型,从数据中获取可以应用的模型和规则。

训练出来的模型,需要进行验证和评估,评估包括在训练集、测试集和时间外验证集上的表现,检查模型的性能表现(KS、AUC等)、拟合程度和时间衰减。

* 模型服务与业务整合

在离线选择好模型之后,就可以把它放到线上做实际的应用了,在真实系统中验证假设是否成立。

落地路径:线上系统-》到训练平台

在充满遗留系统的老企业或者人力不足的新企业,往往需要从线上系统开始。对于训练过程,经常看到成立几年的数据团队,还在使用单机电脑训练模型,在数据量不大的场景,半人肉的训练短期是可以接受的,考虑到单机版的sklearn、keras这么流行,也可以理解这一点。

从收益角度来看,AI系统的最大价值体现在与业务结合的部分,例如促进增长、降低成本等,其次才是对人效的提升,例如自动运营、自动训练。看清楚这一点,也就认同了从线上到线下的落地路径。

线上系统设计

线上系统包含两个部分,一部分负责模型打分,也就是inference,另外一部分是策略,以及与业务系统对接。

inference部分面临的问题,是如何支持各种不同的建模工具,例如sas、python、spark等等,如果对性能并发要求不高,就可以使用pmml的对应语言实现,快速上线获取短期胜利。

策略部分,一般可以映射成规则,使用drools这样的规则引擎实现,可以解决最初一段时间的绝大部分需求。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
ups快递客服电话24小时 贷款记录在征信保留几年? 安徽徽商城有限公司公司简介 安徽省徽商集团新能源股份有限公司基本情况 安徽省徽商集团有限公司经营理念 2019哈尔滨煤气费怎么有税? 快手删除的作品如何恢复 体育理念体育理念 有关体育的格言和理念 什么是体育理念 补办身份证需要带什么证件去 学生午睡多久最好 二十六个字母画法 手机上显示无效得IMEI 是怎么回事 抖音客服能帮忙找到自己在直播间的连麦记录嘛 说一说,钱程策略如何?可信吗 《重庆森林》影评 朋友老梦到我我去河边旅游什么意思 怎么才能让一个人不喝酒 中国人改了国籍还能改回来吗 中国人改国籍了还能改回来吗 电脑双根8g有什么区别? 爱而不得,不曾相忘(短篇小说完整版) 爱情得到却不能在一起叫什么? 有没有男主爱而不得的小说 ...银行声誉风险的因素?对于声誉风险的管理,应该包括哪些方面 企业微信里的健康安全助手怎么下载 she和her的用法与区别? 瓷盆养金鱼能出青苔吗 代理模式的简介 分期还款和最低还款哪个划算 长安之星2四年以后应怎样保养 360n4s骁龙版为什么插上联通大王卡是2g,大王卡是GSM还是TDLTE?_百度知... 360n4s在同环境下为何只有2g,别的手机则是4g 中信银行(芜湖)那个支行周日上班 如何解除微信的头像 大清,光绪,民国双旗十文一枚值多少? 微信发语音对方播放失败怎么回事? vivoz3i设置不了软件一天可玩时间? ps怎么合并指定的图层 张家口市宣化区邮编多少 河北省张家口市宣化区邮政编码 河北省张家口市宣化区车牌号开头字母是什么? 信用卡还了最低还款利息怎么算 什么是网络分支机构? 东财试题 分支机构网络文化许可证怎么办? 一个是饭店经理,用英语怎么说 梦见爸爸的坟 交通银行股份有限公司深圳宝安支行怎么样? 宝安西乡固戍附近交通银行营业厅