基于人工智能,现代数据基础架构的新兴架构
作者MattBornstein、JenniferLi和MartinCasado
摘要现代机器学习基础设施2.0新架构:http://bit.ly/3AVBpV6这个图概括了机器学习基础设施2.0的主要组成部分。它涵盖了从数据转换到模型集成的全过程。每个阶段的具体工具和技术也在括号中列出。
结构解读以下是对这个图的大致解读:
1、数据转换:这是机器学习的第一步,涉及对原始数据的预处理和标注。这个阶段使用的工具包括Snorkel和Sagemaker等。
2、模型训练和开发:这个阶段涉及到模型诊断和扩展。使用的工具包括Nucleus和Aquarium。
3、模型推理:这个阶段涉及到模型的实际应用。它可能会使用各种预训练模型库,如HuggingFace和ModelZoo,以及一些机器学习框架,如Scikit-learn、XGBoost和MLlib等。
4、集成:这个阶段包括将模型集成到实际应用中,可能需要使用各种应用框架,如Flask、Streamlit和Rasa等。
基础设施组件此外,这个图还提到了一些其他关键的机器学习基础设施组件,包括:
•数据源:原始数据的来源。
•工作流管理器:用于协调和管理机器学习工作流的工具,如Airflow、Prefect、Pachyderm等。
•查询引擎:用于查询和处理数据的工具,如Presto和Hive等。
•特征存储和服务器:用于存储和管理机器学习模型所需特征的工具,如Tecton、Feast和Databricks等。
•低代码机器学习:一些提供简单用户界面的工具,使非专业人员也能进行机器学习,如AutoML、H2O等。
最后,图中还提到了一些与监控、审计、实验跟踪和分布式处理等相关的工具。这些都是机器学习基础设施的重要组成部分。
原文:现代数据基础架构的新兴架构|安德森·霍洛维茨
蝉鸣趋势:人工智能技术图谱、一张图看清巨量千川营销、母婴人群都有哪些需求
05—中国出品的APP依然在美国大杀四方
前五位占其四,不是吹的。
06—国内旅游市场复苏了么?
按照【东方财富】的《海外休闲、生活及专业服务行业专题研究:在线旅游疫后复苏,新生活力撬动竞争格局》这份报告中的景气指标来看,今年的旅游市场是真的复苏了。
从实际产生的收入来看,确实远超疫情三年;但全年下来是否能达到2019年的水平,还有待观察。胜负手在于国庆黄金周。
07—AIGC,下一个万亿大市场
【华鑫证券】发布的《传媒行业深度报告:2023中期策略:传媒如何走向智媒?》报告中预测,7年后,AIGC市场将达到万亿规模。我们拭目以待。
08—AI与办公场景结合,会带来什么改变?
【浙商证券】发布的《AI+行业应用研究报告:AI+办公》报告,详细梳理了AI可以如何赋能办公场景:
09—中东地区的数字支付发展到了什么程度?
我们习以为常的支付宝和微信支付,在全球不同地区发展差异极大。根据【Checkout.com】发布的《2022年中东地区数字化转型》,中东地区直到去年,数字支付的比例依然偏低。
好了,以上就是今天的热点趋势。
大势当前,没有人是局外人。返回搜狐,查看更多