人工智能是智慧农业新风口
可以预期,以AI为代表的新一代信息技术将深刻影响智慧农业发展,用人工智能赋能农业成为一大命题。农业机械化已经让大田的粮食生产从体力劳动中解放出来。未来,农业信息化会让农民成为更体面的职业。
当最前沿的技术与最古老的产业相遇,会激荡出怎样的变革?日前,国内首款农业AI对话机器人发布,诸如“土豆出现烂根怎么办”“某地西瓜行情怎么样”“帮我找个杨梅采购商”这些问题都将得到回答。可以预期,以AI为代表的新一代信息技术将深刻影响农业发展,抓住人工智能这个智慧农业新风口成为一大命题。
农业AI应用正加速铺开。本世纪初,其在国内已露端倪,既有耕、种、收等智能机器人,也有病虫害探测、土壤墒情测报智能系统。近年来,具有自主知识产权的传感器、无人机、农业机器人等日臻成熟,出现在越来越多的农业场景中。2020年,农业农村部、中央网信办印发《数字农业农村发展规划(2019—2025年)》,提出加快农业人工智能研发应用。自ChatGPT发布以来,认知大模型技术持续进化,国内类似产品不断推出。在此背景下,农业领域大模型产品的推出自然不足为奇。
人工智能的农业应用非常广泛,涉及感知、决策、控制、作业等,农业AI对话机器人只是其一。传统农业的特点是靠天吃饭,而我国的智慧农业发端于物联网设备和与其对应的农业信息化系统,通过监测和改善生长环境,使农业生产更稳定可控。如今,叠加新一代信息技术,农业数据要素将持续发挥作用。比如,借助猪脸识别,结合声学特征和红外线测温,从猪的体温、叫声等可及时判断猪是否患病,从而预警疫情,科学养殖。
智慧农业是用科技武装农业,并牵引资本、人力、土地等多种生产要素。很多国家都把智慧农业作为优先发展方向,全球智慧农业呈现出两大特征。一是高度集成。各种设备与技术高度集成,物联网、大数据、人工智能、云计算等叠加交融,形成了智能生产系统。国土面积只有4万多平方公里的荷兰,就是在设施农业中集成智慧农业,每公顷能产出54.4吨蔬菜,是我国的2.4倍。二是数据融通。不只应用在生产领域,而是打通生产、加工、流通、销售环节,建立大农业数据库,实现产销高效对接。有的国家在此基础上建立农业展望制度,直接影响期货市场走势,拥有了主导世界农产品市场的战略武器。
现阶段,人工智能可以成为农业生产强有力的辅助,但远不足以完全替代人和人的决策。这与其发展程度有关。一方面,有数据,缺智慧。行业数据、社会数据、企业数据难以有效融合,缺少针对农业大数据的深度挖掘和分析利用,预测预警和配置资源等核心功能还远未发挥。另一方面,有示范,缺规模。由于门槛高、价格高,目前应用局限在少数主体上,不少地方存在增量不增效、技术脱离实际等问题。此外,人工智能的核心是数据、算法和算力,但是农业生产对象具有生物特性,比较效益又低,数据采集难、算法要求高、算力资源缺,导致落地难度大。
人工智能赋能农业是好事,但也急不得。大国小农是我国的基本国情、农情。再高大上的技术,农民和农企都面临是否用得上、用得起、用得划算的问题。一方面,他们追求增产、提质、节本,需要导入智能装备;另一方面,又有求稳心态,对短期成本收益敏感,对新技术应用有迟疑。可见,新技术落地不是一蹴而就的,要不断迭代优化,从而突破盈亏平衡点。要从实际出发,积极探索应用场景,打造内容丰富、模式多样、载体多元的解决方案,降低用户成本,务求实效实用。
农业机械化已经让大田的粮食生产从体力劳动中解放出来。未来,农业信息化会让农民成为更体面的职业。推动智慧农业发展,政府应聚焦农业公共基础数字资源建设,通过政策引导数字技术的产业应用。科研院所要把工程科技与农业生产相结合,研发攻关更多接地气的产品。各类资本则要以长期投资的耐心支持经营主体。农民和农企则要抓住新一轮信息技术机遇,提升品质、做强品牌,实现增值。
人工智能——数据挖掘1
1.概述从技术角度,数据挖掘(datamining)是从大量的不完全的、有噪南的(模糊的随机的实际应用数据中提取隐含在其中的、人们事先不知道的,但又是潜化有用的信身和知识的过程。与数据挖掘相近的同义词包括数据融合、数据分析和决策持第。预处理过程这一定义包括好几层含义:数据源必须是真实的、海量的、含噪声的:发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。
从商业角度,数据挖掘是一.种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性信息。
简言之,数据挖掘其实是一类深层次的数据分析方法。因此,数据挖掘可以描述为:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的有效方法。
数据挖掘作为一一门新兴的交叉学科,涉及数据库系统、数据仓库、统计学、机器学习、可视化、信息检索和高性能计算等诸多领域。
此外数据挖掘还与神经网络、模式识别、空间数据分析图像处理、信号处理、概率论、图论和归纳逻辑等领域关系密切。
数据挖掘与统计学有密切关系.近几年.人们逐渐发现数据挖掘中有许多工作是由统计方法来完成的。甚至有些人(尤其是统计学家)认为数据挖掘是统计学的一个分支,当然大多数人(包括绝大多数数据挖掘研究人员)并不这么认为。
但是,统计学和数据挖掘的目标非常相似,而且数据挖掘中的许多算法也源于数理统计,统计学对数据挖掘发展的贡献功不可没。
数据挖掘与传统数据分析方法主要有以下两点区别:
首先,数据挖掘的数据源与以前相比有了显著的改变,包括数据是海量的,数据有噪声,数据可能是非结构化的。
其次,传统的数据分析方法一般都是先给出一个假设,然后通过数据验证,在一定意义上是假设驱动的;与之相反,数据挖掘在一定意义上是发现驱动的,模式都是通过大量的搜索工作从数据中自动提取出来的。即数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值。
在缺乏强有力的数据分析工具而不能分析这些资源的情况下,历史数据库也就变成了“数据坟墓”里面的数据几乎不再被访问。也就是说,极有价值的信息被“淹没”在海量数据堆中,领导者决策时只能凭自己的经验和直觉。因此改进原有的数据分析方法,使之能够智能地处理海量数据,也就演化为数据挖掘。
研究数据挖掘的目的,不再是单纯为了研究,更主要的是为商业决策提供真正有价值的信息进而获得利润。目前所有企业北面临的一个共同问题是,企业数据量非常大.而其中真正有价值的信息却很少,因此需要经过深层分析,从大量的数据中获得有利于商业运作,提高竞争力的信息,就像从矿石中石中淘金一样.数据挖掘也由此而得名。
人工智能——数据挖掘2
2、数据挖掘工具目前,世界上比较有影响的典型数据挖掘系统包括EnterpriseMiner(SAS公司)、IelienMiner(IBM公司)SeMiner(SGl公司2Cnentine(SPSS公司)、warehouseSudicSyhhe公同)SuauQuetResarce公司CvesoayEXPL.RA.KoDiscoveryWorkbench、DBMiner、、Quest等。
数据挖掘工具的选择可以考虑如下几点:
(1)商用数据挖掘系统各不相同。
(2)不同的数据挖掘工具的功能和使用方法不同。
(3)数据集的类型可能完全不同。例如:
数据类型——是关系型的、事务型的、文本的、时间序列的还是空间的?
系统问题——支持一种还是多种操作系统?是否采用C/S架构?是否提供Web接口且允许输人输出XML数据?
数据源是ASCII文件、文本文件还是多个关系型数据源?是否支持ODBC连接(OLEDB、JDBC)?
本节介绍两种典型的数据挖掘工具Amdocs和PredictiveCRM。
1.Amdocs在多年前电信行业已经开始利用数据挖掘技术进行网络出错预测等方面的工作.而近年来随着CRM理念的盛行.数据挖掘技术开始在市场分析和决策支持等方面得到广泛应用。市场上更出现了针对电信行业的包含数据挖掘功能的软件产品。比较典型的有Amdocs和PredictiveCRM。
Amdocs提供了整个电信运营企业的软件支撑平台。在其ClarifyCRM产品组件中,利用数据挖掘技术支持以下应用:客户流失管理(churnmanagement)、终身价值分析(lifetimevalueanalysis)、产品分析(productanalysis)、欺诈甄别(frauddetection)。
Amdocs产品中的数据分析和数据分析应用曾获得3届KDD杯奖。
2.PredictiveCRMSIpInfoware开发的PredictiveCRM软件是一个面向电信行业的CRM平台软件,其中应用了大量的数据挖掘和统计学技术。其数据挖掘部分实际上是把SASInstitute、SPSS和UNICA等公司的数据挖掘产品加以二次开发,以适应电信行业的需要。数据挖掘在P-CRM中的应用包括客户保持、交叉销售、客户流失管理、欺诈甄别等方面。
利用SAS软件技术进行数据挖掘可以有3种方式:
(1)使用SAS软件模块组合进行数据挖掘。
(2)将若干SAS软件模块连接成-个适合需求的综合应用软件。
(3)使用SAS数据挖掘的集成软件工具SAS/EM。
SAS/EM是一个图形化界面、菜单驱动、对用户非常友好且功能强大的数据挖掘集成软件,集成了数据获取工具、数据取样工具、数据筛选工具、数据变量转换工具、数据挖掘数据库、数据挖掘过程、多种形式的回归工具、建立决策树的数据剖分工具、决策树测览工具、人工神经元网络、数据挖掘的评价工具。
目前,虽然已经有了许多成熟的商业数据挖掘工具,但这些工具般都是一个独立的系统,不容易与电信企业现有的业务支撑系统集成。而且由于数据挖掘技术本身的特点,一个通用的数据挖掘系统可能并不适用于电信企业。
切实可行的办法是借鉴成熟的经验,结合自身特点开发专用的数据挖掘系统。
3、现状与未来数据挖掘本质上是一种深层次的数据分析方法。
数据分析本身已有多年的历史,只不过在过去数据收集和分析的一般目的是用于科学研究;另外,由于当时计算能力的限制,很难实现大量数据的复杂分析。
现在,由于各行业业务自动化的实现,商业领域产生了大量的业务数据,这些数据并不是为了分析的目的而收集的,而是在商业运作过程中由于业务需要而自然产生的。
IEEE的会刊KnorwledgeandDataEngineering率先在1993年出版了KDD技术专刊。并行计算、计算机网络和信息工程等其他领域的国际学会、学刊也把数据挖掘和知识发现列为专题和专刊讨论。数据挖掘已经成为国际学术研究的重要热点之一。
此外,在Internet上还有不少KDD电子出版物,其中以半月刊KnorwledgeDiscoveryNuggets最为权威。在网上还有许多自由论坛,如DMEmailClub等。
自1989年KDD术语出现以来,由美国人工智能协会主办的KDD国际研讨会已经召开了10次以上,规模由原来的专题讨论会发展到国际学术大会。而亚太地区也从1997年开始举行PAKDD年会。
与国外相比,国内对数据挖掘的研究起步稍晚但发展势头强劲。1993年,国家自然科学基金首次资助复日大学在该领域的研究项目。目前,国内的许多科研单位和高等院校竞相开展数据挖掘的基础理论及其应用研究。
近年来.数据挖掘的研究重点逐渐从发现方法转向系统应用,注重多种发现策略和技术的集成以及多学科之间的相互渗透。