RemoteRobot

 找回密码
 立即注册
查看: 221|回复: 0

人工智能的系统集成方向思考

[复制链接]

26

主题

5

回帖

182

积分

管理员

积分
182
发表于 2023-1-26 11:03:44 | 显示全部楼层 |阅读模式
人工智能这个,大学本科时候就开了一个底层基础的课-神经网络,可惜没学好,愧对北交大的丁丁老师。当时听的懵懵懂懂,学的也是稀里糊涂,一直没开窍;没想到十年以后神经网络大爆发,而且火的一沓糊涂,一个卷积就玩的飞起。

        根据个人接触到的各种讲座、工作性质接触到的电信业、银行业、互联网广告业三个行业提出的人工智能要求和工程实现,个人认为方向有:
1、初级智能化,模型化。
2、平台化。
3、开发工具更加强大。
4、模块化。
5、感官智能到意识智能的提升。
6、人类的专业技能的模块化、人生观、世界观方面的知识的模块化。



1、初级智能化,模型化:
能够有一定的存储判断逻辑,非现在的简单判断。简单的算法无法解决复杂的自然界问题。模型化:这里的模型的概念,借助了银行业AI平台中的模型的概念,用多个算法,多种处理逻辑的联合,包装处理成一个结果,用来实现Service服务,即 AI as a Service 的实现方式,实现智能程度的提升。
2、平台化:
主要方向目前来看,有偏重深度遍历算力的,如下棋;也有关联算力的,如图像识别分析类,各种卷积切割;也有spark为主导的偏向于大规模集群计算的,如广告业的所谓智能推荐,各种关联模型,TGI的使用为代表。目前来看,没有一个工具能够完全适配这些算法与思想,一个恰当的划分几大功能的平台,将会助力行业快速发展。现在比较主流的TensorFlow框架,百度、华为、Facebook都推出自家专有的框架,这些在体验深度上来说,是合格的,优秀的;但是在一个纷杂的企业实体面前,在各种奇思妙想面前,无法面面俱到。同时企业级应用也是有很大空白,如多任务、多人资源的分配使用,成品的借鉴等,都是刚刚发展,最直观的:tensorboard的日志查看,一个人还好,多个人,基本就没法用了。可以预见的是,在各个大企业推出自家的综合平台后,将是一番拼杀,大浪淘沙,经过市场检验,能够生机勃勃的才有未来。
3、开发工具更加强大:
专业深度更深入(需要更多的paper,更多的思想观点来支撑),使用门槛降低。比如图像方面的卷积,目前原理是大量的图片素材训练,类似于人类的活久见,将来是否有一个标准的、精简到只有几兆甚至几K特征数据就能完成呢?个人持乐观态度。目前是从现象提取到共性的方式,通过大批量的匹配来判定实际场景。在不久的将来从定义延伸到实际场景也是可能实现的,如记录了一只猫的3D数据,就可以判断输入图片是否是猫。
4、模块化:
比如图像识别、图像分析、NLP、逻辑分析处理,功能都是属于比较基础的阶段,而且功能分散,每个企业都可能做的是重复的劳动,从社会角度来说,浪费巨大,将来以软件包、资源包的形式提供插件,类似于现在的函数包之类,个人认为是趋势。没必要每个人都为汽车造一次轮子,前提是轮子有了通行可靠的标准,现在可能造三角的轮子、正方形的轮子、椭圆的轮子,甚至自行车手推车的轮子都是可能的,在未来的模块化实现专属的每类应用的通行标准后,复杂度将大大降低。
5、感官智能到意识智能的提升:
如果用人类已有的智能和功能来看,可分为感官与意识的处理,图像的识别、文字的识别,更多的是感官方面,我们缺乏的是意识方面的集成处理集合。比如工业机器人,目前完成的是某个关键流程的部分,其他部分需要靠人工来监督。
6、人类的专业技能的模块化、人生观、世界观方面的知识的模块化:
智能,本身还是需要一个真正的、比较系统的逻辑系统。以人自身来看,个人的知识存储是千差万别的,但是都有一套行为方式,都是靠大脑的思维处理来做事,不管是智商70还是170.我们暂时称之为  逻辑系统。这个逻辑系统又需要有社会学、人文科学、技术逻辑之类的基础。我们的眼睛可以看到,皮肤可以感知,四肢都有简单的神经反射,对一个事情的理解和分析,有自己的人生观价值观,有自己的喜恶,这些都可以看作是基础。比如服务机器人、自动驾驶、火灾机器人甚至军事机器人等特殊领域,逻辑智能体现为遵守最高指令,而这绝不是一个目标识别、红外线扫描、一个行人避让之类基础功能能够搞定的,这个逻辑智能是一个完整的、基础的软件流程,是应该被模块化复用的。而逻辑智能因为包含太多方向:工业制造、自动驾驶、军事侦察、枪械迅速反应射击、人与动物识别 等方向,每个方向都是一个需要广度和深度的集合。如果逻辑智能是一个操作系统,那么每个方向都可以看作是一个具体软件,游戏类的、新闻资讯类的、导航工具类的,等等。每个方向的软件,都可以抽取出一定的共性,就像SDK工具包。
        同时,个人认为应该首先实现的是机器智能的专业化,而非通才化:会识别感情,能识别图片,能翻译文字,这些功能都可以看做是一大类功能。比如翻译文字,能够翻译中文古文 可以看做是一个专业化,能够翻译英文也可以是一个专业化;无需从开始就做到一个模型,既满足中文,又满足英文法文德文俄文,功能强大后,集成到一起实现可能更容易。


参考个人接触的一些业内和科幻小说对智能解释和猜想,对智能水平做简单分类:简单人工智能-初级人工智能-中级人工智能-高级人工智能。

简单人工智能:
目前的图像识别类、spark机器学习类基本都可以算作是,甚至连这个都达不到。从动植物的角度来讲,顶多也就是膝跳反射或者看到,触摸到等简单反射。包括手机的人脸识别、安防的人脸识别、车站的刷脸等。有固定的输入输出,逻辑简单,运算能力也不高,基本上是单机为主。说是非人工智能,没有技术能解决这些问题,说是人工智能,又是简单的模式叠加,选算法最优解。
NLP和图谱的比图像和结构化数据更难定义一些,目前有比较强大的NLP方向应用,能够达到简单对话的程度,主要是靠语料库的巨大、标注的准确性和人工完善程序 应对逻辑。

初级人工智能:
初级人工智能对人的行为作出逻辑应答,能够运算但却不能进一步的思考。不具备感情。不存在‘利益’\权利义务这种概念,并不会真正的感到高兴或者难过,但却会给人带来他正在高兴或正在难过的视觉与听觉效果。其涉及到心理学与人类行为学等人文科目的一些研究成果,语料库越强大、训练的数据标注越准确,算法与逻辑设计越是全面,得到的效果越好。比如对个人NLP来说,你可能说的每一句话,都被存在数据库中,进行最大化匹配,然后根据你的对话,按照一定的逻辑算法,会做出符合情景与历史记忆的反应。
目前来看,NLP率先进入初级阶段的可能性更大一些,主要需要解决两个问题:1、标注工具的改进,2、更合适的算法和逻辑来构建模型。个人猜测,5-10年内,一个语言识别、语言应对达到以假乱真水平的应用是可以被开发出来的。

中级人工智能:
不但能够解数学题,还能解决更深层次的应用题,比如将应用题、物理题抽象为数学题进行计算。如NLP来说,不只是能够识别语言,而且他能够根据您的语音,准确识别您当前的情绪。在逻辑设计方向,不仅仅是对输入的数据进行初步匹配处理,会有类似于人的人生观、价值观的知识体系、模块参与处理。让回答更有理性、感性方面的温度。
中级人工智能,可以看作是系统软件级别的人文+社科+专业知识的整合输出,前提是有了初级人工智能作为基础。

高级人工智能:
有自我提高能力,有自己的意识。甚至自我修正与编译的能力,有自己的善恶观念,会随接触到的人和事做出对自己有利的改变。自修复、自提高能力。这无异于软件自身拥有了意识,本质来说,需要量子学的发展,或者随机数学有突破,达到人的随机做决定的级别。

目前来看,能够落地且有巨大回报的有:图像识别-人脸识别,手机、安防业;机器学习,广告业;自然语言处理,逻辑关键字词应答与对话。

最后,目前应该是以应用驱动还是以数学基础驱动:
这更类似于武侠里的术道之争,应用为先还是数学抽象为先:个人认为,在中国国内的土壤上,应用驱动较为靠谱。以切实的利益养活以后的研究和发展,是一个较为稳妥的生存方式,资本的大规模涌入与成果要求,各大企业的发展,都需要有真实的应用场景来支撑,哪怕最开始是亏损的,要有曙光。单纯的理论发展,在中国生存的土壤太少,扬长避短最好。工具的发展也需要迭代,在发展中发现问题,解决问题,提升。

原文见本人2019年写的:
https://mp.weixin.qq.com/s?__biz=MzI0ODY2NDE3NQ==&mid=2247483728&idx=1&sn=0a1d5335c60831e8c9f82081d74e7651&chksm=e99c1850deeb9146aed0406277b041aad0a59f5ab028b83caf3137d0090d959a5f2f66cfb1c7#rd

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Machine AI ( 京ICP备2023006562号 )

GMT+8, 2024-6-29 11:18 , Processed in 0.041780 second(s), 21 queries .

Powered by Discuz! X3.5

Copyright © 2001-2024 Tencent Cloud.

快速回复 返回顶部 返回列表