人工智能的系统集成方向思考

yangmhong · 发表于 2023-1-26 11:03:44

人工智能这个，大学本科时候就开了一个底层基础的课-神经网络，可惜没学好，愧对北交大的丁丁老师。当时听的懵懵懂懂，学的也是稀里糊涂，一直没开窍；没想到十年以后神经网络大爆发，而且火的一沓糊涂，一个卷积就玩的飞起。

根据个人接触到的各种讲座、工作性质接触到的电信业、银行业、互联网广告业三个行业提出的人工智能要求和工程实现，个人认为方向有：

1、初级智能化，模型化。

2、平台化。

3、开发工具更加强大。

4、模块化。

5、感官智能到意识智能的提升。

6、人类的专业技能的模块化、人生观、世界观方面的知识的模块化。

1、初级智能化，模型化：

能够有一定的存储判断逻辑，非现在的简单判断。简单的算法无法解决复杂的自然界问题。模型化：这里的模型的概念，借助了银行业AI平台中的模型的概念，用多个算法，多种处理逻辑的联合，包装处理成一个结果，用来实现Service服务，即 AI as a Service 的实现方式，实现智能程度的提升。

2、平台化：

主要方向目前来看，有偏重深度遍历算力的，如下棋；也有关联算力的，如图像识别分析类，各种卷积切割；也有spark为主导的偏向于大规模集群计算的，如广告业的所谓智能推荐，各种关联模型，TGI的使用为代表。目前来看，没有一个工具能够完全适配这些算法与思想，一个恰当的划分几大功能的平台，将会助力行业快速发展。现在比较主流的TensorFlow框架，百度、华为、Facebook都推出自家专有的框架，这些在体验深度上来说，是合格的，优秀的；但是在一个纷杂的企业实体面前，在各种奇思妙想面前，无法面面俱到。同时企业级应用也是有很大空白，如多任务、多人资源的分配使用，成品的借鉴等，都是刚刚发展，最直观的：tensorboard的日志查看，一个人还好，多个人，基本就没法用了。可以预见的是，在各个大企业推出自家的综合平台后，将是一番拼杀，大浪淘沙，经过市场检验，能够生机勃勃的才有未来。

3、开发工具更加强大：

专业深度更深入（需要更多的paper，更多的思想观点来支撑），使用门槛降低。比如图像方面的卷积，目前原理是大量的图片素材训练，类似于人类的活久见，将来是否有一个标准的、精简到只有几兆甚至几K特征数据就能完成呢？个人持乐观态度。目前是从现象提取到共性的方式，通过大批量的匹配来判定实际场景。在不久的将来从定义延伸到实际场景也是可能实现的，如记录了一只猫的3D数据，就可以判断输入图片是否是猫。

4、模块化：

比如图像识别、图像分析、NLP、逻辑分析处理，功能都是属于比较基础的阶段，而且功能分散，每个企业都可能做的是重复的劳动，从社会角度来说，浪费巨大，将来以软件包、资源包的形式提供插件，类似于现在的函数包之类，个人认为是趋势。没必要每个人都为汽车造一次轮子，前提是轮子有了通行可靠的标准，现在可能造三角的轮子、正方形的轮子、椭圆的轮子，甚至自行车手推车的轮子都是可能的，在未来的模块化实现专属的每类应用的通行标准后，复杂度将大大降低。

5、感官智能到意识智能的提升：

如果用人类已有的智能和功能来看，可分为感官与意识的处理，图像的识别、文字的识别，更多的是感官方面，我们缺乏的是意识方面的集成处理集合。比如工业机器人，目前完成的是某个关键流程的部分，其他部分需要靠人工来监督。

6、人类的专业技能的模块化、人生观、世界观方面的知识的模块化:

智能，本身还是需要一个真正的、比较系统的逻辑系统。以人自身来看，个人的知识存储是千差万别的，但是都有一套行为方式，都是靠大脑的思维处理来做事，不管是智商70还是170.我们暂时称之为逻辑系统。这个逻辑系统又需要有社会学、人文科学、技术逻辑之类的基础。我们的眼睛可以看到，皮肤可以感知，四肢都有简单的神经反射，对一个事情的理解和分析，有自己的人生观价值观，有自己的喜恶，这些都可以看作是基础。比如服务机器人、自动驾驶、火灾机器人甚至军事机器人等特殊领域，逻辑智能体现为遵守最高指令，而这绝不是一个目标识别、红外线扫描、一个行人避让之类基础功能能够搞定的，这个逻辑智能是一个完整的、基础的软件流程，是应该被模块化复用的。而逻辑智能因为包含太多方向：工业制造、自动驾驶、军事侦察、枪械迅速反应射击、人与动物识别等方向，每个方向都是一个需要广度和深度的集合。如果逻辑智能是一个操作系统，那么每个方向都可以看作是一个具体软件，游戏类的、新闻资讯类的、导航工具类的，等等。每个方向的软件，都可以抽取出一定的共性，就像SDK工具包。

同时，个人认为应该首先实现的是机器智能的专业化，而非通才化：会识别感情，能识别图片，能翻译文字，这些功能都可以看做是一大类功能。比如翻译文字，能够翻译中文古文可以看做是一个专业化，能够翻译英文也可以是一个专业化；无需从开始就做到一个模型，既满足中文，又满足英文法文德文俄文，功能强大后，集成到一起实现可能更容易。

参考个人接触的一些业内和科幻小说对智能解释和猜想，对智能水平做简单分类：简单人工智能-初级人工智能-中级人工智能-高级人工智能。

简单人工智能：

目前的图像识别类、spark机器学习类基本都可以算作是，甚至连这个都达不到。从动植物的角度来讲，顶多也就是膝跳反射或者看到，触摸到等简单反射。包括手机的人脸识别、安防的人脸识别、车站的刷脸等。有固定的输入输出，逻辑简单，运算能力也不高，基本上是单机为主。说是非人工智能，没有技术能解决这些问题，说是人工智能，又是简单的模式叠加，选算法最优解。

NLP和图谱的比图像和结构化数据更难定义一些，目前有比较强大的NLP方向应用，能够达到简单对话的程度，主要是靠语料库的巨大、标注的准确性和人工完善程序应对逻辑。

初级人工智能：

初级人工智能对人的行为作出逻辑应答，能够运算但却不能进一步的思考。不具备感情。不存在‘利益’\权利义务这种概念，并不会真正的感到高兴或者难过，但却会给人带来他正在高兴或正在难过的视觉与听觉效果。其涉及到心理学与人类行为学等人文科目的一些研究成果，语料库越强大、训练的数据标注越准确，算法与逻辑设计越是全面，得到的效果越好。比如对个人NLP来说，你可能说的每一句话，都被存在数据库中，进行最大化匹配，然后根据你的对话，按照一定的逻辑算法，会做出符合情景与历史记忆的反应。

目前来看，NLP率先进入初级阶段的可能性更大一些，主要需要解决两个问题：1、标注工具的改进，2、更合适的算法和逻辑来构建模型。个人猜测，5-10年内，一个语言识别、语言应对达到以假乱真水平的应用是可以被开发出来的。

中级人工智能：

不但能够解数学题，还能解决更深层次的应用题，比如将应用题、物理题抽象为数学题进行计算。如NLP来说，不只是能够识别语言，而且他能够根据您的语音，准确识别您当前的情绪。在逻辑设计方向，不仅仅是对输入的数据进行初步匹配处理，会有类似于人的人生观、价值观的知识体系、模块参与处理。让回答更有理性、感性方面的温度。

中级人工智能，可以看作是系统软件级别的人文+社科+专业知识的整合输出，前提是有了初级人工智能作为基础。

高级人工智能：

有自我提高能力，有自己的意识。甚至自我修正与编译的能力，有自己的善恶观念，会随接触到的人和事做出对自己有利的改变。自修复、自提高能力。这无异于软件自身拥有了意识，本质来说，需要量子学的发展，或者随机数学有突破，达到人的随机做决定的级别。

目前来看，能够落地且有巨大回报的有：图像识别-人脸识别，手机、安防业；机器学习，广告业；自然语言处理，逻辑关键字词应答与对话。

最后，目前应该是以应用驱动还是以数学基础驱动：

这更类似于武侠里的术道之争，应用为先还是数学抽象为先：个人认为，在中国国内的土壤上，应用驱动较为靠谱。以切实的利益养活以后的研究和发展，是一个较为稳妥的生存方式，资本的大规模涌入与成果要求，各大企业的发展，都需要有真实的应用场景来支撑，哪怕最开始是亏损的，要有曙光。单纯的理论发展，在中国生存的土壤太少，扬长避短最好。工具的发展也需要迭代，在发展中发现问题，解决问题，提升。

原文见本人2019年写的：

https://mp.weixin.qq.com/s?__biz=MzI0ODY2NDE3NQ==&mid=2247483728&idx=1&sn=0a1d5335c60831e8c9f82081d74e7651&chksm=e99c1850deeb9146aed0406277b041aad0a59f5ab028b83caf3137d0090d959a5f2f66cfb1c7#rd

		自动登录	找回密码
密码			立即注册