位置:编程技术网 > 运维管理 > 正文 >

人工智能里的“血汗工厂”

2019年04月15日 16:00来源:未知手机版

王铮亮妻子怀孕,爽歪歪飞飞,广发基金官方网站,jlf,开什么店赚钱,麻辣女兵下载,什么是下弦月,高帅粗

在人工智能(AI)高大上的科技光环背后,存在一个被大部分人忽略的环节,这是一个劳动密集型的链条,这个链条上的工人,拼命在用自己重复性、机械性劳动,来训练一个强大的人工智能系统,进而革掉自己工作的命……

训练别人,革自己的命。这不仅是一个科技问题,更像是一个哲学问题。

人工智能的核心是机器学习,是教会机器如何像人类一样认知世界,如何像人类一样思考。这只是一句话的简单概括,在实际中,远比这一句话要复杂的多。教会机器认知世界,在AI领域,被称为“训练”,而训练需要的是海量的数据。

我们常说AI训练用的海量数据,仍然需要人工采集和整理,属于劳动密集型产业。那些每天坐在电脑旁边,不断整理采集来的数据,准备培养机器认知世界所需要的素材的人,被称为“数据标注员”,跟富士康流水线上的工人并没有什么本质的不同。

1

教会机器像人一样思考不容易

教会机器像像人一样思考,并不是一件容易的事情。养育一个有血有肉、智力健全的娃娃,尚且能逼疯一个老母亲,更何况教会以沙子为原材料的机器去思考?

笔者上一篇文章里曾形象描述了人工智能的原理,类比一下三岁小孩认知世界的过程。三岁小孩是怎么知道如何分辨猫和狗的?是因为来自大人的不断灌输,这是一只猫,这是一只花猫,那是一条狗,那是一条哈士奇狗……训练出孩子的认知,猫的基本特征,狗的基本特征,再看到一只动物,符合猫的特征的,就是猫,符合狗的特征的,就是狗。这样一个“养娃”的过程,对应到人工智能的三大核心要素,在大人的不断灌输(算力)下,给孩子介绍猫和狗(数据),孩子在脑子里形成了判别猫和狗的基本认知(算法)。

因此,为了让机器跟三岁孩子一样去认知,就需要准备足够的海量数据来灌输给机器,来教会机器认知。而这些用来训练机器认知模型的数据,必须是基于人类认知加工过的“熟数据”,而且必须是正确的“熟数据”。

否则,就如同一开始教育孩子的方法和基础认知都错了,ABCD都教错了,就别指望孩子英语能学好。

而且,机器面对的世界不仅仅是猫和狗,而是整个物理世界,包括图像、视频、声音、各种感知和情感等等,这么一个复杂的世界,需要更加复杂且海量的数据来支撑机器认知世界。

所以目前的人工智能,都是细分领域的人工智能,专门针对图像的、专门针对文字的、专门针对语音的……离着构建一个完整的人,还相差甚远。

而产生这些训练机器认知的数据,不但要符合人类认知体系,还要有规则有标签,更要数量庞大,是一个劳动密集型行业,因此,说成高科技行业的富士康不为过。

2

机器学习的原理

机器学习分为监督学习和无监督学习。

所谓监督学习,就是通过已有的训练数据去训练得到一个最优模型。在监督学习中,训练数据必须是有输入和输出的数据,也就是有一定规则的数据。根据对训练数据的分析,机器可以训练出一个模型,这个模型内嵌认知世界的规则。

所谓无监督学习,是让机器自主分析杂乱的数据,从而得到这些数据中的一些规则/规律,类似于科研探索,在没有发现科研成果之前,对于研究的对象和结果是未知的。最典型的无监督学习是聚类,也就是分类,让机器自己将对象进行分类聚合。

目前流行的AI,主要还是依赖监督学习,所以才有了海量数据处理的“富士康工厂”。

举个例子,如果想要一台计算机能够准确识别猫,那就必须给计算机输入大量的不同的猫的照片,每幅照片都需要做上大量标注,图片里的哪个区域是猫、什么品种、什么颜色、尾巴、耳朵……只有有了这些标注,训练数据才能成为“熟数据”,才能够让计算机在这些数据的基础上,形成自己认知猫的模型。

人工智能可不仅仅是认知猫狗这么简单,而是认知整个世界……

本文地址:http://www.reviewcode.cn/yunweiguanli/44059.html 转载请注明出处!

今日热点资讯