【成素梅】人工智能的几个认识论问题

人工智能属于计算机科学、神经科学、统计学、认知科学、控制论、哲学、心理学乃至微电子技术等多学科和跨学科的研究领域,是典型的技术化科学,其发展进程涉及对认知、智能、思维、心灵、意识等认识论概念的研究。这表明人工智能在其学科内部就与认识论结下了不解之缘。难怪维特根斯坦、海德格尔、塞尔、普特南和德雷福斯等哲学家的名字出现在关于人工智能问题的讨论之中。在这些讨论中,最为基本的核心问题当数认识论问题。从分类学的观点来看,人工智能的认识论问题大致可以划分为两个层面:一是人工智能本身的认识论问题;二是由人工智能引发的认识论问题。前者决定了人工智能研究者选择哪条进路来实现人工智能,后者则揭示了生活在网络化、信息化、数字化和智能化时代的我们需要关注的新的认识论问题。

一、人工智能本身的认识论问题

人工智能最直接的目标是让计算机完成需要由人类智能才能完成的任务,但从思维方式与智能构成方式上来看,由电子芯片等元器件构成的“电脑”,无论如何不可能等同于由生物性的神经组织和结缔组织构成的“人脑”。因此,电脑对人脑的模拟一定只能是功能性的,而不是机制性的。功能性的模拟,是把人工智能看成是研究如何使机器像人一样能够做到“厚于德、诚于信、勤于思、慎于言、敏于行”的问题。如何实现人工智能首先取决于如何理解智能,理解方式不同,实现的范式就不同。其次,取决于机器解决问题的方式,而不是研究人脑的认知机制。这就类似于研究计算机视觉,是攻克如何让计算机看得见、看得准的问题,而不是研究人眼的神经机制问题。

图灵于1950年第一次通过一个模仿实验提出了“机器能够思维”的命题,并阐述了如何基于“不可分辨性论点”进行图灵测试的思想实验。图灵的做法有助于计算机科学家绕开至今尚不清楚的“人类智能是如何产生”的难解问题,把判断机器是否具有智能的理论问题转化为一个可以操作的实验问题。但图灵只是提供了一个可操作的判断标准,并没有给出如何实现智能的具体进路,如何实现智能依然要依赖于对人类智能的模拟。

1956年,当被誉为人工智能之父的麦卡锡、纽厄尔、西蒙和明斯基等人在达特茅斯学院组织的学术研究会上正式提出“人工智能”概念时,他们率先提出了“智能”存在于物理符号之中的观点,并且把计算系统的存储能力和符号运算能力看成是制造出智能系统的必要条件,把衡量该系统智能水平的标准定位于计算机系统是否具有在复杂场景中实现规定目标或完成指定任务的卓越能力。[1]这条进路被称之为人工智能的符号主义范式。这一范式继承了西方哲学中的理性主义传统和认知科学中的计算主义立场,把“认知”理解成“计算”。这种追求符号化和形式化的方法是自上而下的,基于这一思路的编程方法虽然能够保证计算过程的精准性,但由于无法解决如何把常识形式化的问题,陷入了发展困境。

当科学家试图探索让人工智能可以处理常识问题时,如何实现人工智能的问题又回到了原点,再次成为计算机科学家关注的重要问题。人工智能符号主义进路的突出成果是专家系统,而专家系统是拥有海量人类专家知识与经验的计算机智能程序系统,它根据事先储存的知识和推理决策来解决问题,难以做到随机应变。于是,科学家改变了对智能的理解方式,不再把智能看成是心灵计算的产物,而是简化任务,模仿人类大脑皮层神经网络的学习方式,把人工智能的发展方向定位于向着实用性、功能性方向发展,并开始研究“常识”问题。在这种认知思路的指导下,人工智能研究者模仿人脑的结构和运行状态,于是人工智能的联结主义范式得到了快速发展。联结主义者认为,智能的本质不是心灵的计算,而是神经元之间的联结机制,是大脑结构中神经活动的结果。为此,他们依照大脑的运行机制,力图通过训练人工神经网络来赋予机器学习能力。在这种学习中,神经网络一开始的学习只是盲目猜测结果,只有经过大量训练,学会识别目标对象之后,结果才会变得较为精确。这种学习被称之为有监督的或有导师的深度学习。

人工神经网络的有监督的深度学习是一种自下而上的学习。这种学习使得人工智能在自然语言理解、语音识别、图像识别、医疗诊断等方面取得了很大的进展。但是,通过监督学习进行自我教育,并依靠大量训练而获得的能力,并没有通用性。因为监督学习是根据输出结果与理想输出之间的偏差,调节神经网络中各个神经元的权重,来使输出结果越来越接近于理想输出。这样,接受了有标注的特定数据集训练的机器只是“专家型”的机器,只具有某方面的特长,它们在学习结束之后,如果还要学习新的东西、完成新的任务,就必须一切从头再来,重新回到哲学家洛克所说的“白板”状态。

这种有监督的深度学习模型,不仅难以完成推理任务,而且随着神经网络层级数量的增多,网络训练过程无法确保有效收敛。因此,如何开发出包含有常识推理层的人工智能神经网络成为人工智能研究者的新任务。这项研究的总目标是,预先赋予人工智能体一定的能力,然后,使它在与环境的互动中进行自主学习。在这种认知策略的引导下,人工智能研究者开发出了无监督深度学习算法、强化学习、强化深度学习、进化计算、深化算法等,开发了基于神经网络的多目标演化优化方法。这些学习算法不是让机器学习知识,而是让机器学习技能,具有探索未知世界的能力,从而复兴了人工智能的进化主义或行为主义进路。强化深度学习等算法是构造一个控制策略,使智能体通过与环境的互动来自主地改进性能和行为,最终达到最优动作。这种人工智能的实现进路是自上而下和自下而上的整合。

在人工智能领域内,科学家在探索如何赋予机器智能时,对智能的不同理解也形成了不同的范式,如符合主义、联结主义和行为主义。人工智能研究者对智能本质的最终认识和实现方式的把握,除了要借鉴脑科学、认知科学、神经科学等的研究成果之外,从哲学家的思想中也能找到某些启迪。

如何实现智能本身是一个跨学科的认识论问题,即科学与哲学深度交叉的问题。这也是在人工智能时代即将来临之际,哲学研究不能的缺场的原因之一。如果说,人工智能本身的认识论问题是内嵌于人工智能实现方式之中的,那么,下面要着重探讨的Web认识论和算法认识论,则是由人工智能的发展所导致的新的认识论问题。

二、Web认识论问题

Web认识论的讨论是多层次和多维度的,基本思路是,以Web为基础,利用数字方法,通过抓取和分析Web数据或信息,对个人和群体事件的趋势作出预测与判断,揭示现有网络信息资源中潜存的文化基因和政治趋向等。Web认识论是阿姆斯特丹大学理查德·罗格斯教授在2004年出版的《Web上的信息政治学》一书中第一次提出、在2013年出版的《数字方法》一书中详加阐述的一种新的认识论。其目标在于界定关于互联网的一个新时代,一个不再关注真实与虚拟的时代,主张把互联网作为研究阵地,基于诸如搜索引擎之类的工具所搜索与分析的数据,提出一种知识性的断言,不再关注社会与文化在多大程度上是在线的,而是关注如何凭借分析互联网上的信息来诊断文化变迁和社会境况。[2]

其一,在个人层面,运用数字方法对用户通过各种渠道留下的网络信息的综合分析,有助于揭示用户的兴趣爱好、语言习惯、活动范围、社会地位、人际关系、朋友圈等。这既为商家提供了可以利用的各类信息,也为各类机构或组织了解员工或目标对象提供了认知窗口,为社会治理提供了新的渠道等。另一方面,个人网络信息的不可删除性对人的素养提出了更高要求,关注自己的数字身份与数字形象将会逐步起到规范人的行为和教育的作用,从而赋予智能技术特有的环境和教育的力量。此外,数字化生活和保护隐私之间的矛盾向我们提出了重新界定隐私概念的要求;同时,网络信息的不可删除性和自媒体时代的到来,也为我们辨别真假信息、遏制网络谣言等造成了更大的困难。

其二,在群体行为层面,运用数字方法,通过对用户在Web上留下的信息查询痕迹的剖析,来预测可能发生的社会事件,从而使Web具有了预测功能。罗格斯在《数字方法》一书中列举了两个事例来阐述这一点,其中一个事例是谷歌对禽流感趋势的预测。这是谷歌在2008年启动的一个非商业项目,旨在通过统计流感、流感症状和相关术语等搜索引擎查询,以及查询者所在的地理位置,预测当地是否有可能爆发流感。然后,这一项目的判断结果,在与美国疾病控制中心提供的流感数据进行比较,也与监控到用谷歌查询流感的约20个国家或地区的疾病控制中心提供的流感数据进行比较之后,得到了验证。这是在线分析的结论得到了线下事实验证的典型案例。这种通过分析实时查询记录与查询地之间的相关性得出的预测判断,向传统的数据统计方法提出了挑战。传统的数据统计方法通常提供的是事后判断,而在线数据分析方法提供是的事先判断或预测判断,相比之下,更有益于人们或政府及早制定预防措施,降低公共事件的发生率。可见,Web作为对社会事件的预测媒介,比我们所预期的更接地气、更便捷、更快速、更有针对性。

其三,在网络平台层面,运用数字方法,通过对Web内容的分析来揭示社会文化的变迁,分析不同民族之间的文化差异。比如,罗格斯及其团队成员对维基百科上的“斯雷布雷尼察大屠杀”词条的内容进行了多语言分析。他们的分析表明,1995年7月的“斯雷布雷尼察大屠杀”词条(截止到2010年12月20日)是用斯雷布雷尼察事件中重要参与方所使用的语种撰写的,即荷兰语、波斯尼亚语和塞尔维亚语,但该词条的英语版本有多种观点,关于这一事件争议不断,至少持续了五年,其中对同一事件给出了不同的陈述。为此,他们得出的结论是,维基百科上的有些词条可以作为一种文化参照或文化所指来理解,并不是完全中立的,从而为维基百科相同词条的跨语言版本的文化差异的常态化提供了证据。[2]

其四,在网络与网络之间,运用数字方法,通过对不同机构网页上的超链接导航,揭示政府、非政府组织和公司之间的“政治关联”以及机构之间的等级关系。网络的超链接是有选择的,而不是无缘无故地进行链接。罗格斯的研究表明,链接到一个网站、不链接或删除一个链接,在社会学和政治学意义上,可以分别被看成是关联、无关联或去关联的行为。比如,政府倾向于链接其他政府的网站,公司倾向于链接其内部的网站。从单个网站的导入链接和导出链接,可以对该网站作出评估。比如,罗格斯的项目组成员针对转基因食品问题,研究了诺华公司、绿色和平组织和一系列政府机构的网站的超链接行为,结果发现,诺华网站链接到绿色和平组织网站,而绿色和平组织网站则没有链接回去,诺华网站和绿色和平组织网站都链接到政府网站,而政府网站则没有反向链接它们。可见,网站的链接类型反映了各自的声誉与社会地位。

总之,Web认识论研究以互联网的普及或覆盖为前提,也与人们凡事都要借助网络查询的习惯为前提,或者说,只有当互联网成为社会基础设施时,人们才能养成查询习惯,Web认识论的研究才有可能。人们运用数字方法对Web内容和数据等的分析,是在信息与数据丛林中的探索或探险,这为当代人文科学和社会科学的研究提供了新的方法论途径和更加客观的认知视域,如宾夕法尼亚大学积极心理学中心的心理学家根据推特、脸谱等社交媒体上的话语来分析大众的情绪、收入和意识形态等,这些在过去无法做到的研究有可能在语言分析及其与心理学联系方面带来一场革命。这场革命从表面上看是对平台信息的多维度利用,而事实上这种利用却是建立在算法的基础之上,这就带来了下面所讨论的更深层的认识论问题。

三、算法认识论

人工智能发挥作用的世界是由数字化行为构成的世界,大数据使得数据的用途发生了质变,而智能机器人与数据世界的互动使人类进入了利用大数据进行预测或决策的新时代,使我们生活在一个社会技术的系统之中。然而,当数据成为我们认识世界的界面时,我们已经无意识地把获取信息的方式交给了算法本身,或者说,我们的日常生活,如游戏、购物、订餐、旅行、工作、交往、家务劳动等,越来越以软件赋能的数字设备和网络系统等技术为媒介,并受到这些技术的拓展和规制。从根本上说,软件是由算法构成的。算法正在形塑着日常实践和任务,如搜索引擎、安全加密交换、推荐系统、模式识别、数据压缩、自动纠错、优化、强化、激励等。算法等于逻辑加控制,是指令集合,即为解决特定问题设计的一系列操作指令或步骤,也是思考问题和解决问题的方法与思想。在当前的实践活动中,算法不仅成为当代社会中新权力的“经纪人”,而且重塑着社会与经济系统的运行,乃至科学研究方式。

第一,算法具有自动治理能力。随着人工智能的普及应用,我们越来越进入一个算法法理的时代,也就是说,在行使权力时,算法所起的作用越来越大,不仅能够自动监控,而且能够自主处理。比如,在维基百科中,自动算法或软件机器人编辑的警觉性是人类编辑所不能比拟的,它们起着网络电子“警察”的作用,极大地提高了维基百科的维护能力。比如,有人为了考验维基百科中使用的软件机器人的警觉性,专门用不同的IP地址把错误植入到某些词条中,结果软件机器人竟然在48小时之内就自动地纠正了一半的错误。[4]

第二,算法系统是黑箱或者不可解释的。对于用户而言,算法通常隐藏在可执行的文件之中,是无法理解的,因为算法系统是网络化、分布式的,而且能够在与环境的互动中自主地进行动态优化、调整等。对于用户而言,算法的不可理解性来源于两个方面:一是信息保护,如信息科技公司为了在竞争中获胜和保护其知识产权,程序员的工作是极其保密的。用户在使用产品时,并不知道算法是如何起作用的。二是算法的动态优化,如人类无法理解打败国际围棋高手李世石的“阿尔法狗”走棋子的策略,更有甚者,2018年新研发出来的“阿尔法折叠”甚至可以根据DNA的序列测出蛋白质的三维结构,如此等等。刚刚获得2018年图灵奖的杰弗里·欣顿(GeoffreyHinton)在2014年把由算法系统提供的这类知识称之为“暗知识”(darkknowledge)。这类由算法自主提供的“暗知识”是人类既无法言说、也无法意会的一类新型知识。我们应该如何对待这类知识,是需要进一步研究的一个认识论和知识论问题。

第三,算法的设计是负载文化的。算法不能被理解为是技术性的、客观公正的知识形式或操作模式。因为文化是先于算法设计而存在的,植根于现存的社会制度、实践、态度及其价值趋向之中,通过设计者的设计理念和预期嵌入到程序设计之中,或者说,算法是在更广泛的社会技术系统中形成的,是在文化、历史和制度的交集中创建出来的,依赖于开发它们的条件,在本质上,应该被理解为是关系的、域境的和视情况而定的。

第四,算法本身是有技术偏向的。算法的技术偏向来源于技术设计,体现在设计过程的几个方面,如硬件、软件和数据库等计算机工具的局限性,将社会意义赋予算法的过程,伪随机数生成算法的缺陷等。比如,我们现在习惯于使用航班电子预订系统来买机票。这个预订系统用起来方便而简单,我们只要输入旅行地点,预订系统就开始在航班数据库中进行搜索并检索出能满足或接近满足要求的航班选项。然后,根据不同的标准对这些选项进行排序,如时间排序、价格排序等,我们看到的是预订系统排序后的航班选项。但是,当我们利用公务机票预定系统来搜索国际航班时,只能搜索到国内航空公司,搜索不到国外航空公司。这说明机票预订系统的界面隐含有技术偏向设置,最近多次报道的大数据杀熟等现象也是如此。算法的效用或算法的权力并不总是线性的或可预言的。算法作为更广泛的关系网络的一部分,在运行时,也会有副作用,并出现意想不到的结果,而且算法的技术偏向通常隐藏在代码中,很难被准确地找出来,因为算法不只是程序员创建的,还会在用户与用户的互动中自主地发生改变。

第五,算法的输出具有路径依赖性。由数据驱动的算法能够根据不同用户的需求自动推送相关产品。比如,某人在网上搜索了某个产品之后不久,浏览器就会自动地推送类似的产品。因此,大数据和人工智能可以自动地为习惯于网络化的人描绘个人画像,如消费习惯、着装习惯、饮食口味、交往人群等。这样,搜索引擎在爬取、索引、储存和最终排序内容的意义上,已经成为一种认识论的机器。显然,当算法在我们的认知过程中所起的作用不断增加时,就带来了人与数据环境关系的逆转,不是人来适应数字环境,而是数字环境来适应人。这样,搜索引擎的路径依赖性,在方便我们查询的同时,却在某种程度上,遮蔽了我们眼界,产生了固化单一性和弱化多样性的弊端。

第六,在算法界面的引导下,我们的思维方式也就相应地从重视寻找数据背后的原因,转向了搜索运用数据本身。这就颠覆了传统的因果性思维方式,接纳了相关性思维方式。因果性思维方式是,“如果A,那么B”。这是我们习以为常的一种思维方式,也与近代自然科学的思维方式相一致,是面对简单系统的一种决定论的思维方式。而相关性思维是,“如果A,那么,很有可能会出现B”,A并不是造成B的原因,而只是推出B的相关因素。这是面对复杂系统的一种不确定性的思维方式。这种思维与量子力学的思维方式相一致。这两种思维属于两个不同层次的思维方式,不存在替代关系,相关性思维是面对复杂系统的一种横向思维,因果性思维则是面对简单系统的一种纵向思维。

综上所述,人工智能发展引发了许多新的认识论问题,需要我们把传统认识论的研究扩展到算法认识论或机器人的认识论,也需要关注数字方法在科学研究中的现实应用,尽可能使数据驱动型的技术和人工智能能够更大程度地造福人类,使技术真正成为改善人类生活的向善力量,而不是灾难。

【参考文献】

[1]A.纽厄尔,H.A.西蒙.作为经验探索的计算机科学:符号和搜索[A].见:[英]玛格丽特·博登.人工智能哲学[M].译者:刘西瑞,王汉琦.上海:上海译文出版社,2001:143-145.

[2][3][美]理查德·罗格斯.数字方法[M].译者:成素梅等.上海:上海译文出版社,2018:1-53,200-213.

[4]R.Rogers.DigitalMethods[M].Cambridge,MA:TheMITPress,2013:170.

（原载《思想理论教育》2019年第4期）