《ACCA:机器学习:科学向左科幻向右(48页).pdf》由会员分享,可在线阅读,更多相关《ACCA:机器学习:科学向左科幻向右(48页).pdf(48页珍藏版)》请在三个皮匠报告上搜索。
1、机器学习科学向左,科幻向右 The Association of Chartered Certified Accountants April 2019关于ACCA ACCA(特许公认会计师公会)是全球广受认可的国际专业会计师组织,为全世界有志投身于财会、金融以及管理领域的专才提供首选的资格认证。ACCA目前在大中华区拥有25,000名会员及108,000名学员,并在北京、上海、广州、深圳、成都、沈阳、青岛、武汉、长沙、香港和澳门共设有11个代表处。ACCA为全球179个国家的208,000名会员及503,000名学员提供支持,从雇主的技能需求出发,为会员和学员的事业发展提供完善的专业服务。AC
2、CA透过全球104个办事处和中心,以及全球超过7,300家认可雇主,为员工的学习与发展提供高标准服务。ACCA致力于维护公共利益,提倡适度的会计监管方式,同时,通过开展国际化研究,不断提升财会行业的声誉与影响力。目前,ACCA的核心ACCA专业资格正在进行重大创新,以确保我们的会员继续成为全球倍受推崇和青睐、与时俱进的专业会计师。自1904年成立以来,ACCA一直秉承着独特的核心价值,即机遇、多元性、创新、诚信和责任。了解详情,请访问ACCA网站:机器学习科学向左,科幻向右关于本报告本报告介绍了机器学习,并特别强调了财会行业对机器学习的需求。除了总体介绍机器学习外,本报告还围绕如何应用此项技术
3、、伦理道德考量、以及对未来所需技能的影响展示了一系列观点。了解更多信息:魏雅安(Narayanan Vaidyanathan)ACCA商业洞察主管4前言数字化对财会行业的影响是ACCA当前关注的重要主题,贯穿于我们所有的思考和行动中。我们以其为中心展开组织活动,构建推广最佳实践的领先思想。作为专业会计师组织,ACCA已将数字技术应用纳入了培训计划的内容与交付当中。我们的课程内容强调,从数据分析法到人工智能,专业会计师需要培养对一系列技术的理解能力。ACCA资格认证和后续职业教育(CPD)服务则致力于通过在线、灵活的数字化方法,为遍布180多个国家的会员和学员提供最优质的服务。我们的思想领导力同
4、样是建立在自身组织对数字技术应用的关注上的。我们开展着广泛而深入的技术研究从机器人流程自动化一直延伸至区块链,本报告提供的机器学习观点是这一强大研究组合的最新成果。报告首先以通俗易懂、切实可行的方式对机器学习的基础知识以及其如何在财会行业中运用进行了介绍。此外,本报告还探讨了与公共利益相关的道德问题和其他考量。这些事项都是ACCA使命的重要组成部分,也是我们与监管机构、标准制定者、合作伙伴、成员和学员开展对话时不可或缺的议题。当前,有关人工智能将给世界带来何种负面影响的讨论正如火如荼地进行,我们的目标在于,在普遍过分夸大的意见中加入深思熟虑、审慎周详的意见。我们由衷希望,本报告可以为关心人工智
5、能发展的人们提供实用的参考,并且支持那些有意义的、有建设性的讨论。郝飞(Alan Hatfield)战略与发展执行总监目录执行摘要 6引言 81.机器学习与财会职业 102.厘清术语 123.机器学习的应用 184.伦理道德的考量 255.机器学习环境中的技能 35结束语 37附录 1 38附录 2 国别概况 39英国 40中国 41马来西亚 42新加坡 43阿联酋 44爱尔兰 45巴基斯坦 46附录 3 47免责声明本报告的部分内容会提到来自第三方的机器学习产品或其他举措,这仅出于信息提供的目的,以便读者了解真实案例。报告并非是对所提及的特定产品或举措做出认可,也并非提供完整的清单。时至今日
6、,人工智能(AI)对大众观念产生着重大影响。使用数学算法来处理大型数据集的机器学习(ML)技术也正被越来越多地运用到由人工智能主导决策的商业应用程序之中。就在几年前,人们还普遍认为人工智能仅仅是科幻电影的素材。但现在,由于可以获得比以往更多的数据和拥有更强大的数据处理能力,机器学习似乎即将颠覆这种观点。人工智能领域有很多专业术语,每一术语的定义之间仍存在争议。ACCA面向会员和准会员的调查中,受访者对于人工智能、机器学习、自然语言处理(NLP)、数据分析法和机器人流程自动化(RPA)等术语相关理解的回复充分印证了这一点。对于任何给定的术语:62%的受访者表示没有听说过,或者虽然有所耳闻,但不清
7、楚其具体含义或只有基本的了解;仅有13%的受访者拥有深入或专家级的认识。这表明在加强教育和提高意识方面,仍有巨大的空间等待全球财会界去挖掘。对于人工智能一种定义即机器在与思考、理解、推理、学习或感知相关的领域中所展示出的类似人类的能力。机器学习作为 人工智能的子集,通常被理解具备基于历史数据集的系统分析进行预测或决策的能力。从本质上讲,机器学习意味着,机器能够随着时间推移,学习整个数据集的特征并识别出各个数据点的特征。在这一过程中,其“学习”所获得的结果并不依靠事先的明确的编程。它们依托机器学习算法,随着不断吸收更多数据并确定其中的相关性而得出结论。6执行摘要7本报告首先介绍了基础知识。这对在
8、一定程度上建立对这些应用程序工作方式的认识、信任此类系统并且了解机器学习如何成为开发更高水平机器智能的基础都具有十分重要的意义。就此而言,“智能”是指无需以固定的、预先确定的方式依靠指令就能处理给定的数据集,在某些情况下做出决策或作出推论的技术能力。但这并不意味着,该技术突然形成了一种独立的意识机器人大行其道的时代尚未来临!五分之二的受访者表示其所在的组织在一定程度上使用了机器学习的技术,这表明市场正在认识到机器学习的力量。这其中包括:企业已在完全运行模式下处理实时数据(6%);处于高级测试阶段,将在3-6个月内“上线”(3%);早期准备阶段,将在12个月内“上线”(8%);以及仍在初步讨论和
9、概念探索阶段(24%)。可选择的应用程序涵盖多个领域,包括发票编码、舞弊识别、公司报告、税务和营运资金管理等。本报告探讨了这些领域的各种产品与举措。这些研究发现突显出,由于各种组织都将越来越需要这些技能,财会行业需要优先考虑在这一领域中建立认知与理解。事实上,调查中所提及最多的技术应用的障碍,正是缺乏有经验的员工来牵头机器学习技术的应用(52%)。与任何技术一样,力量越大,责任越大。就机器学习而言,道德问题始终与之紧密相关。专业会计师需要考虑并恰当管理可能由算法决策引发的潜在道德妥协问题。谁应在这种情况下承担责任?机器学习算法将不可避免地产生所获取数据集所有偏差,那么这种偏差会引发哪些风险?约
10、五分之四的受访者认为,当通过机器学习算法做出决策时,组织有责任以某种形式披露这一信息。本报告考虑了一系列与专业会计师相关的道德因素,用以指导如何践行国际会计师职业道德标准委员会(IESBA)所制定的基本原则。媒体中经常会提到人工智能接替人类工作的能力。毋庸置疑,这些技术的确能够更有效地完成多种任务如前所述,本报告详细探讨了其中的一些领域。但即使像人工智能这样高深复杂的技术,似乎也难以匹敌人类所具备的完全理解和综合思考能力。尽管人工智能已取得诸多进步,但就例如建立客户关系、领导成功团队等,其都不可能完全脱离人为监督或考虑到人性因素。ACCA关于情商(EQ)的研究特别强调,在数字时代,人们需要与情
11、感智慧相关的能力(ACCA,2018年)。事实上,我们展望未来之时,数字商(DQ)与情商的结合能够为专业会计师带来最为显著的叠加效应。除了领导力等行为方式之外,核心专业技术活动也需要基于多种考虑因素进行判断和解读。机器学习可以利用成熟复杂的算法分析历史数据集,提供真正有深度的信息。但在某些情况下,人类可能会选择关注这些信息而出于完全正当的理由,用一种与以往决策模式不同的方式,根据其他因素做出决策。展望明天,专业会计师将有机会建立对新兴技术的核心理解,同时不断开发与传达释义、情境分析以及关系主导的技能。在此基础之上,他们便可在机器学习等技术支持下,对海量数据进行智能分析,真正受益于技术的强大能力
12、。与任何技术一样,力量越大,责任越大。就机器学习而言,道德问题始终与之紧密相关。机器学习:科学向左,科幻向右|执行摘要人工智能(AI)这一术语最早可追溯至1956年。该领域涵盖了一系列专业名词,机器学习(ML)也是其中之一。什么促成了这一局面?数据驱动型洞察力已成为驱动人工智能发展的“智慧”核心。与此同时,数据的可获得性呈现指数级增长以及前所未有的的处理数据的算力,共同推动了人工智能日益从科幻变为现实。有必要质疑这一观察结果。从广义上讲,人工智能有两个级别特定用途人工智能(或弱人工智能)以及通用人工智能。就目前的应用状态来看,“人工智能”这一术语主要是指弱人工智能。这意味着人工智能的应用仅限于
13、特定解决方案的应用程序中,例如识别大量交易中存在的固定模式。在当下,尚不可能达到通用人工智能的级别,即像电影和电视剧中经常出现的那样,机器人展示出人类的智慧与特征。虽然有些人坚信,后一种,即所谓的“感知能力”终将变成现实,但现有技术状态显然与此仍有很大的差距。正如许多专家指出的那样1,对类似下棋等单一活动建立高水平的成人级智能的难度要比对人类(甚至是婴儿)的活动或感知能力建模难度低得多。8大多数的早期人工智能项目依赖于“决策树”方法连接各种选项,例如国际象棋会罗列所有可能的开局打法和后续的对抗方法。但即使是相对简单的问题如为零售商提供针对特定客户的建议,决策树中大量选项也会导致组合出现爆发式的
14、增加,就连功能最强大的硬件也无法处理。这导致人们对人工智能的预期很低,由此出现的研究低潮被形容为-“AI(人工智能)冬季”。计算能力不仅无法满足理论方法,而且远远落后于人们创建有效应用程序的期望。然而近年来,人工智能重新受到了各方关注。这并非科幻小说中的场景;相反,它现在正越来越多地出现在消费技术和商业应用程序当中。引言1 通常被称为莫拉维克悖论:人工智能和机器人研究人员Hans Moravec、Rodney Brooks和Marvin Minsky在20世纪80年代发现,与传统假设相反,高级推理只需要进行很少的计算,而低级感觉运动能力需要依靠庞大的计算资源。露丝普雷迪(Ruth Preedy
15、),普华永道 夏默斯雷(Shamus Rae),毕马威9由于机器学习日渐应用于会计软件和业务流程应用程序,作为一名财务专业人士,了解所有相关知识非常重要。本报告的目标便是推动这一进程。报告全面地介绍了机器学习。文中不仅阐释了其基础知识,而且还对应用这项技术的实际案例加以展示。其次,报告进一步深入探讨了财会专业人士可能需要思考的道德问题以及该技术对本行业所需未来技能的影响。除了听取该领域的专家意见、参考ACCA在技术领域的广泛的研究成果之外,报告的编制过程中,我们还面向1,897名ACCA会员和准会员展开调查,并与英国财务报告委员会(FRC)的学习与创新中心财务报告研究院(Financial R
16、eporting Lab)合作召开了“机器学习中的伦理道德”圆桌讨论。我们衷心感谢以下代表在圆桌讨论中发表意见:安德烈亚斯乔治奥(Andreas Georgiou),Sage公司 多萝西卓(Dorothy Toh),伦敦国王学院 丽莎温布利(Lisa Webley),伯明翰大学 玛利亚莫拉(Maria Mora),富士通公司 斯图尔特科比(Stuart Cobbe),Brevis公司 托马斯图姆泽-史密斯(Thomas Toomse-Smith),财务报告研究院复式记账法起源于中世纪,自此成为全球商业记账的基础。随着时间推移,会计师编制账目记录业务流程以及独立审计师审阅账目记录的准确性与完整性
17、的方式一直在不断发展演变。机器学习的确可以做很多令人惊叹的事情,但会计师是否真的有此类需求,需要借助机器学习才能更好地工作?整体来看,答案似乎是肯定的,而且这不仅只是跟随潮流。伴随时代进步,机器学习将通过多种方式为专业会计师的工作提供帮助。能够推动该趋势的主要因素之一便是数据的激增。10尽管如此,十六世纪末和二十世纪末的会计师仍然可以进行有意义的专业交流,因为以复式记账法为基础的账目编制方法仍然保有足够多的共同的基本假设。在过去500年里,会计实务在与时并进、不断发展的同时,也保留了一些共同特征。如今,我们不禁要问,机器学习等技术将怎样引发一场新的重大变革?ACCA的调查显示,目前更多的人认为
18、人工智能是“泡沫”而非现实,但在不久的将来,这种情况必将发生改变(参见图1.1)。截至2018年年中,在线发布平台Medium表示,全球已有3400多家人工智能/机器学习初创企业。与其他风投项目一样,他们中的绝大多数会遭遇失败而许多企业之所以无法成功,是因为他们看上去提供了一个“解决方案”,然而这些方案并非针对一些特定的业务问题或需求提出切实的解决方案。1.机器学习与财会职业图 1.1:人工智能:在工作环境中,是“泡沫”,还是现实?备注:其余受访者表示“一半是 泡沫,一半是现实”。全部/大部分是“泡沫”大部分/全部是现实26%58%n 现在 n 三年内34%13%70%60%50%40%30%
19、20%10%011据估计,全球90%左右的数字化数据是2016年以后产生的2。新数据生成的速度正在加快而且是指数级的增长,不再是以往的渐进式或线性增长。客观地讲,并非所有的数据都必然会引起会计师的关注。但即使从金融交易等他们更感兴趣的领域来看,出于各种原因数据量不断增加的趋势都显然与其息息相关:在世界很多地方,数字化支付方式正迅速取代现金,成为首选支付方式。例如在中国,移动支付正迅速削弱携带现金的必要性3。物联网(IoT)设备、流媒体服务,基于交易量收费、依托云技术的软硬件解决方案,推动了小额高频的金融交易的增长。全球范围内一系列普惠金融倡议的成功,促使更多人参与到全球金融系统当中。从2011
20、到2018年,超过12亿人首次注册成为金融系统用户,他们中的每个人都是新金融交易产生的来源4。机器学习:科学向左,科幻向右|1.机器学习与财会职业因此,如果不加以妥善管理,金融交易量的迅速增长可能会对会计师的工作产生威胁。对审计师来说,这可能与所需的样本以及样本的代表性有关,从而使他们可以跨越样本规模本身得出结论。正如福布斯5等机构所说,从现在到2025年,预计交易数据量将大幅增长,所需处理的数据将呈阶梯式攀升而非渐进式增长。同时,我们还有必要了解这一极速扩大数据池的分布与构成。这意味着,若想准确了解并评估的全部账务,利用现用资源,通过扩展程序并可靠地理解所处理的总体数据将面临压力例如应对更大
21、规模的样本量的能力。但事实上,机器学习之类的技术有望突破这一局限,通过详细审计帮助审计师实现特殊项目的探测。这样的发展可能使机器学习成为一种必备工具,而不再构成竞争优势;因为当大家都开始应用机器学习时,优势就将不复存在。据估计,全球约90%的数字化数据是2016年以后产生的。图 1.2:2010-2025年全球数据圈的年度规模资料来源:国际数据公司(IDC)全球数据圈(Global DataSphere)研究,2018年11月。200200泽字节2 https:/ https:/ 全球普惠金融数据集5 https:/ 2.1:人工智能涉及的各种术语
22、ML:机器学习 DL:深度学习 NLP:自然语言处理 AI:人工智能 DA:数据分析法 RPA:机器人流程自动化DARPAAIMLDLNLP在图2.1中,机器人流程自动化(RPA)被划分在了代表人工智能的圆圈之外。这是因为,虽然该术语有“机器人”一词,但其所指的机器人并非媒体经常所说的那种看起来类似于人的智能机器人;实际上,机器人流程自动化是一种执行预定义活动序列的编程软件,类似于非常高阶的Excel宏。这种技术里并不包含人工智能元素,其核心是流程自动化不知疲倦、动作迅速、准确无误地不断重复执行一项定义好的流程。虽然本节将这些术语作为静态名词加以讨论,但需要注意的是,因为这些技术正在快速发展变
23、化,这种理解可能过于简单化。同时,横跨不同技术的创新也并非孤立发生。在不断涌现创新的领域,机器人流程自动化与人工智能元素的结合即所谓的“智能流程自动化”(IPA)就是其形式之一。越来越多的科技公司正在探索这一领域,如阿里巴巴的阿里云。智能流程自动化是标准机器人流程自动化的一种形式,系统可以随时间推移,从其处理的数据和执行的流程中不断学习。在此基础上,随着时间的推移,智能流程自动化可能会像流程自动化一样,带来流程改进的机会。再回到图2.1,如该图所示,机器学习是人工智能的一个子集,其通常被理解为通过对历史大数据的分析进行预测或决策。从本质上讲,它是指随着时间的推移,机器学习能够学习数据集的特征并
24、识别单个数据点的特征。这有助于机器识别大型复杂数据集中的各种关系,而这个过程对人类来说往往更耗时也更困难。之所以认为此类系统可以“学习”,是因为随着时间推移以及输入的数据不断增加,机器可以提高对数据规律的识别能力,并将更强的识别能力应用到以往未曾见过的新数据集中。作为一种商业工具,机器学习如今正变得越来越重要,本节后面将对此进行详细讨论。深度学习(DL)和自然语言处理(NLP)通常被认为是机器学习的组成部分。它们可以处理更加复杂的数据,包括非结构化数据,如图像。这使其能够支持更复杂的数据规律,如图像识别和语言识别。本节稍后将对这些问题加以简要讨论。最后,从更广义的角度上讲,在谈到人工智能时,往
25、往还会提到“认知技术”一词。由于它可以泛指各种尝试复制人脑处理/解读信息方式的技术,故对该术语做出公认的定义相当困难。对“人工智能”一词存在的一种批评意见是,人们经常会认为它是一项将在未来5-10年才会实现的技术,然而在接下来的5-10年内它却会保持不变。事实上,技术处于不断发展变化的过程中,随着技术的进步,它们会不断拥有更多的“智能”特征。而且一旦某种功能得以实现并成为主流,人工智能的标签就将被嵌入常规技术和流程当中。如今,越来越多的机器学习技术已被深深植入各种应用程序和网站中,正在以可能不明显或不可见的方式取代传统软件,例如优步的定价系统。10年前这可能需要硬编码逻辑,而现在只需通过一个经
26、过训练的模型就可以来实现这些决策。它看起来一点儿也不像通用人工智能,但却能更准确地执行特定任务。从外部来看,这种人工智能软件的嵌入提高了整体运行效率虽不是根本性的变革,也却大大节约了成本。能充分说明人工智能已“常态化”的一个例子是光学字符识别(OCR),即从扫描的副本和文件中提取文本的能力。传统的方法需要事先设置一个基于规则的模板,系统提取文本并将这些文本与模板比对。但这些模板经常会变得非常复杂,比如处理数据表甚至分栏列出的文本。13机器学习:科学向左,科幻向右|2.厘清术语实际上,机器人流程自动化是一种执行预定义活动序列的编程软件,类似于非常高阶的Excel宏。在这方面,人工智能推动的跨越式
27、进步已消除了对规则模板的依赖。换言之,人工智能能够自行比对排版布局与对应文本或字符。随着这种技术的日益普及,人们通常只将其视为一种“OCR”技术,而忘记了在后端起着基础性支持作用的人工智能。在ACCA调查中,受访者对某些术语的了解程度较高。就平均而言,对于任何一个特定术语,三分之一的受访者表示要么没有听说过,要么听说过但不清楚具体是什么(参见图2.2)。尽管专业会计师可能不需要自行开发机器学习算法,但本节将简要介绍机器学习的背后工作原理。这一点很重要,因为它会影响我们对这项技术的信赖程度以及是否可信任这些系统所做的决策和所在的运行环境。另外,这对于充分了解机器学习与该领域其他常见术语的关联和区
28、别也很重要。在调查中,受访者对“数据分析法”的了解程度最高,只有五分之一的受访者表示不确定它和机器学习的区别(参见图2.3)。机器学习是具有巨大潜力的强大工具。这是因为人工智能涵盖了广泛的应用,其中包括推荐引擎;舞弊识别;检测和预测机器故障;优化期权交易策略;诊断健康状况;语音识别和翻译;实现与聊天机器人对话;图像识别和分类;垃圾邮件检测;各种预测从某人点击广告的可能性一直到医院可接纳多少新患者;无人驾驶汽车等等,不一而足。14机器学习:科学向左,科幻向右|2.厘清术语平均而言,对于所指出的每一个术语,约有三分之一的受访者表示要么没有听说过,要么听说过,但对它没有进一步的了解。图 2.2:对术
29、语的了解程度图 2.3:对于下面每个术语,您不确定与机器学习有何不同或有何相关。50%40%30%20%10%0我从未听说过我只是听说过我有中等了解我有基本了解我有高度了解我是专家平均.11%20%31%25%12%1%人工智能 数据分析法 机器学习 机器人流程自动化 自然语言处理自然语言处理人工智能26%20%34%34%40%35%30%25%20%15%10%5%0机器人流程自动化数据分析法什么是机器学习?机器学习是人工智能的一个子集,通常被理解电脑可以在事先没有对结果进行显式编程的情况下进行学习的能力。显式编程是指传统的“命令式”电脑程序;也就是说,它们为如何执行任务给出特定的指令。这
30、组特定的指令由人类程序员硬编码,通常包括序列步骤、逻辑检查、函数和循环等要素。因此,对一个数据集运行程序将根据程序中嵌入的一组固定规则得出结果。换言之,程序处理数据的方式是固定的即在程序编写的时候已经固定下来。相比之下,机器学习使用统计分析从数据集中动态生成结果。这一过程的核心是用来描述和(或)预测数据集特征的数学模型算法。首先,我们需要输入“训练”数据集。这些训练数据使模型能够“学习”单个数据点最为重要的特征有哪些。最关键的在于,这个算法随后可以与不属于初始训练数据集的新数据一起使用。如果新数据显示出额外或不同的规律,那么算法可以迭代地进行调整,再将其综合到对数据特征的最新理解中。这就使得机
31、器学习能够以传统编程所不能实现的方式适应新的陌生的数据。正是从这个意义上讲,机器学习能够从实例中“学习”,而不是严格遵守传统程序中事先设定的编码逻辑。机器学习进行的“学习”,依赖于对相关数据元素之间的规律识别。例如,如果数据一致显示出雨伞销量和降雨量具有相关性,那么算法可能会“学习”二者之间的这种关系。但这并不意味着它理解其背后的真正关系,也就是说,它并不理解被雨淋湿了非常不舒服或不方便。因此,这与人类意义上的“思考”仍迥然不同,人类的思考包括了更广范围的感知、横向思维和创造性思维以及处理情感信息的能力。举一个简单的例子,假设一家企业希望通过更好地了解最有可能拖欠的付款方,以改善营运资本。传统
32、的做法是:考察拖欠行为的驱动因素,然后人工创建一个程序。他们可能会将这类程序所用的规则创建一套基本评分系统,其目的在于标记符合某些特征的所有对手方例如其曾经出现延期付款,或是在某些司法管辖区运营、必须支付定金等等。该程序的运行结果通常是最有违约可能的高风险对手方名单。输入该程序的或许是被考察付款方的所有交易数据。而输出的则是满足程序所设置逻辑测试的所有付款方,由此标记最可能违约的交易对象。此举面临的挑战是,程序对“不良”付款方的认识会主要基于某种静态观点。也就是说,它基于程序员如何甄别可能违约者的特征这种在程序开发时所采用的看法将决定输入程序结构的信息。但在实践中,随着付款方、交易、业务构成和
33、交易量的不断变化,该看法很可能会改变。此外,由于需要考虑的变量不断增多(实际应用中很可能会这样),创建一套静态规则来预先确定筛选高风险付款方的标准将会变得越来越复杂和不准确。在这种情境下,或许可以利用机器学习来打造一套基于训练数据集的算法以甄别高风险付款方。同时,机器学习还可以引入更广泛的输入变量并最终识别出程序员编程时可能没有考虑到的相关性。通过持续完善,机器学习系统将逐步提高自身能力,匹配结果质量会得到日益改进而非下滑。15机器学习:科学向左,科幻向右|2.厘清术语机器学习的核心是用来描述和(或)预测数据集特征的数学模型算法。继续以这个简单例子为例,为了识别高风险付款方,机器学习还可以利用
34、更广泛的相关运营环境的宏观经济数据、第三方评级机构的信用评级数据或截止目前网上关于对手方的正面或负面信息等。然而需要注意的是,这种方法同样还是依赖于历史数据,只不过是基于一个更大的数据集。尽管如此,与传统程序不同,机器学习还可采用概率方法。它可利用数据并为数据可能存在的规律、相关性和特征建立统计基础。随着新数据的引入,算法能够动态地吸收新识别出的相关性。和所有统计数据一样,数据集越广泛、越具现实代表性,统计结果就越可靠。根据小型数据集得出结论的错误概率可能达20%,而根据能准确反映建模人群的大型数据集,得出错误结论的比例可能只有2%。因此,建立由高质量、大规模6的数据组成的数据集,对于机器学习
35、良好运作十分关键。目前,这种能力正显示出比人类更快且(或)更经济的潜质,且有望处理人类难以识别可能关系、为编程提供准确依据的海量数据。以舞弊检测等情境为例,人类很难跟上舞弊者操纵系统的各种新的创新方式。当在海量数据中寻找舞弊行为时,这个问题更为严重。由于舞弊者不断通过创建新的技术来“欺骗系统”,因此需要不断开发新领域来测试相关性,帮助识别潜在的舞弊行为,机器学习非常适合应对这类挑战。机器学习使用的方法本报告并不打算集中讨论这一复杂领域的所有细微差别。但在较高层面上,目前的大多数活动主要属于几种类型的机器学习。监督式学习涉及通过实例来“教”的算法,有实际的输入和输出。该算法根据试验数据提供的“正
36、确”答案将二者关联起来,以便算法可以形成对正确规律或关系的基线认识。监督式学习可用于图像识别等分类问题;将所给的例子“标记”内容用来训练模型以识别新图像。例如,可以通过预先将大量猫的图像标记为“猫”,从而“教”系统预测照片是否是猫。强化学习也是机器学习的一种类型,通常被用于没有实际输出的情况,但生成输出的质量可以用“好”或“坏”来衡量,并将该衡量结果反馈输入给算法,而该反馈可用来提高算法质量。无人驾驶就属于强化学习。这种算法的宗旨在于实现“良好”驾驶,避免撞车或危险行车,基于对遇到的(不可预测)情况所做出的判断,来形成一套反馈机制。但是,无人驾驶非常复杂,需要使用监督式学习算法来训练摄像头识别
37、物体人、汽车、骑行者、树木等。然后,将这些算法输入到一个强化算法中。由于各种“物体”的组合是无穷的,因此算法无法完全学习所有情况,它“只”需具备和人类一样善于解读物体的能力。16机器学习:科学向左,科幻向右|2.厘清术语由于舞弊者不断通过创建新的技术来“欺骗系统”,因此需要不断开发新领域来测试相关性,帮助识别潜在的舞弊行为,机器学习非常适合应对这类挑战。6 同样重要的是,必须知晓如何识别出过度添加了不能带来新价值、却会导致“过度拟合”的数据集。17机器学习:科学向左,科幻向右|2.厘清术语准备数据往往被认为是一个瓶颈,因为它耗时耗力,因此非监督式机器学习往往能够更快地获得结果。非监督式学习指的
38、是我们只拥有输入变量但是没有相关的输出变量(即没有确切的答案)。非监督式机器学习通过识别数据的异同、使用聚类学习等技术对没有被分类或标记的数据,在没有任何指导的情况下,对数据中潜在的结构和分布建模,以便对数据作更进一步的学习。该技术的常见用途包括,检测数据集的异常情况(例如查找舞弊交易),或发现相关联的规律(例如将某些产品放在购物车里一起购买)。监督式学习的结果通常更精确,但这种方法通常要求准备数据。准备数据往往被认为是一个瓶颈,因为它耗时耗力,因此非监督式机器学习往往能够更快地获得结果。深度学习和自然语言处理的适用范围深度学习是一种使用“神经网络”的特定机器学习的方法。神经网络【通常被称为“
39、人工神经网络”(ANN)】大体上是以人脑的生物学神经网络为基础。人工神经网络可以由许多层节点组成,信号流可以在各层上下传递从输入层开始,直到到达最后一层(输出层)。“深度学习”是指人工神经网络中输入和输出之间的层级深度。深度学习通过支持改进预测提高自然语言处理的准确性。在没有深度学习的情况下,自然语言处理通常通过分析前面四五个字词来确定下一个字词“很可能”是什么。而深度学习则可以利用前面所有的字词得出更可靠的结果。由于同一个字词可以在不同的语境中使用,自然语言处理被认定为人工智能的“难题”之一。如“book”一词,既可以指装订在一起的书页(名词),也能表示“预定”(动词)之意。虽然机器学习算法
40、都是面向认知领域的,但深度学习在感知领域尤其有用。与感知相关的应用实例包括:语音识别在Siri、Alexa和谷歌助手等数字化助理的在日常使用中得到了广泛普及。据估计,目前语音识别的速度平均是在手机上打字速度的三倍且错误率不到3%。这项技术仍在完善之中并面临着各种挑战,例如技术性词语的处理或带有地方口音的本地化语言。图像识别:人脸识别(如iPhoneX、Facebook、无人驾驶汽车、Imagenet)。2007年,斯坦福人工智能实验室主任李 飞飞放弃尝试用电脑编程来识别物体,转而使用标签和深度学习技术。其成果 Imagene不但拥有庞大的图像数据集,而且错误率仅为5%,这使其能够做得“比人类更
41、好”,并成为图像认知技术的“转折点”。自然语言处理也是人工智能、机器学习和深度学习等技术许多发展中的核心要素,这在数字助理的涌现、以及聊天机器人的广泛商业应用中也最为明显。自然语言处理活动的例子包括:语言识别:语音文本转换;自然语言理解/解读:提供文本理解;机器翻译:不同语言间的文本翻译。18机器学习有各种各样的广泛应用,本节将介绍其中一些最受青睐的应用。正如可预期的,机器学习正以各种不同的方式得到应用。调查发现,有大约五分之二的受访者在积极参与探索机器学习的应用(参见图3.1)。他们所涉及的进展范围从探讨概念的早期讨论一直延伸到在完全运行模式下处理实时数据。受访者对不同领域基于机器学习的决策
42、表达了不同程度的满意度(参见图3.2),这些领域包括分类(53%)、测量(47%)、审计测试(43%)和舞弊检测(41%)。然而,在医疗数据或个人财务等某些更广泛的应用领域,受访者的满意度却较低。3.机器学习的应用n 在完全运行模式下处理实时数据,6%n 高级测试阶段,将在3-6个月内“上线”,3%n 早期准备阶段,将在12个月内“上线”,8%n 初步讨论和探索概念/想法,24%n 无应用计划,38%n 不清楚,21%24%21%38%8%6%3%图 3.1:我所在企业的机器学习应用情况图 3.2:您对以下基于机器学习的特定任务所做决策满意度如何?备注:请受访者用1-5来打分,数字越大表明满意
43、度越高;净满意的比例是打4、5分的受访者之和;净不满意的比例是打1、2分的受访者之和。医疗/健康相关决策,用于诊断53%60%50%40%30%20%10%0关于您的财务决策,用于投资规划舞弊测试招聘初选,即决定是否适合进入面试会计计量审计测试决策为会计和税务目的进行的交易和/或资产负债分类19%47%21%43%24%41%27%31%36%27%40%25%39%n 净比例:满意 n 净比例:不满意19机器学习:科学向左,科幻向右|3.机器学习的应用在考量机器学习与审计的相关性时,受访者普遍认为机器学习有可能成为一个有用的工具。受访者提及较多的一个因素是它能够帮助更好地识别体现舞弊交易的规
44、律。此外,在大数据无处不在的当今世界,机器学习被认为是分析某些生成信息的数量和复杂性所不可或缺的工具。但人们对于机器学习适用的领域和方式也表示担忧。例如,有人质疑由于依赖管理层提供的算法,机器学习的应用会影响外部审计师的独立性。显然,在机器学习成为财会工作主流的过程中必须对上述这些及更广泛的问题进行充分考量。技术应用是一个过程,在拥抱机遇之时,不可避免地会遇到各种障碍。其中约有半数受访者提到了缺乏熟练员工来推动技术应用以及成本因素这两个问题(参见图3.3)。此外,由于数据是实现机器学习至关重要的“原材料”,受访者还谈到了数据质量问题,约四分之一的受访者认为数据质量较差,17%认为缺乏充足的数据
45、量。约五分之一的受访者表示,缺乏采用机器学习可带来明确益处的案例。虽然这或许是因为这些案例未得到充分讨论或理解,但也可能反映了另一种观点对于正在设法解决的特定问题,机器学习并非总是最佳方案。因此,选择需要采用机器学习的出发点必须具备两项条件:商业合理性以及基于机器学习的方法能够最有效地解决该问题。除了对机器学习应用进行更广泛的概念性观察外,本节下文还讨论了一些具体示例。为反映目前的应用进展,我们尽可能地选取了现实生活中的实例。智能记账整体而言,机器学习的应用还处于相对早期阶段。大型会计师事务所已纷纷投资机器学习以探索在审计与合规等领域的各种应用可能。支持机器学习所带来的好处的公开数据很可能会不
46、断增加。在记账方面,机器学习系统已充分投入使用多个年头,特别是在中小型企业。例如,市场上不仅推出了能够扫描支出收据并自动对其进行分类的产品,而且部分还引入了更先进的强化学习和自然语言处理技术,自动对扫描的收据做出分析、提取和归类,无需人工输入任何辅助信息。例如,科技公司Expensify的官网显示,公司产品拥有超过600万用户,超过6万家企业正在使用其解决方案,每年处理数十亿笔交易。在线会计软件供应商Xero于2018年5月宣布,其机器学习软件自推出以来,已经向客户提出了超过10亿条建议,其中在发票编码和银行对账方面表现特别突出。这10亿条建议由7.5亿多条发票和账单编码建议和2.5亿多条银行
47、对账建议组成。Xero估计,每天通过其开出的发票约达80万张,相当于节约307个小时。大型会计师事务所都已纷纷投资机器学习以探索在审计与合规等领域对机器学习的各种应用可能。同时,随着时间的推移,支持机器学习所带来的好处的公开数据很可能会不断增加。图 3.3:受访者所在企业使用机器学习面临的主要障碍缺乏熟练员工来牵头应用数据质量较差52%60%50%40%30%20%10%0对成本的影响使用机器学习没有明显的收益不清楚/没有障碍监管/法律要求数据量不足道德困境其他49%24%21%19%17%14%11%4%20机器学习:科学向左,科幻向右|3.机器学习的应用在发票编码方面,不像传统使用默认代码
48、那样耗费大量人力,Xero软件会“学习”企业如何对常规项目进行编码并根据对历史的“理解”自动填写。采用这种方法,该软件只需四个实例就能对80%的交易实现正确编码。该公司的博客文章表示,该软件正采用逻辑回归方法进行最佳预测,但出于竞争原因文中没有详细介绍预测算法的具体细节,这也是可以理解的。Xero亚太区总裁凯文菲茨杰拉姆(Kevin Fitzgerald)表示:“我们看到机器学习算法能够帮助提供智能支持,以便专业会计师有更多时间专注于客户或所在企业的财务和战略议程。”在最初运营时,为了让算法学习用户行为,Xero将这些编码作为建议提供给用户并在必要时提供特定的(尽管很容易)验证或更正。公司表示
49、:“我们非常密切地关注客户选择其他编码方式、主动表达不同意见的比例以及后来对建议账户重新编码的比例。在重新编码时,系统完全可以从中学习。这是基本理念的一部分系统只知道教给它的内容。如果从正确的账目中学习,提供的建议将会更准确。”这超越了基于规则的静态方法,真正发挥了机器学习能力。在银行对账方面,Xero的机器学习软件已与许多银行的软件实现了整合,整合后自动向Xero输入账户交易记录。然后,机器学习软件将银行交易与Xero中的收支记录进行匹配,并根据之前类似交易的编码方式自动编码。与发票编码一样,银行对账的机器学习将用户修改与交易匹配相结合以改进建议。发票编码和银行对账模型都仅仅基于特定企业的经
50、验,而不是来自更广泛实体的经验。这自然就限制了软件所体现的“智能”程度,并阻止软件向新客户应用预先构建知识的操作。公司在早期就意识到了这方面的问题,“该软件确实有从其他企业学习的潜力,但我们早期研究表明,由于不同企业之间的实践和编码存在巨大差异,这远远超出了我们的预期。”这种有待实现的标准化被设想为未来的增强领域,因为它可以进一步提高客户活动的效率,但同时也凸显了创建“智能”编码机器人的难度。提高舞弊检测能力机器学习还可以帮助进行风险评估,具体是指根据实证数据和专业判断,评估舞弊、不准确性、虚假陈述等问题的可能性。在风险评估中,可采用监督式机器学习算法来帮助识别特定风险的类型或特点,以保障更严
51、格的风险审查;同时还有助于加强针对重点领域的审计。在此情况下,选择恰当的机器学习方法对审计测试可能也非常有用。将机器学习纳入审计流程的做法尚处于相对早期阶段,不过在证明机器学习有助改进审计流程方面公开发布的可用实证数据目前正在稳步发展,例如由印度主计审计长公署(CAG)委托开展的一项研究(Yao等人,2018年)。CAG是印度的独立宪法机构,负责审计所有印度政府注资企业的收支情况,其职责之一是揭发出于舞弊目的而设立的企业。为履行这一职责,CAG每年会选择一系列企业进行审计。其中部分企业是根据公众投诉或直接转移而被选中,有些则是通过监测信息源和商业结果被选定,但从过往历史记录来看,很大一部分被审
52、计企业的挑选带有随机性地。CAG希望考察是否可在审计规划期间采用在风险评估中,可采用监督式学习算法来帮助识别特定风险的类型或特点,以保障更严格的审查;同时还有助于加强针对重点领域的审计。21机器学习:科学向左,科幻向右|3.机器学习的应用机器学习方法预测出舞弊企业的普遍程度。这种类型的预测是审规划初级阶段的重要工作之一,因为在后续的实地审计期间可以针对高风险企业进行最大程度的审计调查。CAG目前已建立了完整的“审计实地工作决策支持”框架以帮助审计师决定特定企业所需的实地工作量并识别可以免于审计的低风险企业。CAG对于何种机器学习算法能够最有效地预测特定企业的舞弊风险很感兴趣。调研中,CAG挑选
53、了最近审计过的700多家公司的历史数据,将其输入10种不同的机器学习算法以验证哪种算法最有效。在这个具体案例中,算法被要求优先考虑敏感性、而非特异性。也就是说,未能发现舞弊公司(II类错误)比错误识别未舞弊公司(I类错误)被认为带来的危害更大。这种权衡的理由是,假阳性仅仅只会引发一次人类调查,结果会发现该公司没有问题,但假阴性则可能无法发现舞弊行为,从而导致舞弊继续发生。研究发现,最准确算法累计识别可疑公司的正确率达到了93%。报告的结果非常详细,但总体来说,在研究试用的10种不同机器学习算法中,没有证据表明哪种算法对所有交易类型和行业群体都最为准确的(Yao等人,2018年)。由此可见,了解
54、该使用何种算法以及使用该方法背后的原因非常重要。这些研究结果不仅体现了机器学习技术对审计过程的潜在附加价值,也体现了充分了解机器学习技术的重要性。只有这样,才能针对特定实例选择最恰当的算法。虽然上述例子是近期发生且与政府有关的,但也有私营企业尝试机器学习的更早案例。例如,英特尔公司建立的“Intel Inside”合作营销活动。在这个活动中,技术制造商可以在其产品外部贴上包含英特尔组件的标签和品牌。该活动被认为是“要素品牌营销”最早的成功案例之一。与之合作的制造商不仅可以从英特尔品牌的声誉中获益,还能从资助的联合营销活动中直接获益。但这也导致许多企业采用欺诈手段寻求这些好处,例如该产品中实际没
55、有使用英特尔组件,却虚假地使用“Intel Inside”品牌。英特尔试图通过对使用“Intel Inside”品牌的企业进行检查以监督合规情况。从过往的历史经验来看,英特尔通过人工和随机选择来挑选被检查的公司。2011年,英特尔开始开发其合规分析法与预测系统(CAPS),该系统结合使用多种监督式学习技术,以预测哪些补贴申请最有可能存在合规问题,并建议英特尔检查团队对这些申请开展进一步调查。CAPS模型引人注目的特征之一,就是其不仅提高了舞弊检测的成功率,还提高了项目本身的投资回报率。换言之,将有关员工可用性和合规调查成本的信息输入训练集,其预测输出不仅包括舞弊可能性,还能生成潜在追回款项的预
56、期值。2017年,英特尔发布了白皮书总结了CAPS运行五年以来的各种发现。其中有一些发现值得引起高度重视。英特尔会继续把利用随机选择进行部分合规审计作为一个控制方面。五年间恢复追回的价值(以美元计)基本保持不变;也就是说,他们加大了审计团队能力的投入,但并未提高英特尔的收入增长。但另一方面,2012年即研究开始的那一年,通过CAPS触发审计工作而追回的价值是随机选择审计追回价值的九倍。五年间,监督式学习算法不断自我完善,至2017年,通过CAPS触发审计工作而追回的价值已增长至随机选择审计追回价值的19倍7。CAPS模型引人注目的特征之一,就是不仅提高了舞弊检测的成功率,还可提高项目本身的投资
57、回报率。7 https:/www.intel.ai/nervana/wp-content/uploads/sites/53/2018/05/AI-Optimizes-Intels-Business-Processes.pdf8 https:/ https:/ 沃森(Watson)机器学习应用程序为拥有大量研发投资的企业提供良好税务建议建议的能力。毕马威用来训练沃森的训练集包括一万多份训练文件,这些训练文件对取得良好结果至关重要,其训练结果发布在了IBM网站上。毕马威的托德马泽奥(Todd Mazzeo)指出:“沃森并非生下来就是博士,而是从幼儿园开始逐步成长起来的。”8到机器训练完成时,沃森已
58、能够对75%左右的查询提出正确的建议。早期美国财政部对国税局税务咨询热线的一项调查显示,在某些情况下,人工接线员给出正确建议的比例仅为57%9。有效的非财务报告在充满不确定性的当今世界,环境、社会和公司治理(ESG)问题已成为非财务报告和风险管理的重要内容。将非财务信息纳入企业报告,不仅有助外部利益相关者更全面地了解公司绩效,还可以确保为内部决策收集更高质量的信息,从而改进风险管理,乃至提高企业的长期附加价值。但即便如此,企业在战略和风险管理方面采用的方法仍可能不完整且已然过时。非财务信息往往在组织内部呈孤立状态。手工进行的数据分析、昂贵的咨询费用、以及统计上不具代表性的调查,可能会使重要性分
59、析面临挑战并使企业承受本可以预见到的风险。自2013年以来,记录在案的、涵盖非财务问题的法规数量增加了72%且纳入考量的非财务监管计划(包括现行计划和草案)超过了4000项(Datamaran,2018年),这一趋势仍有望延续。因此,重要性成为了确保会计师关注点在应对最迫切问题上的一个关键因素。就 国际综合报告框架 中的综合报告而言,重要性被描述为“能在短期、中期和长期对企业创造价值的能力产生实质性影响的因素,”重大事件会对公司的风险和机遇产生显著影响,成为决策和战略制定的关键要素。世界经济论坛 2019年全球风险报告 指出,大多数主要风险都与ESG问题密切相关。自然语言处理和机器学习能够帮助
60、提高税务查询系统的效率。通过使用强化学习的机器学习技术,人工智能聊天机器人和语音引擎可以自我训练,随着时间的推移逐步变得更加高效。23机器学习:科学向左,科幻向右|3.机器学习的应用从某种意义上说,所有应用程序的必要组成部分是一个应用场景通过机器学习分析数据获取可行性洞见。但是,重要性分析不仅耗时长,而且需要大量的人力。首先它面临的挑战是选择使用何种方法。识别、评估、优先安排和披露重大事件的过程,往往会因企业忽视某个价值机会或未能紧跟某项新兴趋势而受到影响。谈到非财务议题和重要性时,其中存在着两种截然不同的考量。其一是至少编制外部非财务报告在一定程度上是监管要求的推动。相关监管要求或许不会设定
61、重要性水平(但某些做法在所有情况下都被强制要求必须报告,如一级碳排放),也可能给出具体的重要性定义(欧盟会计指令 将重要性定义为“信息的受重视程度,基于这种程度,可以合理地认为,如果信息发生遗漏或错误陈述,会影响报表使用者基于企业财务报表所做出的决策”。)但当编制内部管理用报告时,视角与之差别明显。内部管理用报告主要是对信息进行整理,以便为内部管理决策提供信息。在此情形下,重要性将主要集中在发现并解读企业所面临的风险上这也是本节重点讨论的问题。不过,这两种考量的确存在一定交集。遵守外部报告要求可能迫使企业收集一些之前未曾在内部收集的数据,现在这些数据也可以用来支持管理目标。此外,了解利益相关方
62、的“声音”是企业所面临的另一个挑战。通常,企业依靠调查来衡量利益相关方的意见,但是这种方法有诸多局限性,比如难以获得足够数量的受访者,问卷调查的收回率较低等。总的来说,因为有太多标准可以参考,重要性评估的实际结果是否真正具有意义很容易遭到各方质疑。Datamaran等平台使用机器学习来应对这些挑战。该平台可以从根本上帮助实现基准分析、重要性分析和流程控制,使企业系统、持续地在内部监测非财务问题。其最终目的在于助力企业以节约资源的方式将非财务事项嵌入业务当中。人工智能解决方案可以对手工数据分析和请教咨询师等传统的重要性分析方法进行补充。在数据科学家以及ESG与风险专家所组成团队的支持下,Data
63、maran软件可通过筛选和分析来自公开信息源的数百万个数据点追踪100项非财务事项。这些数据来源包括企业报告(财务和可持续性报告,以及美国证券交易委员会的文件)、强制性法规和自愿行动、以及新闻和社交媒体。自然语言处理技术能够对文本(叙述)做出分析,并从人类语言中推导出一定含义,因此利用该技术可对这些数据来源进行分析,获取可比较信息(Datamaran,2018年)。其成果在于,该平台为监管、战略和声誉风险以及与特定公司相关的报告模式提供了基于证据的视角。机器学习应用程序将在财务领域占据一席之地从某种意义上说,所有应用程序的必要组成部分是一个应用场景通过机器学习分析数据获取可行性洞见。做出由价值
64、驱动的业务决策是一个永恒的话题,技术的应用始终与之息息相关。例如,现金流管理应用程序(如现金流预测应用程序“Fluidly”)可帮助管理人员更加动态地掌握现金流状况,预测未来走势,并据此做出相应业务调整。此举不仅能带来商业价值,而且可在竞争激烈的市场中推动企业的竞争优势。10 https:/ https:/ https:/home.kpmg/xx/en/home/insights/2017/09/strategic-profitability-insights.html13 https:/ Systems合作,借助机器学习,对租赁合同进行审查10。德勤表示,到目前为止,他们使用Kira已进行了
65、5000多项合同审查,并宣称使用Kira节约了30%的审查时间。2018年,安永11发布了一款名为“安永Helix GL异常检测工具(HelixGLAD)”的机器学习 审 计 解 决 方 案。在 最 开 始 的 测 试中,HelixGLAD能够在某大型企业的账簿中发现少量交易存在问题测试团队知道这些交易存在舞弊。安永2018年继续对HelixGLAD进行了20个现场审计测试,并计划2019年在100个审计中使用该解决方案。毕马威在其交易咨询业务中使用了一种名叫“战略盈利能力洞察”(SPI)12的机器学习工具。SPI工具包括非监督式学习能力,旨在基于分析交易层面的数据回答有关目标公司客户、产品及
66、供应链上的各种问题。此外,公司还认识到,机器学习高度依赖数据质量,并且可能需要在不同企业间进行创新和开放源代码。毕马威一直致力于该领域的研究以在不同企业间促进最终创建共同理解的数据模型。2017年,普华永道宣布推出其自己的机器学习工具GL.ai13。该工具背后的理念超越了抽样审计方法的范畴,而是利用自动化的、机器学习知情审查的可扩展性来检查公司的整个账簿,以搜索需要人工进一步调查的交易。但是,与任何新技术一样,机器学习方面也有许多来自新企业的创新解决方案,不仅包括本节前面提及的领域,也包括下面将会介绍的其他应用程序。例如,美国“知心山姆大叔”(AskMyUncleSam)是一款由机器学习驱动的
67、聊天机器人,可向纳税人提供税务建议;Kreditech和OakNorth等公司则提供有机器学习信用风险评估工具,而AppZen正在开发实时欺诈检测引擎,并且能与公司现有支出管理工具连接起来。又如,YayPay是一款应收账款应用程序,它以公司的历史支付模式为训练集,利用机器学习改进现金流预测。在更广泛技术背景下应用机器学习机器学习(以及更广泛的人工智能)很可能对财会行业产生重大影响。但重要的是不应忘记许多处于不同的发展阶段的其他技术可以作为机器学习功能的补充,发挥重要作用。数据爆炸使这些技术相联接起来,而推动数据爆炸的一个重要因素便是物联网的发展。从冰箱到手机,众多设备都可以产生数据,这极大地增
68、加了机器学习需要分析的原始资料。此外,随着这些数据的不断倍增,分散的传统数据集可能无法完成其任务。而如果分布式账簿足够成熟,也可能被证明非常有价值。因为它们可以为许多相互关联的使用者提供单一的事实共享版本,这将极大地改善数据质量,从而提高机器学习应用程序的增值能力。目前,通过机器学习应用程序获取洞见的能力存在两个显著的局限:训练集的大小和范围以及其中数据记录的质量。如果多个当事方同意在一个同步且不可更改的账簿中共享其交易,那么机器学习所依赖的训练集的大小和准确性都可能会得到根本改善。这样,各种技术的交集将产生协同作用,不仅可以提高每项技术的投资回报率,也将带来此前不可能产生的新商业模式。目前,
69、通过机器学习应用程序获取洞见的能力存在两个显著的局限:训练集的大小和范围以及其中数据记录的质量。道德行为是社会中每个人在其个人和职业交往中所必需具备的一项素质。但对财会行业来说,这一素养已被深深嵌入到专业会计师的定义中。而在企业内部,道德行为则是要求财务职能提供建设性挑战,确保业务决策建立在合理的道德原则基础之上。本节探讨了机器学习带来的诸多道德挑战,重点讨论了五个领域。对于每个领域,我们都分析了可能有损IESBA基本原则的情境。在大多数情境中,大多数或所有原则都可能面临风险,但为了指出具体要点,我们只会突出强调一两个受到影响的原则。如果有兴趣进一步了解机器学习以外更广泛的数字化时代的道德要求
70、,敬请参阅ACCA报告数字时代的职业道德与信任,该报告介绍了相关考量因素(ACCA,2017年)。处理偏见这可以说是讨论最为频繁的道德挑战来源,其根源在于可能需要对机器学习算法(无论是监督式学习还是非监督式学习)进行恰当解读,才能避免将相关性误认为因果关系。以评估累犯风险的算法为例。这些算法构建了已定罪被告的详细资料并对此进行打分,从而描述再犯的可能性。与医疗诊断解决方案一样,这些都是支持决策的工具。因此,量刑判决权仍掌握在法官手中。但是,日益依赖这些算法给出的分数可能会对法官造成压力如果法官的判决比算法建议的来得轻,他们可能会被认为“对犯罪行为过于手软”。25国际会计师职业道德准则理事会(I
71、ESBA)“职业道德守则”为专业会计师制定了五项基本道德原则,确立了专业会计师应当遵守的行为准则(参加附录1)。因此,在考量机器学习的潜力时,专业会计师不仅需要考虑机器学习的潜在好处(如上节用例所示),还需要考虑其创建长期可持续优势的能力。后者很大程度上依赖于在探索机器学习的应用时,给予道德考量足够的重视。建立信任往往需要数年时间,但毁掉信任只需一瞬间。显然,道德行为本身是不可妥协的要求。但从另一角度来看,同样明显的是,违反该领域的良好实践,还可能会对企业的品牌/声誉以及无形价值带来真正的损失。在社交媒体驱动的当今世界,坏消息会很快传播开来,如果采用新技术时不注意道德行为,或将令企业面临重大的
72、财务和声誉风险。4.伦理道德考量26机器学习:科学向左,科幻向右|4.伦理道德的考量从理论上讲,由于被告的种族未被纳入算法的训练集中,这些算法没有种族偏向。但这些训练集是以历史数据为基础,而这些数据更多地来自于以往同执法活动联系较多的社区和人群。也就是说,这些社群很可能就业率较低,无法获得高质量的教育和医疗保健,并且具有其他已被实际证明存在种族偏向的特征。所以,虽然这些算法本身不带种族偏见,但它们仍有可能做出更加系统性的具有偏见的决策因为算法从数据中“学会”了种族偏见。这类偏见背后的问题甚至可能已经扩展到了作出有罪判决之前,也不只是针对再次犯案。就此而言,基于历史数据的算法可能会无意中回答了错
73、误的问题不是判断是否有罪,而是判断谁更该被捕。情境为了改进贷款违约预测,一款机器学习模型利用有关贷款申请、批准和违约记录的所有历史数据进行训练。该模型针对历史数据样本进行了测试,结果显示在预测违约方面具有较高的准确性。在批准上线之前,一家保险商还对申请和决策样本进行了审查。但几个月后一个明显规律显现出来了。在贷款申请被拒的人中,女性的比例明显过高。该保险商进一步调查发现,有一些申请其实应当批准。人们怀疑该模型对女性申请者存在偏向,因为它是基于过去数十年的历史数据建立的。而在该训练集中,女性单独申请贷款的比例较低,因此该模型偏向于拒绝更多来自该群体的贷款申请。对会计师来说,客观性基本原则可能会因
74、偏向问题而受到影响。这里主要是指避免因偏向、利益冲突或他人的不良影响而对专业或业务判断打折扣。因此,会计师必须考虑,自己是否会仅因为得到机器学习算法的支持,就偏向于赞同假设结果有效。另一方面,专业行为原则要求会计师遵守相关法律法规。如果有证据显示存在系统性偏向,那么该企业可能已违反了某些法律。例如,2012年修订的 欧盟指令 2004/113/EC等法规旨在禁止性别歧视。专业会计师可能会因内部压力而忽视该问题,如在有可能被认为证据不足。并且根据统计,算法也许会逐渐自我修正。例如,会计师可能需要发挥作用,指导同事重新评估模型,将重点放在性别变量方面。重要的是保留与管理层清晰的通讯记录,同时记录详
75、细信息、收到的回复,并在适当情况下上报相关部门。这一点的关键还在于,对与模型有关的输入和输出的基本了解,以及对衡量指标和关键绩效指标的看法。在收集反馈和监控这个问题时,关键绩效指标(例如客户投诉)可能成为指出这一问题的重要指标。始终秉持专业怀疑态度的质疑方法,以及愿意迎接全新挑战的成长型思维,将帮助专业会计师无所畏惧地对问题进行深入挖掘。数据的战略视角数据是推动机器学习应用唯一最重要且不可协商的要求。为了可持续地利用数据,企业需要制定统一的数据战略,这在实践中具有多方面的含义。首先,这意味着收集足够数量的数据。尽可能避免出现偏见,并给出有意义的结论,都取决于在可能需要考量的所有类别/类型拥有足
76、够的数据。不同类别的数据量和覆盖范数据是推动机器学习应用唯一最重要且不可协商的要求。为了可持续地利用数据,企业需要制定统一的数据战略。27机器学习:科学向左,科幻向右|4.伦理道德的考量如果破坏了企业的数据安全,所谓的“数据战略”所产生的所有来之不易的收益都可能毁于一旦。围有助算法识别人类或许无法识别的关联性。对专业会计师来说,“数据”可能不仅仅是指财务数据;它可能还需要财务之外其他部门持有的客户数据以及外部数据。这个数据收集过程可能需要跨多个部门进行协调。不应低估这种协调的重要性(以及可能的难度)。如调查显示,对于企业中谁应负责此类活动存在很多不同的看法(参见图4.1)。一旦企业可以获得大量
77、数据之后,第二步就是能够使用清晰的架构和标签存储数据。否则,即使有大量数据,也不可能找到特定算法所需的合适数据集:就类似如果没有好的搜索引擎,面对互联网中的海量数据,我们还是不能找到所需的信息。在大型复杂或全球性企业中,这一点可能尤为重要,因为这些企业的不同系统中长期存在着数据孤岛。全面重塑整个数据生态系统听上去可能不太现实,但若想实现机器学习的预期成效,企业或许应当重视这一工作的必要性(即使是逐步慢慢完成)。第三步是持续维护数据质量。这一点极其重要,因为算法本身并不具备智能化特征:只不过是“无用输入导致无用输出”的情况。因此,如果输入模型的数据质量差,那么获得的洞见也将不正确。有关数据质量的
78、战略方法意味着制定稳健的流程,以支持频繁进行数据清理,而不只是涉及外部顾问的一次性大规模数据清理。如果已实施上述三个步骤,为数据创建了基本的有利环境,那么数据战略的第四步就是进行风险管控。这涉及数据安全、数据失窃风险,以及更广泛意义上的网络安全。如果破坏了企业的数据安全,所谓的“数据战略”所产生的所有来之不易的收益都可能毁于一旦。随着获取的数据日益增多尤其是客户个人的数据,这些数据集将成为黑客攻击的目标。个人数据对诈骗者、洗钱者以及有组织犯罪具有越来越大的价值,这也加剧了黑客试图窃取数据的动机,或诱使员工提取数据出售给外部代理。数据战略并非是所有机器学习应用模式的直接组成部分,而是开始采用机器
79、学习之前所须具备的一项必要条件。同时很可能需要设置执行该战略特定部分(如创建架构)的专家。但总体数据战略需要统一、具有可实现性,并与回答有关企业未来发展的业务问题保持一致。对专业会计师来说,这是一个能带来巨大增值的领域,因为他们的工作需要经常从整个企业的系统中提取数据。更为重要的是,他们超越了技术,力图了解风险,控制薄弱环节,关注企业实现或没有实现盈n 财务/会计部门,40%n IT部门,14%n 战略团队,15%n 业务部门,13%n 不清楚,12%n 其他团队,5%14%12%15%40%13%5%图 4.1:企业中应当由谁来负责机器学习应用相关的流程和数据收集?28机器学习:科学向左,科
80、幻向右|4.伦理道德的考量利回报的领域,并对如何使用数据进行道德考量。将所有这些视角相结合起来,对于创建数据战略至关重要显然,这不仅仅是一项技术问题。情境某大型电信公司开发了一套综合全面的客户数据集以帮助创建算法,从而推动改善客户服务、营销和产品开发。该数据集包含大量的客户个人数据,其中包括姓名和住址、账单记录、地理位置信息、以及近期和历史通话记录。为了充分利用这个数据池,公司组建了一个数据科学家团队。汇集所有必要技能难度很大,因此这个小型团队既有内部员工(其中有些是新员工),也包括了外部的工作人员。由于其工作的探索性质以及较小的团队规模,因此所有团队成员都拥有整个数据池的完全访问权。这就带来
81、了一个风险即数据湖可能成为黑客(外部代理)攻击的目标,或者数据可能被员工滥用,从而严重损害公司的声誉和客户满意度,并导致客户索赔或监管罚款。在这方面,专业胜任能力和应有的关注至关重要,首先要认识到潜在的数据泄露违规行为。专业会计师需要了解日益增加的数据风险、监管要求、以及违反这些规定带来的经济影响。在实践层面,会计师可能需要有能力确定和评估,自身对数据湖的控制是否到位,并且对员工和团队中的外部人员进行背景调查。从风险管理的角度看,他们或许还需要量化数据泄漏对企业及其声誉产生的潜在影响。另一个可能受到影响的基本原则是保密原则。公司可能会做出明智的决定,尽可能限制对数据池的使用,这部分原因是将其作
82、为具有竞争优势的知识产权,但也是为了避免引起潜在黑客的关注。例如,这可能包括限制向外部利益相关者或特定团队以外的员工提及数据池。有时,它可能还意味着使用加密技术,最大限度减少个人数据丢失,或者要求数据湖团队成员签署补充保密协议。鉴于这种环境,专业会计师或许需要特别注意保持有关数据池的任何信息以及相关控制和流程的保密性。从广义上讲,了解总体数据战略对于确保全局观非常重要。如果将数据泄漏视为全面了专业会计师需要了解与日俱增的数据风险、监管要求以及违反这些规定带来的经济影响。29机器学习:科学向左,科幻向右|4.伦理道德的考量许多专家指出,符合伦理道德的健全机器学习解决方案应遵循一项重要原则:这些解
83、决方案的设计不应改变社会、文化和法律所确立的责任模式。解企业数据管理方式及其原因的一部分,那么就不可能发生数据泄漏问题:实际上,这些控制提供了风险管理与防护,而不只是逐项检查是否遵守了事先规定的流程要求。分配问责就核心而言,机器学习应用程序属于决策工具的范畴。而此类活动的核心涉及一则重要问题:谁应为所做决策的后果负责,是专业会计师还是算法?明确并一致地处理该问题将是未来几年的关键重点,否则我们将面临风险。当事情进展顺利,技术就功不可没;而当出现问题时,则由人来承担责任而这对那些试图利用该技术的人来说,似乎没有赢面。从医疗诊断到无人驾驶、再到信用风险分析,机器学习的目的在于帮助提高决策速度和质量
84、。许多专家指出,符合伦理道德的健全机器学习解决方案应遵循一项重要原则:这些解决方案的设计不应改变社会、文化和法律所确立的责任模式。例如下面三种情况:如果医生使用机器学习算法来帮助诊断疾病,那么医生仍然要为该诊断负法律和道德责任。如果银行从软件供应商处购买机器学习算法,用来帮助确定贷款申请人是否具有信用,则银行仍然是做出该决策的实体。软件供应商没有银行执照,也没有贷款或做出决策的权力。当发生车祸时,现有的成熟法律判例可以明确哪些情况应由汽车制造商负责、哪些则由司机负责。部署完全或半自动驾驶车辆的技术能力只不过提出了如何将这些法律判例应用于新技术的程序问题,但并不能推翻这些先例。人工智能领域正密切
85、关注一则动向德国联邦卡特尔局(FCO)宣布对汉莎航空(Lufthansa)的不公平定价展开调查。在廉价竞争对手柏林航空(Air Berlin)破产后不久,汉莎航空的机票价格上涨了30%14。汉莎对此答复说,价格上涨并非出于掠夺目的,因为该价格由自动化的算法确定,而非获悉柏林航空破产后人为做出的决定。FCO主席安德烈亚斯蒙德特(Andreas Mundt)公开反驳称,汉莎航空的理由不可接受,“算法与此毫无关系。这些算法并不是上帝所写,公司绝不能以此作为挡箭牌。”15这一案例带给我们的教训是,在任何机器学习应用程序设计中,问责模式都至关重要。当新的决策支持工具寻求监管批准或切实得到市场认同时,企业
86、应当明确阐述关于这些问责模式的主张,并给其他人对这些主张提出质疑或展开讨论提供机会。与此相关的理念之一,就是支持决策与替代决策的选择。换言之,一款特定机器学习应用程序的构建,是为了提高人工决策的质量还是取而代之?下面是两种具体示例。医疗诊断工具通常被设计为决策支持工具。其任务是通过分析更多研究、数据规律以及实证结果来提高人类医生的诊断质量而这些是任何一个医生在单次14 https:/ https:/ 是,59%n 否,41%59%41%图 4.2:您是否对知名供应商提供的“暗箱型”机器学习算法感到放心?31机器学习:科学向左,科幻向右|4.伦理道德的考量虽然“黑箱”在某些情况下可能会成为问题,
87、但它应该不会阻碍专业会计师参与、学习和不断质疑眼前的新事物。其他行动的相关知识或理解力,他们便只能接受现状。这种情况经常被比喻为构造不详的“黑箱”;而对专业会计师来说,很现实的问题在于,能否审视复杂机器学习算法的内部工作原理。调查揭示了在处理这一问题时的普遍看法。大多数受访者表示,他们很放心知名供应商提供的算法(参见图4.2)。但尽管如此,多数人对此仍表示存有一定程度的担心,并且希望算法的可解释性比人类更高(参见图4.3)。关于“可解释性”这一领域,有几个要点值得考虑。首先,会计师可以通过咨询相关模型开发人员以提高对机器学习的了解。会计师自己不一定要成为机器学习模型方面的专家或是对复杂的数学算
88、法了如指掌。但他们需要对机器学习模型有一定程度的了解,从而能够有意义地参与到当下情形之中。其次,通常在“黑箱”环境下,连模型开发者自己也无法解释机器学习模型如何得出结果,因为这往往是使用神经网络和深度学习的结果(其中可能涉及图像或其他复杂的数据类型)。数据的复杂性令人很难理解机器学习系统如何得出其结果。相比之下,在很多商业应用模式中,算法处理的是相对结构化的数据(如数量、价格、商品代码等),因此更有可能从实际出发解释算法的具体运行。第三,在更深层次的哲学层面上,可解释性是专业会计师在人为决策时也很可能会面临的问题。我们难以就所有的情况都明确解释为何做出该决策,因此也不可能(像对算法的期望那样)
89、非常精细地列出做出该决策图 4.3:相对于人类做出同样的决策,您希望算法能够达到何种程度的可解释性?超过人低于人16%12%51%21%60%50%40%30%20%10%0与人相同不清楚32机器学习:科学向左,科幻向右|4.伦理道德的考量的每一个精确步骤。事实上,经验和“直觉”往往非常宝贵,并且当利用这些能力时,决策背后的理由或许无法被一步一步地解构。因此,虽然“黑箱”在某些情况下可能会成为问题,但它应该不会阻碍专业会计师参与、学习和不断质疑眼前的新事物。即使满足胜任能力要求,专业会计师也可能在诚信这一基本原则上面临妥协风险。这是因为,道德行为要求在所有的职业和商业关系中都做到坦率诚实。而人
90、们有理由对于企业是否对客户做到了坦率诚实提出质疑。有人可能认为,企业没有责任充当客户的“监护人”或“道德警察”,客户作为成年人,应自行做出购买决定。但围绕收集个人数据的范围及针对相关客户特定弱点使用数据,企业很可能会出现不诚信行为。最终,这些问题的解决办法将取决于个案的具体状况。但在处理过程中,某些行动显然将遭受商业压力,专业会计师必须遵循诚信原则来指导决策。特别是应格外注意,不能只是满足合法性的最低要求,而忽视更高的道德行为标准。“泡沫”背后近年来,人工智能已成为一个耳熟能详的“流行语”,而作为人工智能的一部分的机器学习往往也引起人们的同等关注。毫无疑问,使用机器学习能带来切实好处,但不切实
91、际的期望以及销售这种技术的既得利益者,可能会曲解技术带来的收益,从而导致实际风险。有关人工智能的广泛宣传使人们相信很多公司都已将人工智能和机器学习相关应用纳入其战略规划当中,每家软件公司都已经或即将开发出人工智能/机器学习能力。这进而使投资者产生了所有公司都应使用人工智能/机器学习创造更高价值的期望。一项研究发现,过去十年里,在财报和投资者电话会议上(earnings calls),“人工智能”一词的提及频率是“大数据”的近四倍16。为了争取获得这一能力,企业需要评估(五花八门的)人工智能/机器学习市场上可用应用程序的质量;同时还有必要评估,软件供应商和咨询师的很多主张是否有充足理据支持。企业
92、不应因为害怕落后就在未适当评估的情况下盲目推动投资决策。虽然有些应用程序的价值会得到证明,但也可能存在另一种情况即企业声称拥有人工智能产品,而实际上是由人来模拟人工智能。这样做的目的可能是为了在满足市场需求,但相对应的软件能力尚在开发之中。为了争取获得这一能力,企业需要评估(五花八门的)人工智能/机器学习市场上现有应用程序的质量。备注:采用五分制打分;重要的净比例为打4、5分的受访者之和;不重要的净比例为打1、2分的受访者之和。图 4.4:通过对系统要素进行第三方认证来提高对机器学习信任度的重要性16 https:/ 净比例:重要 n 净比例:不重要16%65%13%62%13%33机器学习:
93、科学向左,科幻向右|4.伦理道德的考量关于人工智能的信息不对称、以及由此产生的利用虚假承诺欺骗公众(包括付费客户)的可能性,可能导致更多的舞弊现象。还有一些情况,企业可能仍在安排工作人员“训练”产品即产品虽然只是真实存在,但尚未完成开发。在调查中,受访者对第三方认证的必要性持支持态度。这能够以独立视角来认证,机器学习应用程序在普遍情形下、以及特定环境中的表现(参见图4.4)。情境某中型独立财务顾问公司的首席执行官(CEO)最近加强了对人工智能趋势的了解和增强了对其的信心,因而不希望错失这一机遇。公司拿到了某技术供应商提供的一份演示文稿,详细介绍了其产品。CEO认为,该款产品将给自身企业效率带来
94、“革命性”的提高。这家软件商创立不久,目前已开发出能分析和回答客户问题的机器学习功能。虽然从概念上讲这并非全新技术,但其声称对机器学习的使用充分依托了该领域早期不太复杂的尝试,能够达到以前所未有的程度模拟企业-客户之间的互动。CEO希望能够抢占先机,所以准备签下价值不菲的合同并开始使用其提供的软件。参与本次采购决策的专业会计师可能需要考虑诚信原则。对高层支持的决策提出质疑并非易事,但他们的确有必要对感知到的实情直言不讳。弄清事实将不可避免地需要对产品有所了解,而这又涉及到专业胜任能力和应有的关注这一基本原则。要想向内部利益相关者坦诚地表达自己的看法,就需要阐明产品的哪些方面能够、哪些则不能够得
95、到可靠验证以确保建立明确的机遇和风险共识。例如,这家初创组织的技术产品或许非常有前景,但其说法能否得到独立第三方的核实?是否有可能以某种方式获得软件完全自动化的保证,而无需人员参与、或手动处理?初创公司是否有稳定的资金来源,还是可能面临业务获取压力,抑或出于资金压力而吹嘘产品?是否有信心可靠地处理数据,并充分应对有关保护、隐私和个人数据等方面的考量?通过这些质询以及本着专业职业怀疑精神所做的思考,会计师可由此洞察并其与初创企业的声明(特别是公开的产品或宣传材料)进行对比。道德指南规定,专业会计师应当远离虚假或误导性的信息。服务公共利益在公共利益和公共价值方面,技术可能引发更广泛、更普遍的问题。
96、其结果是,专业会计师、特别是在商业环境中工作的专业会计师,可能发现自己受到不同方向力量的牵制。从某种意义上说,这超越了本节目前所谈及的所有道德风险考虑。但有必要特别指出,由于它涉及机器学习造成意外后果的影响,而无论这些后果是否直接与所采用的技术相关,它们都可能会损害无辜相关者的利益。当应对偏见时,保障公共利益需要规避体现出历史偏见的算法,以使边缘群体免遭系统性歧视。在数据战略方面,对于如何使用或共享大量人群的医疗数据集,特别是如果集34机器学习:科学向左,科幻向右|4.伦理道德的考量中的或公共的系统意味着这些数据很容易大量获取,那么考虑公共利益就很有必要。同样,在分配问责方面,除牵涉个人和企业
97、外,或许存在着更为广泛的问题,无人驾驶车辆就很具典型。有关人工智能的信息不对称,以及由此产生的、利用虚假承诺欺骗公众(包括付费客户)的可能性,或将引发更多舞弊现象。披露和透明度可能对更广泛的公共利益产生影响。就这一点而言,虽然受访者之间存在着一些细微差别,但是受访者通常倾向于对使用机器学习进行披露,如图4.5所示。对专业会计师来说,IESBA确立的基本原则为面对道德问题提供了指南。这些原则必须根据当前情况进行解读,这对于应对新技术和未曾出现的新情境至关重要。例如,在某些情况下,或许需要考虑引入外部利益相关者。在这种情境下,或许适用IESBA制定的NOCLAR(不遵守法律法规情况)应对要求。IE
98、SBA框架旨在指导专业会计师采用一种已引入管理层/内部上报为基础的方法,如果内部咨询未能产生适当回应,则应通过实体外部的相关机构采取进一步行动。需要指出的是,应用道德基本原则不能只是循规蹈矩 搞 形 式 主 义。例 如,在 上 面 的 例 子中,NOCLAR情况可能意味着,出于公共利益则有充分理由与相关外部机构共享敏感数据,则必须搁置保密原则。更广泛的讲,为了维护公共利益,需要避免将仅满足合规最低要求作为基本原则。这些基本原则必须渗透到专业会计师履行职责的各个方面。更广泛的讲,为了维护公共利益,需要避免将仅满足合规最低要求作为基本原则。n 始终应当,38%n 一般来说应当,除非拥有不披露使用机
99、器学习的具体理由(如商业、法律或监管理由),44%n 一般来说不必,除非拥有披露使用机器学习的具体理由(如商业、法律或监管理由),17%n 完全不必,1%17%44%38%1%图 4.5:您认为企业是否应当明确披露由机器学习算法做出的决策?专业会计师需要充分认识机器学习对其所在组织的影响。机器学习的利用可能会影响其追踪和干预企业的价值创造方式,因此需要调整风险与控制机制,抑或进行充分考量道德影响。ACCA资格认证的指南,ACCA职商能力框架(参见图5.2)也体现了这一理念:即数字商(DQ)是一系列“职商”中的一种,这些职商相互关联,共同为构建数字时代中“面向未来”的专业会计师。技术包括人工智能
100、等最复杂的技术,目前仍然很难完全复制人类所具备的情景理解和综合思考能力。人们似乎普遍认为,无论是建立客户关系还是领导成功的团队,都不可能完全消除人为监督因素,而且技术也无法考虑人性因素。ACCA关于情商的研究工作,也有力地证明了 数 字 时 代 对 情 商 相 关 能 力 的 需 求(ACCA,2018年)。事实上,数字商和情商是相辅相成的技能,专业会计师只有将二者恰当结合起来,才能在数字时代发挥真正有效的作用。35调查结果显示,受访者在需要复杂判断和解读的领域对允许算法发挥主导作用持有一定程度的顾虑。根据所需的决策类型,只有十分之一(10%)到三分之一(33%)的受访者认为,可以由机器算法发
101、挥主导作用或完全依赖机器算法来做判断(参见图5.1)。显然,技术是影响财会行业未来发展方向的重要因素。但技术只是一项推动因素,人和流程等更广泛的因素也将发挥作用。作为5.机器学习环境中的技能备注:采用五分制打分;发挥主导作用或完全依赖的净比例是打4、5分的受访者之和;没有发挥任何作用或发挥一些作用的净比例是打1、2分的受访者之和。图 5.1:在复杂情境下,机器学习在进行恰当判断方面发挥了何种作用?衡量财会预测指标资产负债的认定和终止确认36%80%70%60%50%40%30%20%10%0陈述和披露n 净比例:机器学习发挥主导作用/完全依赖机器学习 n 净比例:机器学习没有发挥任何作用/发挥
102、了一些作用40%35%40%29%47%会计政策的选择和应用道德判断选择,如技术上合法、但不确定是否符合职业道德的情境24%商业判断,如企业的未来发展前景52%16%62%10%74%36机器学习:科学向左,科幻向右|5.机器学习环境中的技能随着人工智能及其组成部分不断发展演变,专业会计师需要保持高度参与,虽然专业会计师无须深入探究人工智能背后的技术细节。即使在构建领导力等领域之外,核心专业技术活动也需要利用多种能力进行判断和理解。而且在这些领域,未来的选择也不可能完全基于对过去的理解而决定。会计师的角色涉及很多熟悉领域的职业,如审计、企业报告或税务等。不过为了有效执行这些任务,人们同样期待专
103、业会计师能拥有自己的观点,并对观点及其后果负责。法律体系、社会和文化价值建立的原则基础在于,只有个人或公司实体才能承担责任。在当前阶段,似乎没有人同意可以将这一原则以及相关法律所规定的责任向外转移给人工智能算法。几乎所有的机器学习工具甚至是纯粹的非监督式学习算法,都依赖于开发人员所具有的知识领域和专长。“分箱”(binning)工作能够将原始数据转换成离散指标,构建训练数据集,以便机器学习算法加以利用,并从中得出推论。这既是“科学”,也是“艺术”,并且通常需要训练有素的技术专家、数据科学家和行业专家通力协作才能成功。但是,这并不意味着可以忽视人工智能的作用。毋庸置疑,当我们展望未来,随着人工智
104、能日益广泛的应用,一些新技能会变得更加普遍,例如数据科学家。同时,由于会计方法越来越依赖机器学习,需要更加充分地利用机器学习技术,并使财会工作与数据和统计所主导的洞察紧密联系起来。数据科学家可以在评估某一情况下应使用何种机器学习工具、以及机器学习应用程序中是否存在固有道德问题等领域提供相关建议。随着人工智能及其组成部分不断发展演变,专业会计师需要保持高度参与,虽然专业会计师无须深入探究人工智能背后的技术细节。不过至少,所有财务专业人士都应当持续了解人工智能的发展演变,并留意发展中的各项能力如何与自身角色相重叠。这其中涉及的范围,从怎样在工作中利用人工智能提高效率,更好地为客户或雇主服务一直延伸
105、至帮助客户和雇主确定最有效的采纳和使用人工智能的方法。本报告在有关应用的章节中介绍了市场上的一些具体实例,目的恰在于此。附录3就如何跟进该领域的最新发展动态提出了一些建议。图 5.2:ACCA职商技能框架?TEQ?IQ?XQ?VQ?CQ?DQ?EQ?结束语37关于机器学习和人工智能的讨论正日趋成熟。有的人会积极拥抱这一趋势;有的人则会害怕。然而一味地避而远之,定是轻率之举。现在,正是开始积累该领域知识和认识的大好时机。机器学习技术不再是脱离实际的凭空幻想,而已真正应用于商业之中。与此同时,人工智能领域的流程和方法尚未最终定型。因此,未来几年人们将如何发展、克服挑战和重新进行定义,都可能对这些技
106、术产生深远影响。更重要的是,我们应确保机器学习及相关技术的每种应用都具有长期价值的可持续性,同时不会给企业和社会带来无法承受的负面影响。38国际会计师职业道德准则理事会(IESBA)在其发布的守则中阐述了以下基本原则:1.诚信在所有专业和业务关系中应保持坦诚与正直。2.客观性不会因偏向、利益冲突或他人的不当影响,损害专业或业务判断。3.专业胜任能力和应有的关注:1)基于当前的技术和专业标准、以及相关法规,获得并保持客户或雇主方所需的专业知识和技能水平,确保为其提供合格的专业服务;2)依照适用的技术和专业标准努力行事。4.保密保证因专业和业务关系所获得信息处于机密状态。5.专业行为遵守相关法律法
107、规,避免专业会计师知道或应当知道的行为可能会使本行业丧失信誉。附录 139附录 2国别概况1.英国 402.中国 413.马来西亚 424.新加坡 435.阿联酋 446.爱尔兰 457.巴基斯坦 4640机器学习:科学向左,科幻向右|附录2 国别概况 英国23%53%40%14%26%58%34%13%44%38%20%24%25%21%6%8%4%6%2%3%33%31%25%21%10%7%36%35%29%24%16%10%37%40%14%15%12%13%19%12%5%5%44%46%22%23%24%16%52%49%24%21%19%17%12%14%11%11%13%14%
108、英国调查问题1:人工智能是“泡沫”,还是现实备注:其余受访者表示“一半是“泡沫”,一半是现实”全部/大部分是”泡沫“大部分/全部是现实n 现在 n 三年内 XX%全球70%60%50%40%30%20%10%0英国调查问题3:企业的机器学习应用情况没有应用计划不清楚50%40%30%20%10%0初步讨论和探索概念/想法n 英国 n 全球早期准备阶段,将在12个月内“上线”高级测试阶段,将在3-6个月内“上线”在完全运行模式下处理实时数据英国调查问题4:在复杂情境下,机器学习在进行恰当判断方面发挥了何种作用?衡量财会预测指标资产负债的认定和终止确认50%40%30%20%10%0陈述和披露净比
109、例:机器学习发挥主导作用/完全依赖机器学习 n 英国 n 全球会计政策的选择和应用道德判断,如技术上合法、但不确定是否符合职业道德的情境商业判断,如企业的未来发展前景英国调查问题2:企业中应当由谁来负责机器学习应用相关的流程和数据收集?财务/会计部门战略团队n 英国 n 全球70%60%50%40%30%20%10%0业务部门不清楚其他团队英国调查问题5:请说明在使用机器学习方面,企业整体上面临的主要障碍缺乏熟练员工来牵头应用数据质量较差70%60%50%40%30%20%10%0对成本的影响n 英国 n 全球使用机器学习没有明显的收益数据量不足不清楚/没有障碍监管/法律要求道德困境IT部门4
110、1机器学习:科学向左,科幻向右|附录2 国别概况 中国23%54%30%12%26%58%34%13%42%38%19%24%20%21%10%8%5%6%4%3%34%34%26%27%15%15%36%35%29%24%16%10%38%40%12%15%11%13%21%12%3%5%57%55%23%27%10%22%52%49%24%21%19%17%18%14%5%11%14%14%中国调查问题1:人工智能是“泡沫”,还是现实备注:其余受访者表示“一半是“泡沫”,一半是现实”全部/大部分是”泡沫“大部分/全部是现实n 现在 n 三年内 XX%全球70%60%50%40%30%20%
111、10%0中国调查问题3:企业的机器学习应用情况没有应用计划不清楚50%40%30%20%10%0初步讨论和探索概念/想法n 中国 n 全球早期准备阶段,将在12个月内“上线”高级测试阶段,将在3-6个月内“上线”在完全运行模式下处理实时数据中国调查问题4:在复杂情境下,机器学习在进行恰当判断方面发挥了何种作用?衡量财会预测指标资产负债的认定和终止确认50%40%30%20%10%0陈述和披露净比例:机器学习发挥主导作用/完全依赖机器学习 n 中国 n 全球会计政策的选择和应用道德判断,如技术上合法、但不确定是否符合职业道德的情境商业判断,如企业的未来发展前景中国调查问题2:企业中应当由谁来负责
112、机器学习应用相关的流程和数据收集?财务/会计部门战略团队n 中国 n 全球70%60%50%40%30%20%10%0业务部门不清楚其他团队中国调查问题5:请说明在使用机器学习方面,企业整体上面临的主要障碍缺乏熟练员工来牵头应用数据质量较差70%60%50%40%30%20%10%0对成本的影响n 中国 n 全球使用机器学习没有明显的收益数据量不足不清楚/没有障碍监管/法律要求道德困境IT部门42机器学习:科学向左,科幻向右|附录2 国别概况 马来西亚27%59%29%11%26%58%34%13%36%38%20%24%28%21%10%8%5%6%2%3%41%40%35%30%21%17
113、%36%35%29%24%16%10%34%40%16%15%16%13%18%12%2%5%69%54%32%21%14%19%52%49%24%21%19%17%10%14%14%11%14%14%马来西亚调查问题1:人工智能是“泡沫”,还是现实备注:其余受访者表示“一半是“泡沫”,一半是现实”全部/大部分是”泡沫“大部分/全部是现实n 现在 n 三年内 XX%全球70%60%50%40%30%20%10%0马来西亚调查问题3:企业的机器学习应用情况没有应用计划不清楚50%40%30%20%10%0初步讨论和探索概念/想法n 马来西亚 n 全球早期准备阶段,将在12个月内“上线”高级测试阶
114、段,将在3-6个月内“上线”在完全运行模式下处理实时数据马来西亚调查问题4:在复杂情境下,机器学习在进行恰当判断方面发挥了何种作用?衡量财会预测指标资产负债的认定和终止确认50%40%30%20%10%0陈述和披露净比例:机器学习发挥主导作用/完全依赖机器学习 n 马来西亚 n 全球会计政策的选择和应用道德判断,如技术上合法、但不确定是否符合职业道德的情境商业判断,如企业的未来发展前景马来西亚调查问题2:企业中应当由谁来负责机器学习应用相关的流程和数据收集?财务/会计部门战略团队n 马来西亚 n 全球70%60%50%40%30%20%10%0业务部门不清楚其他团队马来西亚调查问题5:请说明在
115、使用机器学习方面,企业整体上面临的主要障碍缺乏熟练员工来牵头应用数据质量较差70%60%50%40%30%20%10%0对成本的影响n 马来西亚 n 全球使用机器学习没有明显的收益数据量不足不清楚/没有障碍监管/法律要求道德困境IT部门43机器学习:科学向左,科幻向右|附录2 国别概况 新加坡25%63%32%11%26%58%34%13%35%38%27%24%13%21%13%8%6%6%6%3%40%33%30%27%17%16%36%35%29%24%16%10%46%40%16%15%22%13%2%12%3%5%57%48%27%19%13%16%52%49%24%21%19%17
116、%6%14%5%11%11%14%新加坡调查问题1:人工智能是“泡沫”,还是现实备注:其余受访者表示“一半是炒作一半是现实”全部/大部分是”泡沫“大部分/全部是现实n 现在 n 三年内 XX%全球70%60%50%40%30%20%10%0新加坡调查问题3:企业的机器学习应用情况没有应用计划不清楚50%40%30%20%10%0初步讨论和探索概念/想法n 新加坡 n 全球早期准备阶段,将在12个月内“上线”高级测试阶段,将在3-6个月内“上线”在完全运行模式下处理实时数据新加坡调查问题4:在复杂情境下,机器学习在进行恰当判断方面发挥了何种作用?衡量财会预测指标资产负债的认定和终止确认50%40
117、%30%20%10%0陈述和披露净比例:机器学习发挥主导作用/完全依赖机器学习 n 新加坡 n 全球会计政策的选择和应用道德判断,如技术上合法、但不确定是否符合职业道德的情境商业判断,如企业的未来发展前景新加坡调查问题2:企业中应当由谁来负责机器学习应用相关的流程和数据收集?财务/会计部门战略团队n 新加坡 n 全球70%60%50%40%30%20%10%0业务部门不清楚其他团队新加坡调查问题5:请说明在使用机器学习方面,企业整体上面临的主要障碍缺乏熟练员工来牵头应用数据质量较差70%60%50%40%30%20%10%0对成本的影响n 新加坡 n 全球使用机器学习没有明显的收益数据量不足不
118、清楚/没有障碍监管/法律要求道德困境IT部门44机器学习:科学向左,科幻向右|附录2 国别概况 阿联酋21%55%40%18%26%58%34%13%46%38%27%24%12%21%5%8%5%6%5%3%46%46%41%39%29%15%36%35%29%24%16%10%63%40%10%15%7%13%7%12%0%5%49%56%24%29%20%12%52%49%24%21%19%17%15%14%17%11%12%14%阿联酋调查问题1:人工智能是”泡沫“,还是现实备注:其余受访者表示“一半是”泡沫“,一半是现实”全部/大部分是”泡沫“大部分/全部是现实n 现在 n 三年内
119、XX%全球70%60%50%40%30%20%10%0阿联酋调查问题3:企业的机器学习应用情况没有应用计划不清楚50%40%30%20%10%0初步讨论和探索概念/想法n 阿联酋 n 全球早期准备阶段,将在12个月内“上线”高级测试阶段,将在3-6个月内“上线”在完全运行模式下处理实时数据阿联酋调查问题4:在复杂情境下,机器学习在进行恰当判断方面发挥了何种作用?衡量财会预测指标资产负债的认定和终止确认50%40%30%20%10%0陈述和披露净比例:机器学习发挥主导作用/完全依赖机器学习 n 阿联酋 n 全球会计政策的选择和应用道德判断,如技术上合法、但不确定是否符合职业道德的情境商业判断,如
120、企业的未来发展前景阿联酋调查问题2:企业中应当由谁来负责机器学习应用相关的流程和数据收集?财务/会计部门战略团队n 阿联酋 n 全球70%60%50%40%30%20%10%0业务部门不清楚其他团队阿联酋调查问题5:请说明在使用机器学习方面,企业整体上面临的主要障碍缺乏熟练员工来牵头应用数据质量较差70%60%50%40%30%20%10%0对成本的影响n 阿联酋 n 全球使用机器学习没有明显的收益数据量不足不清楚/没有障碍监管/法律要求道德困境IT部门45机器学习:科学向左,科幻向右|附录2 国别概况 爱尔兰32%56%38%20%26%58%34%13%38%38%30%24%17%21%
121、7%8%7%6%1%3%30%38%26%15%12%2%36%35%29%24%16%10%39%40%14%15%15%13%12%12%5%5%43%42%28%18%21%12%52%49%24%21%19%17%21%14%11%11%14%14%爱尔兰调查问题1:人工智能是”泡沫“,还是现实备注:其余受访者表示“一半是”泡沫“,一半是现实”全部/大部分是”泡沫“大部分/全部是现实n 现在 n 三年内 XX%全球70%60%50%40%30%20%10%0爱尔兰调查问题3:企业的机器学习应用情况没有应用计划不清楚50%40%30%20%10%0初步讨论和探索概念/想法n 爱尔兰 n
122、全球早期准备阶段,将在12个月内“上线”高级测试阶段,将在3-6个月内“上线”在完全运行模式下处理实时数据爱尔兰调查问题4:在复杂情境下,机器学习在进行恰当判断方面发挥了何种作用?衡量财会预测指标资产负债的认定和终止确认50%40%30%20%10%0陈述和披露净比例:机器学习发挥主导作用/完全依赖机器学习 n 爱尔兰 n 全球会计政策的选择和应用道德判断,如技术上合法、但不确定是否符合职业道德的情境商业判断,如企业的未来发展前景爱尔兰调查问题2:企业中应当由谁来负责机器学习应用相关的流程和数据收集?财务/会计部门战略团队n 爱尔兰 n 全球70%60%50%40%30%20%10%0业务部门
123、不清楚其他团队爱尔兰调查问题5:请说明在使用机器学习方面,企业整体上面临的主要障碍缺乏熟练员工来牵头应用数据质量较差70%60%50%40%30%20%10%0对成本的影响n 爱尔兰 n 全球使用机器学习没有明显的收益数据量不足不清楚/没有障碍监管/法律要求道德困境IT部门46机器学习:科学向左,科幻向右|附录2 国别概况 巴基斯坦30%65%31%11%26%58%34%13%33%38%28%24%17%21%8%8%9%6%5%3%37%35%36%29%17%15%36%35%29%24%16%10%41%40%15%15%8%13%9%12%9%5%51%53%23%17%21%21
124、%52%49%24%21%19%17%14%14%12%11%18%14%巴基斯坦调查问题1:人工智能是”泡沫“,还是现实备注:其余受访者表示“一半是”泡沫“,一半是现实”全部/大部分是”泡沫“大部分/全部是现实n 现在 n 三年内 XX%全球70%60%50%40%30%20%10%0巴基斯坦调查问题3:企业的机器学习应用情况没有应用计划不清楚50%40%30%20%10%0初步讨论和探索概念/想法n 巴基斯坦 n 全球早期准备阶段,将在12个月内“上线”高级测试阶段,将在3-6个月内“上线”在完全运行模式下处理实时数据巴基斯坦调查问题4:在复杂情境下,机器学习在进行恰当判断方面发挥了何种作
125、用?衡量财会预测指标资产负债的认定和终止确认50%40%30%20%10%0陈述和披露净比例:机器学习发挥主导作用/完全依赖机器学习 n 巴基斯坦 n 全球会计政策的选择和应用道德判断,如技术上合法、但不确定是否符合职业道德的情境商业判断,如企业的未来发展前景巴基斯坦调查问题2:企业中应当由谁来负责机器学习应用相关的流程和数据收集?财务/会计部门战略团队n 巴基斯坦 n 全球70%60%50%40%30%20%10%0业务部门不清楚其他团队巴基斯坦调查问题5:请说明在使用机器学习方面,企业整体上面临的主要障碍缺乏熟练员工来牵头应用数据质量较差70%60%50%40%30%20%10%0对成本的
126、影响n 巴基斯坦 n 全球使用机器学习没有明显的收益数据量不足不清楚/没有障碍监管/法律要求道德困境IT部门47研究消费应用和功能如何与人工智能技术和能力相结合,应成为紧跟基本形势发展的着手点。其关注范围,可以包括智能手机应用、软件、网络应用程序、消费设备、物联网设备、自动驾驶汽车和无人机等,不一而足。附录 347对于这些新功能,技术出版物是获得其实用细节信息的有效来源。TED演讲也可成为深入了解人工智能技术等一系列课题的有用方式。TED网站上提供的在线内容广泛覆盖了各种主题,并且播放时长均不超过18分钟。MeetUp小组作为一种简便易行的方法,可以帮助讨论者深入了解技术(包括人工智能)、扩展
127、个人认知,并同直接参与人工智能开发和使用的人员建立联系。许多组织都在持续举办“创客马拉松”活动,以创新方式快速构建和测试使用新技术的想法。技术和业务专业人员的通力协作,能够使这些举措产生最佳成效;因此,财务专业人员也可从中获得参与和了解更多信息、以及展示业务增值点的绝好机遇。人工智能是一项易于引发情绪激动的话题,很可能在数据获取与共享、岗位、就业和培训等方面造成担忧。会计师应密切留意媒体有关以下事项的报道:人工智能及其就业影响;政府的就业和培训政策;以及消费者意见研究与调查。财会专业人员务必就人工智能对社会的影响,广泛了解各方看法。对于人工智能的发展方向、以及如何应对社会和道德挑战,AI4Pe
128、ople等论坛可以提供极富价值的洞察。来自软件供应商和咨询机构的案例研究,为我们知晓最新技术如何得到部署提供了信息来源,尽管其中不可避免地存在着倾向性,但它们的确展示出了正在实现的各种益处。许多软件供应商还将推出有关人工智能的培训。与此同时,Gartner、Forrester和IDC等技术分析机构也在持续发布研究报告和调查结果,并以展示和说明供应商提供的实用功能为侧重点,围绕人工智能和机器学习等主题开展评比活动。有关人工智能和机器学习等领域应用程序的另一种信息来源,便是各类旨在促进业务和技术人员协作的组织如Digital Catapult。该渠道的特点之一,就是介绍那些由尚不具备广泛知名度的初
129、创企业所打造的软件。此外,EdX等独立的教育服务机构亦开设了特定的人工智能和机器学习课程。17 19 http:/www.eismd.eu/ai4people/20 https:/www.digicatapult.org.uk/21 https:/www.edx.org/course/machine-learning-columbiax-csmm-102x-4 https:/www.edx.org/course/artificial-intelligence-ai-columbiax-csmm-101x-4PI-MACHINE-LEARNING ACCA The Adelphi 1/11 John Adam Street London WC2N 6AU United Kingdom/+44(0)20 7059 5000/