导语:碎片化的信息/知识+碎片化的逻辑构成了人类的智能,碎片化的信息/知识+碎片化的逻辑+隐/显性的伦理构成了人类的智慧
智慧的层次结构可以形象的用以下的图表示,这张图非常奥妙,下面我来解释一下。
数据:99
通过这个你能看出什么吗?估计很难?
原始的、未编码的事件、经历和现象、出生,死亡、市场交易、投票、音乐、下载、降水、足球比赛等等都是数据。
数据可以是连续的值,比如声音、图像,称为模拟数据。也可以是离散的,如符号、文字,称为数字数据。在计算机系统中,数据以二进制信息单元0,1的形式表示。
一只数据团队中,做数据平台和数据采集的人是最接近数据的,大多数数据从业者每天其实并不是在跟数据打交道。
我们经常说“ 水的温度是100℃,礼物的重量是500克,木头的长度是2米,大楼的高度100层“。通过水,温度,100℃,礼物,重量,500克,木头,长度,2米,大楼,高度,100层这些关键词,我们的大脑里就形成了对客观世界的印象。这些约定俗成的字符或关键词就构成了我们探讨的数据基础,我们提到关键词必须是人们约定俗成的。这就表示不同阶级,不同宗教。不同国家的人对于关键词的约定必然会有差异。由此我们可以推导出数据其实也具有一个使用范围。不同领域的人在描述同一事物会出现不同的数据。例如,中国人会称每个星期的最后一天为”星期天“。美国人会把这一天叫做“Sunday”。基督教徒会称这一天为“礼拜天”. 数据的有范围性导致由此建立的信息世界,知识世界在不同的国家。不同的宗教,不同的阶级中会产生差异。认识到数据的有范围性可以帮助我们在一个领域进行知识管理时,首先要统一关键词或数据的约定。
最后我们对数据进行这样的定义:数据是使用约定俗成的关键词,对客观事物的数量、属性、位置及其相互关系进行抽象表示,以适合在这个领域中用人工或自然的方式进行保存、传递和处理。
百度百科说信息,指音讯、消息、通讯系统传输和处理的对象,泛指人类社会传播的一切内容。人通过获得、识别自然界和社会的不同信息来区别不同事物,得以认识和改造世界。在一切通讯和控制系统中,信息是一种普遍联系的形式。
它到底在说些啥?
智慧的层次结构图中把杂乱无章的数据描述成了正方形、三角形、圆形和六边形。这里给出信息的更通俗定义:信息用来给数据命名并将数据归入相应的类别。
为了进一步说明数据与信息的区别,可以看看这2个例子:我这个“人”是数据,但给我取的“大鱼先生”这个名字就是信息。我到西湖钓到的“鱼”是数据,西湖这一天被钓走的“鱼的数量”就是信息。
数据只有通过业务的加持才能转化为信息,数据是客观的,而信息则是主观的。创造信息的目的是为了方便沟通和理解,代表大家对于各类数据的共识。
元数据被定义成描述数据的数据,其实元数据是信息的基础。
在一只数据团队中,做数据资产管理的人是最大的信息创造者,没有他们的努力,原始的数据毫无价值可言。一个企业的数据资产的价值,不取决于拥有多少数据,在于其能将多少比例的数据转化成真正的信息。
现在企业级大数据强调跨域数据的整合,其实是在说要突破各部门业务的鸿沟,达成信息上的共识和开放,企业的组织、机制和流程往往决定了数据转化成信息的效率。
作为知识层次中的中间层,有一点可以确认,那就是信息必然来源于数据并高于数据。我们知道象7度,50米,300吨,大楼,桥梁这些数据是没有联系的,孤立的。只有当这些数据用来描述一个客观事物和客观事物的关系,形成有逻辑的数据流,他们才能被称为信息。除此之外,信息事实上还包括有一个非常重要的特性— 时效性。例如新闻说北京气温9摄氏度,这个信息对我们是无意义的,它必须加上今天或明天北京气温9摄氏度。再例如通告说,在会议室三楼开会,这个信息也是无意义的,他必须告诉我们是哪天的几点钟在会议室三楼开会。
注意信息的时效性对于我们使用和传递信息有重要的意义。它提醒我们失去信息的时效性,信息就不是完整的信息,甚至会变成毫无意义的数据流。所以我们认为信息是具有时效性的有一定含义的,有逻辑的、经过加工处理的、对决策有价值的数据流。
知识大致等同于模型,当然这里的模型远远超越了数据领域的模型范畴。
市场竞争的经济学模型、网络的社会学模型、地震的地质学模型、生态位形成的生态学模型以及学习的心理学模型都体现了知识。这些模型能够解释和预测。
比如化学键模型解释了为什么金属键会使我们无法将手伸进钢制的门,经济学的供需模型解释了为什么需求增加的时候价格会上涨,市场的4P理论告诉我们营销的关键要素有哪些,大数据的4V理论揭示了“大”的本质特征,机器学习的模型通过构筑相关关系预测未来。
可惜的是,企业的数据团队大多时候做的是创造信息、展示信息的工作,比如提供取数和报表,极少比例的人在做创造知识的工作,比如数据团队的建模师,但这些建模师过于狭隘的定义了建模,将建模局限在了机器学习这个领域。
但企业面临的环境是复杂的,往往需要用多模型的思维去解释和预测,比如你要对用户进行精确营销,懂点机器学习是不够的,还需要理解4P模型,而理解了4P模型也是不够的,也许心理学上的损失厌恶模型可以帮你优化营销策略。
企业中建模师的很大问题其实是缺乏更广泛的知识。
业务人员是企业事实上最大的知识创造和使用者,他们基于自身的业务知识来解释信息,更善于从取数和报表中发现知识,从而影响决策。
信息虽给出了数据中一些有一定意义的东西,但它的价值往往会在时间效用失效后开始衰减,只有通过人们的参与对信息进行归纳,演绎,比较等手段进行挖掘,使其有价值的部分沉淀下来,并于已存在的人类知识体系相结合,这部分有价值的信息就转变成知识。例如。北京7月1日,气温为30度。在12月1日气温为3度。这些信息一般会在时效性消失后,变得没有价值,但当人们对这些信息进行归纳和对比就会发现北京每年的7月气温会比较高,12月气温比较低,于是总结出一年有春夏秋冬四个季节,因此我们认为知识就是沉淀并与已有人类知识库进行结构化的有价值信息。
智慧是指识别和应用相关知识的能力,智慧的本质就是决策,决策的难度在于它是需要行动的,你通过人工智能可以获得一个知识,但在生产中使用这个知识意味着你需要承担后果,这是更为复杂而有风险的事情。
机器学习或人工智能关注“如果我看到/听到/闻到X,那么我能得出什么结论?”,然而,决策回答的问题是,“如果我采取了行动A,会有什么结果“。正如智慧的层次结构图中的那个IF一样。
决策的关键是选择,多模型则是选择的基础。在采取行动时,有智慧的人会应用多个模型,就像医生会让病人做好几种检查来帮助诊断一样,领导在做决策的时候,也往往征询各方的意见,这些都是智慧的体现。
智慧更包括选择正确模型的能力。
考虑以下这个物理问题:一个小小的毛绒玩具从一架飞在6千米高的飞机上掉下来,当它着地时会造成多大的伤害?学生可能已经掌握了引力模型和自由降落速度模型,这两个模型会给出不同的答案,要想得到正确的答案需要信息(玩具的重量)、知识(自由降落速度模型)和智慧(选择正确的模型)。
对于数据从业者,南向受上游系统的限制,北向受业务管理的限制,其驻留在数据和信息这两个层次难以突破,生存环境其实并不是很好。
如何更好的靠近上游系统进行数据的治理,如何更好的靠近业务发挥出数据的价值,考验着数据从业者的智慧,而所有这些,都不是靠单一的技术能解决的。
我们经常看到一个人满腹经纶,拥有很多知识,但不通世故,被称做书呆子。也会看到有些人只读过很少的书,却能力超群,能够解决棘手的问题。我们会认为后者具有更多的智慧。因此我们认为智慧是人类基于已有的知识,针对物质世界运动过程中产生的问题根据获得的信息进行分析,对比,演绎找出解决方案的能力。这种能力运用的结果是将信息的有价值部分挖掘出来并使之成为已有知识架构的一部分。
信息是以有意义的形式加以排列和处理的数据(有意义的数据);
知识是用于生产的信息(有意义的信息)。信息经过加工处理、应用于生产,才能转变成知识。
又有研究者在更高程度上解释了信息、知识以及智慧这三个不同的概念,认为信息是过去知识的编码,是静态的概念;知识是认识世界的显性知识和隐性知识的总和,是一种产品又是一个过程;智慧是把知识应用于知识产生新的知识的一个动态过程,即创新能力。
数据、信息、知识以及智慧之间的辨证关系,即“数据—信息—知识”是处于一个平面上的三元关系,分别从语法、语意以及效用三个层面反映了人们认知的深化过程,而智慧则是超越了这个平面的创造性活动。具体来讲,数据是基本原料,而信息是有规律的数据,知识则是有价值及效用的信息,智慧则是建立在“数据—信息—知识”之上并主要以已有的知识存量为基础的一种更高层次的知识创造活动。从广义的角度来理解知识管理,可以认为就是要实现对数据、信息以及知识的有效整理、挖掘和应用,并引发更高层次的智慧——知识创新,形成一个从应用到创新并从创新到应用的闭环行为。
总结:根据这些定义我们尝试对知识管理提出一些建设性意见:
1、重视数据所使用关键词的统一性和完整性,这样才能避免组织内出现不同的信息和知识体系,避免成员在交流沟通时产生歧义和误会。
2、保持关键字集合的可扩展性,防止由于数据不全导致新信息和新知识无法产生。
3、重视信息的时效性,尽量在信息的时效性消失前挖掘出其有用的价值,并使之沉淀于已有的知识库中。
4、重视信息的可靠性和逻辑性,防止由于错误或逻辑混乱的信息加入到知识库中,降低知识库的质量。
5、关注知识库的结构化问题,尽量避免知识彼此割裂,甚至出现知识孤岛。通过不同领域知识的交叉融合,使它们连通起来,方便组织成员使用知识库时能够快速准确的定位需要的知识。
6、充分理解智慧是一种应用知识和信息处理问题的能力,在选择组织成员时应兼顾其拥有知识和运用知识能力之间的平衡。