黄勇凯,副研究馆员,现任武汉大学图书馆副馆长,兼任湖北省高校图工委自动化专业委员会主任,湖北省高校数字图书馆建设技术负责人。主要研究方向为图书馆自动化建设、数字图书馆建设和图书馆基础服务环境建设等。黄勇凯热衷于图书馆创新服务的探索,近年来负责武汉大学新图书馆建设和信息化工作,致力于图书馆数字营销、机构知识仓储和创客空间建设的实践与研究。
习近平总书记在党的十九大报告中明确提出要增强改革创新的本领,善于结合实际,创造性地推动工作,要善于运用互联网技术和信息化手段开展工作。我认为,从任何时候来看,信息化建设都不会过时,且非常重要。党的十九大后,习近平总书记又提出一些新的要求,比如要在人工智能方面更广泛地去开展工作。我来自武汉大学,她是世界上最美的大学之一,每年的3月中旬,樱花盛开,老图书馆一带人山人海。武汉大学的建筑物非常漂亮,有很深厚的人文底蕴,上一任的李晓红校长和现任的窦贤康校长都在学校建设方面做出巨大贡献。我工作的单位武汉大学图书馆有四个分馆,另包括万林艺术博物馆,图书馆藏书近700万册、电子资源700多万册,共约1400多万册,服务面积8.6万平方米。1992年左右起已经开始从事信息化方面的建设。武大图书馆新馆2011年正式使用,2016年新建信息科学分馆,我参与了两个图书馆的建设,从中学到许多信息化建设的经验。
我和大家分享一个发生在武汉大学图书馆的真实故事。1987年,有一个学生在武汉大学图书馆四楼阅览室,阅读了一本名为《硅谷之本》的书。读完后,这位学生彻夜无眠,因为在这本书里记载了一个名为乔布斯的人物,乔布斯是美国苹果公司的创办人。这位同学就想为什么在中国就不能出一个这样的企业家,能够创建一个像苹果那样优秀的企业。此后,他就立志要成为一个能够创造世界级企业的人。这位学生就是雷军,他创建了小米公司,现在已经非常成功,个人身家200多亿美元。我觉得雷军的成功跟这本书、跟图书馆是有很大的关系的。讲这个故事的目的是想说,其实像图书馆这样的地方,可能在很多人眼里只是平凡无奇的一个场所而已,但实际上它可以让创新创业的思想从这里开始起源。借用苏格拉底的著名比喻:图书馆是一个催生思想的产房。那么思想产房的核心是什么?就是书和文献。地方志的同志在编书、编志,把史实做成了文献,让它能够永久地传播下去,是非常有历史意义的事情。未来的某一天,这些书可能就会影响到一个很伟大的人,这是很有可能发生的事情。我们应该对自己的职业有一种自豪感。
今天的讲座分七个方面:
一、信息化建设
政府非常重视信息化建设,每年的政府报告中都有一些信息化的关键词。最近的一些热词很引人注目,第一个是“大数据”,没有哪一个省的政府或者书记不谈大数据。第二个是“人工智能”,很多人对此还没有很好地理解和接受,甚至有些害怕。人工智能开始和大家息息相关,开车时用的导航已经融入了很多人工智能的因素,以前的导航都非常的傻,经常把大家带到一些坑坑洼洼的路面上,既浪费时间,又很不舒服,现在的导航已非常“聪明”,它知道前面哪条路堵塞,选择从其他路绕行,且随时可以改变路线。第三个是“三创”,创新、创造、创业。创新是引领发展的第一动力,不管从事任何工作,一定要创新,方志工作也是如此。方志有很多传统做法或者很多一成不变的做法,但这并不影响我们去思考、创新。目前有一些和大家的工作还没有产生很大关系的关键词,未来可能会产生很大关系,如“3D打印”“虚拟现实(VR)”和“增强现实(AR)”等。目前,武汉市方志馆的场地未达到国家要求的标准,一旦场地扩大,就会拥有更多为市民提供服务的需要。这时,3D打印、虚拟现实、增强现实就能够派上用场。VR、AR已广泛地应用于文献服务或者和文化相关的服务领域。“新媒体”和“数字出版”这两个关键词需要引起关注,怎样利用微信、微博等新媒体开展方志信息的传播,很值得大家思考。地方志传统上以纸质书籍为主,未来就会发展到数字出版,通过也Kindle或者iPad就可以直接传播,读者在网上很方便地随时随地进行阅览。
什么是信息?信息就是能够为视觉、听觉、嗅觉、触觉、味觉等采集的事物,包括能够采集到的各种直观的、抽象的事物,包括文字、数字、音乐、景物、色彩等。信息是一种知识或者一种消息,需要通过通讯存储起来,通过处理表示出来。用信息奠基人的说法来讲,信息是用来消除随机不确定性的东西。编纂出版的地方志是历史资料,不是随机、不确定的,是确定的事情。信息是对客观事物的运动状态变化的一种反映,是对事物之间相互关系作用的一种表征,表现的是客观事物在运动过程中变化的实质内容。人类社会的进化,实际上就是人类信息活动的演进历史。整个人类进化的过程中,已经历多次的信息变革,每一次信息变革都使社会发展、人类发展、人类生活产生巨大的变化,这是一个很大的推动力,这些变革带来的是飞跃式的进步。人类的第一个信息变革是发明了语言,用语言进行不同方式的交换信息。语言的诞生使人和人之间开始形成了社会,开始聚集在了一起,有了信息传递的方法。第二个信息变革是文字,文字的诞生可以把人类传播的信息记载下来、延续下去,它改变了口口相传的方式,人类通过写在竹简、纸张上或刻在岩石上的文字传递信息,如甲骨文、摩崖石刻等。第三个信息变革是印刷术,印刷术可以使信息批量生产,使信息传递更加方便。在此以前,竹简或者石刻非常麻烦,印刷术则能很方便地传播信息。第四个变革是人类学会了利用电磁波,人类可以打电话,可以用微波传递信息,信息的传递速度更快,传递方法更加多样。当今最新的变革是计算机技术,有了计算机和网络,人类信息化的变革更加迅猛。人类从原始社会进入农业社会,再进入工业社会,现在进入信息社会,以后将进入的是人工智能社会。
什么是信息化?信息化是指人类在社会活动中普遍使用信息技术,充分有效地开发信息资源,来推动经济、社会发展的一个过程。人类从开始直立行走,到可以使用简单的工具,再到不断地开发越来越完善的工具,最后到发明电脑,这就是一个信息化的过程。最初的电脑很大,后又发明了微型电脑和笔记本电脑,到现在人手一个智能手机。信息化的概念由日本最先提出,1963年,日本学者梅倬忠夫在《信息产业论》一书中就描绘了信息革命和信息化社会的前景,他预见人类社会将进入信息化的社会。日本在第二次世界大战以后一段时间内发展速度非常惊人,日本据此奠定了世界第二大经济体的地位。如今中国已经超过日本,成为世界第二大经济体。日本在信息化社会阶段站到了世界前沿,而中国则在“互联网+”的时代站在了世界前沿,实现了一些根本性的转变。中国在很多领域,比如大数据、人工智能领域,在全世界都属于相对领先的地位,基本上都排在第二名、第三名,中国已经强了起来。信息化是向信息社会前进的一个动态过程,它反映的是可以触摸的一些物质产品,一些难以触摸的信息产品也起到重要作用。中国的信息化大约从1997年开始,与日本相隔30多年,我们先解决的是温饱问题,温饱问题解决后才能够去讨论信息化。我1996年参加工作,但1987年就开始接触计算机,当时我爸爸和姐姐都在银行工作,他们那里有苹果电脑,我有时候就在那里玩像“偷金子”这样非常简单的小游戏,从中感受到了信息化的一些很特殊的东西。有一次,我打开电脑,上面跳了一格才出现C>,因为平常打开电脑都是一个C>,我以为把电脑弄坏了,赶忙把电脑关机离开,但第二天并没有人来找我麻烦。那时候的电脑对人们来说非常神秘。1995年,我大学即将毕业找工作,母校武汉水利电力大学图书馆詹馆长带我参观图书馆,在图书馆机房里,我看到很有意思的一根线,詹老师说这是一根网络线。我问他这根线怎么用,他说,这个网络线可以跟全世界连在一起。1995年时,全中国可以上网的人非常之少,整个学校连出去的网线速度只有64K,现在每家的网速最少是4M,我家的网线是200M的光纤,这已经是当时速度的300倍。当我知道这根网线连到了全世界,就决定留在图书馆,没想到一干就是20多年。2005年,我国制定了15年信息化发展战略,信息化开始成为重要的国家战略。现在信息化已经不仅是战略,而且是非常基础、非常重要的信息设施。对于未来的国家发展,信息化建设会起到非常重要的作用。
信息化包括多个层次。首先是产品的信息化,在其中增加一些智能的元器件。现在小米公司所生产的空气净化器,可以用手机进行远程控制,可以随时报告家中的空气情况,它内置了很多模块,如空气指标测试模块、网络连接模块、传输模块等。第二就是企业的信息化,它基本上可以决定企业发展的前途。淘宝网最初模仿国外易趣购物网站,结合了中国的现实情况,第一个创建了物流的信息化标准,把物流的所有过程信息化。以支付宝为例,买方在网上买了东西,要先支付一笔钱放在支付宝里,这笔钱相当于契约金,卖方把货物发给物流,分发、运输的所有过程全部进行数字化,买方收到货物后签收,又产生一个信息化的过程。这样的信息化过程,买方不用担心购物被骗或者钱被骗,买方确认收货后,支付宝里的钱才到达卖方手上。淘宝就是信息化成功的案例,如果没有物流的信息化,没有网上购物的全面信息化,怎么可能有今天的淘宝?企业在产品的设计、开发、生产、管理、经营等环节,必须有效地进行信息化。我曾参观过最早进入中国的外资企业——戴尔公司,厂房是全开放的模式,两侧没有围墙,全是集装箱,一边是进货,一边是出货,公司没有库存,库存全部来源于集装箱,整个过程均实现了信息化。如果没有信息化,就不知道现在缺什么元器件,什么电脑卖得快,什么样的元器件最畅销,零库存的基础就是非常完善的信息化。第三是产业的信息化,从产品、企业到产业,逐步扩大。产业的信息化包括农业、工业、服务业等,信息化可以有效地避免一些风险。今天的供给侧改革中的去库存等,都要靠产业的信息化。现在的许多产业信息化研究报告,我认为和地方志有关系,因为方志会记录各个地方的经济、产业、人物等,地方志可能是产业信息化的末端。在国民经济的信息化过程中,在整个经济大系统中,需要把社会的生产、流通、分配、消费等连在一起作为一个整体。当经济、科技、教育、军事、政治、日常生活等全方位地进行信息化后,人类就进入了社会体系的信息化,就进入了信息社会。地方志的同仁实际上是为经济、社会、生活信息化记录,把地方的活动过程、统计数据记录下来。地方志工作就是信息化过程,把得到的信息记录下来。
信息化的过程主要靠信息技术,数字化是最重要的表现方式。电脑中的信息用0和1表示,0和1可以组成各种数字、符号、字母等,可以产生相应的信息,核心就是把它数字化,通过网络进行传输,进行有效的处理。信息技术是信息化最重要的基础,会涉及到存储处理、数字化媒体等。一般来讲,信息化的技术简称为IT。我是从事IT工作的,以前只做和计算机有关的工作,现在是只要和电有关的都要参与。IT从业者就是实施部署和计算机及网络相关的系统、软件等的人。在信息社会前,人类经过三个浪潮。第一个浪潮是农业阶段,人类开始能够和天对抗,不再靠天吃饭,能够吃饱,可以思考,不用再去住山洞。第二个浪潮是工业阶段,开始工业化生产,有了自动化的方法,机器代替了很多人工。现在已进入信息化或称为智能服务的阶段,计算机和网络是非常重要的环节。在信息化社会这个阶段,人类不再拼体能、拼机械能量,比如水电站发电主要是利用水的势能,带动水轮机转动。当今社会拼的是智能,拼的是信息化水平,比如要打赢一场战争要信息化,谁的信息化能力更强,可能对世界的掌控力就会更强。同样,哪个行业的信息化更强大,工作肯定做得更好。信息化的过程已经成为第四个产业,相当于农业、工业、服务业之后的第四产业,已经成为社会生活的重要组成部分。
二、数据与智慧数据
什么是数据?如果在墙上写200、300、400等数字,就是数据,可是却并没有什么特别的意义。
什么是信息?从A地到B地,比如,汉口到黄石100千米,假设这100千米形成一个信息,其中就包含了几个数据,如A、B、100千米,信息中有的是数据,有的是定义。
什么是情报?汉口到黄石100千米,开车大概90分钟可以到达,如果行走可能需要两天,这是情报,情报再复杂一些就变成了知识。汉口到黄石可能有多条线路可以选择,如最快的是1号线路,最经济的是2号线路,这些不可能仅靠数据或者信息描述,可能要用人脑或实践过程产生,这就是知识。
什么是大数据?举个通俗、可能不完全准确的例子,从汉口到达黄石100千米,有人通过开车,有人通过步行,任何人的任何行为包括事物,用感应的方法形成的所有数据,汇集在一起,就变成一个很大规模的数据。在座的30多位同仁,如果把每个人的体温、心跳、脑子的所想全部变成有效数据,并存储到网络中,就形成了大数据。有了知识,有了大数据后,就可以做智慧数据了。
什么是智慧数据?我们可以这样想像:未来的某一天,可能没人会自己开车从汉口到黄石,而是坐在无人驾驶的汽车里,在车上可以喝咖啡、用电脑,甚至四个人可以一起打麻将,然后到达目的地。无人驾驶汽车靠什么运行?它有无数个感应器,有网络接收终端,有非常强大的核心电脑,会计算路况,会计算所有的可能性,会自主地通过这些数据判断加速、减速、刹车或变道,这就是智慧数据。智慧数据能够对数据进行自我调整、自我改进。人类和机器人AlphaGo下围棋,最初人类曾战胜过一次,AlphaGo自己跟自己走围棋,自己弄出来几十个棋谱,人类最厉害的棋手认为以后下棋再也不能赢过它了。机器人可以自己学习,它通过大数据,通过智慧行为,自己深度学习,并不断改造自己的学习方法,改造自己的行为,人类没有办法完全做到,这就是智慧数据的作用。大自然里面的智慧数量惊人,所有组成物质的基础基因,尤其是动物的基因传递,都经历了上万年的进化过程。每个动物都有各自不同的能量,人类在很多方面远不如这些动物。蝙蝠能够通过声波感受到前面的事物,马的眼睛看不到正前方,但却从来没有撞过墙。人类的智慧是通过大脑中150亿个神经元来支撑的,很多年以来不断地进化、积累、完善。人类的智慧通过文字的方式,通过纸质的方式存储后,再通过计算机把信息存储起来。当今人类要存储的书如果全部进行数字化,已经有500TB之多。社会智慧可以影响到整个地球的变化,把人工智能机器的智慧加进去后,会有惊人的变化。首先是信息量呈指数级增长,比如以前的拍照很不容易,要拿胶卷去冲洗,人站好后,喊1、2、3开拍,而现在的拍照多是随便拍,许多女孩子到哪里都要拍照,然后上传微信朋友圈,这就是信息。今早我开车时从广播中听到,Facebook开发出一个最新的应用,每当照片被其他人放到社交网络上,网站就会给当事人发一个通知,提醒要不要删除掉,这是因为照片里的所有人已全部被识别。每张照片未来都会成为机器智慧的知识节点,每张照片包含众多的信息,比如时间、地点,脸型、心情等,都可以通过照片分析出来。每人每天在生产非常多的信息,以前是自拍,现在很多年轻人喜欢直播自己在干什么,一边走一边直播,虽然很多人不一定能够理解这种行为,但是这确实存在。数据的飞速发展导致的一个结果就是数据越来越不值钱,因为无法判断数据的对和错、真和假。图书馆工作和地方志工作都是记录、传播正确数据和信息的工作,把有用的知识进行甄别后,通过有效的出版方式保存下来,再进行传播的工作。
数据、信息、情报、知识、智慧形成一个金字塔的形状,基础就是人类生活的环境,日常生活中的点点滴滴。数据赋予一定的定义就形成了信息,信息加上人类的知识经验就形成了知识。通过人类的现实活动,使数据变成信息,变成知识,变成智慧,不断地进行转换,形成数据到智慧的全过程。每一项工作都很重要,一个信息,一个数据,都能把知识贡献出来,乃至于为人工智能,为智慧数据提供更多的应用可能性。例如医生看病,首先会拿到一些基础数据,如验血报告、X光片以及以前的病历等,通过分析后,能知道大概是什么病,这就是产生的信息。医生通过常年看病的经验,基本可以断定病的情况。如果计算机能够模仿人思考这些问题的话,机器就可以开始看病了。这种事情已经发生,未来的20年,中国的智慧医疗可能会有大的发展。以后看病有可能坐在一个摄像头前面就可以,不用去医院,也不用挂号,国家已经投入大量资金,目标是看病能够网络化,不用担心医生的水平。诊病的医生可能是名师,也可能是由计算机模拟名师的医疗过程。把智慧过程变成知识,再用信息的方式描述出来,最后形成数据存储起来,这就形成不断循环的过程,这就是数据和数据之间的转换。
大数据更多体现在数据规模增长的速度和多样性、易变性和真实性上,智慧数据的体现有多个特点:首先是通过数据研究如何组织这些数据、管理这些数据、运行这些数据。这些数据是可以信任的,比如无人驾驶汽车,如果乱开人是不可能敢坐的。第二是通过环境的变化,不断地修正自己的数据。情景化非常切题,可以认知,因为所有的行为都基于数据,完全可以通过数据进行理解、预测。机器人不能判断妈妈和老婆掉在水里,先救哪一个,不可能让机器人研究这个问题。机器人只有一种想法——在哪种情况下怎么救人,绝对不会像人一样还有这么复杂的情感,它是可消费的。和大数据比较,智慧数据更多的不只是通用技术,而是一种方法论的转变,更多的研究是怎么让数据进行有效的行为。人们可以看到数据,数据是代码,但什么都不知道;信息可以让人们知道是什么;知识使人们知道该怎么做;大数据使人们知道了为什么;智慧数据能够让人感受到不知道的东西。
三、互联网及数字化发展趋势
互联网是20世纪最伟大的科技发明,是划时代的发明。其实iPad也是一个划时代的发明,在此以前,人们用移动鼠标和电脑产生交互,iPad则用手在屏幕上画,这是个很伟大的发明。互联网也叫英特网、局域网等,通过IP地址连接在一起,通过一个名为TCP/IP协议的标准化协议。每人都有一个地址,地址由数字定位,可以产生非常之多的地址。互联网使人们的每个活动过程均通过地址被定位,人们可以知道别人在干什么,在传递什么信息,所有的信息均通过协议打包后,再通过交换机不断地进行交换再传递出去,这是互联网的基本定义。
中国的互联网有4种,第一种是每人在家中使用的名为ChinaNet的公共网,公共网速度比较快,比如中国电信、中国联通、中国移动的网络等。第二种就是学校使用的名为中国教育与科研网,中心设置在清华大学。第三种是中国科技网。第四种是金桥网,是面向企业的网络基础设施。中国的网络发展非常之快,通过海底光纤和美国的网络连在一起,但有时候可能因为某些原因中断。网络也有一些网络安全问题,信息会有一些管控机制。
2012年以前的互联网主要是有线网络,而现在更受关注的是移动互联网。移动互联网的出现,得益于3G手机。1G手机时代,手机只能打电话或收发短信。2G手机时代,手机可以收发电子邮件,可以看简单的网页,主要是文本,图片基本不能显示。3G时代,手机可以听音频、看视频,看网页变得更加方便。早期的手机上网需要用UC浏览器,因为它可以使一个网页自动适应手机屏幕,现在已经不再需要,因为现在所有的网页在编写的时候就已设置好,能够适用于各种移动终端,屏幕有多大,就会自动匹配最适合的观看方法。3G有很多标准,中国受到别国的限制,主要是因为中国没有掌握核心技术,没有参与标准的制定。进入3G时代后,手机开始走向每个人的生活,手机开始变得更加有用。现在的手机可以上网,可以搜索,可以办公,很多人已不喜欢打电话,要找个人打开微信就可以视频通话、语音通话,哪怕你出国,网络通话也是最便宜的一种方式。手机可以看电视、听音乐、玩游戏等,现在的手机可能比手上任何其他的东西都更加成为人类的一个部分,甚至像电和水一样,将很快会成为人类的一个基础设施。有一个玩笑,说假设把你放到一个沙漠里面,你最想带什么?有人说手机,但是有人说没有网络有手机不也是白搭吗?有数据统计,2012年第二季度,中国的手机的数量已经超过电脑,这是一个非常重要的时间节点。2013年,中国的移动互联网用户——手机用户已经超过美国。这两个时间点均代表了中国开始走向全面的移动互联网时代,开始引领全世界。现在在淘宝上买东西,可能有70%是通过手机来实现的。很多人已经在用4G通信,我是差不多在一年半以前开始用,速度很快,比3G大概快将近50倍。刚开始流量很贵,比如一个月就2GB、3GB,一不小心看个电视或电影,就容易超额。4G可以让网络更快,很多人已经不再使用电脑,像我以前基本上每天都背着笔记本上下班,但现在尽量不背了,这种情况反映了一个时代的变化。马上就会进入5G时代,5G时代中国将全面掌握各种标准的制定,中国的企业参与制定、决定这些技术的发展和方向,5G开始了中国移动互联网的标准化时代。5G的速度比4G又快了一百倍,大家可以想象,拿一部手机,一秒钟下载完一部高清电影,然后用手机自带投影往墙上一投,就有了电影院的感觉。信息技术和互联网发展可以使生活变得更加不可想象。
有线电视网、三网融合这些都将成为过去式,有了4G网络、5G网络后,家里电脑的用处将大大减少。以前的互联网IP地址被美国人垄断,那时就提出要建设下一代互联网IPV6,目前还没有进入民用阶段,还处于科研阶段。IPV6网络更快,IP地址更加充分,IPV4有4位地址,IPV6有6位地址,增加了几百万倍数量的地址。全球互联网用户现已有34亿,比去年同比增长10%,全世界有一大半的人在用网络,现在网络发展最快的国家是印度,因为中国早已有了巨大的发展,印度已成为仅次于中国的全球第二大互联网市场。印度正在经历中国20世纪90年代至2000年左右的过程,正在全力赶拼。我国智能手机的出货量今年仅增长3%,增速有所下降。手机游戏开始渗透到人们的生活中,全球玩家玩手机游戏的时间增加了33%。云计算的基础设施已经和传统数据中心的份额达到同一个水平,以前必须要买的服务器存储,现在可以去租。全世界的互联网领导企业有苹果、谷歌、亚马逊、Facebook等,以及中国的腾讯、阿里巴巴等。中国企业的水平很高。中国的互联网已经进入在线娱乐、共享出行的黄金时代,用户已经达到7亿,但仍有6亿人未连上网络,很多人用手机的时间已经超过看电视。人们已经能够普遍接受内容付费,前段时间,我在家里因为要观看《大军师司马懿之军师联盟》,付费成为优酷会员,第一个月只要8元钱,本来只准备用1个月,因为太忙忘记去注销,到了次月就扣了30多元,后来就习惯了每个月花30多元看影视剧。以前人们听音乐都是随便听,想听什么就下载什么,现在已找不到下载的地方,只能在线收听,我就开始每个月花8元钱开通QQ音乐的会员。关于在线直播,人们可以看见很多人在打赏送钱,有的是1角、1元的,还有送上万的,很奇怪的一件事情,但是却是真实发生的事。人们已开始习惯对网络游戏、在线直播、在线视频付费,能够为内容掏钱了。中国移动支付市场发展非常迅速,今年天猫“双11”的营业额是1682亿元,外国人简直不敢相信,京东也说自己有950亿元,但它是十几天到1个月的总额。中国已经成为全球移动支付技术的领头羊。中国现在在虚拟现实、自动驾驶、3D打印、工业机器人、无人机、人工智能等方面全球领先,世界上最牛的无人机基本由中国企业生产,中国已经成为数字经济的领袖,尤其是在消费行业。
现在已进入数字化转型阶段,社会也好,每个行业也好,都要认识到这一点。要加快发展先进制造业,推动互联网大数据、人工智能和实体经济相融合,必须看到大数据的推广及应用不仅是一场技术和产业变革,也是新时代中国发展的动力和必要的基础设施,能有效助力中国高质量发展。政府的官员们要善于获取数据、分析数据、应用数据,这是领导干部的基本功,要有这种信息的触觉、数据的触觉、智慧的想法,然后把自己的经验交流出去,让这些经验能够传承下去,变成智慧的一个部分。现在社会上非常推崇“互联网+”政务服务,一定要简化办事流程,简化信息获取的渠道,不要把那些服务资源神秘化,减少层层审批,一定要让用户能够最方便最便捷地获取服务,哪怕要收费也要能够在网上支付,而不是要跑到某一固定地点交钱,还要去其他地方开发票、开收据。“互联网+”政务服务是现在政府正大力推进的。
互联网发展过程中,有多个行业已经消失。首先是邮政业,因为已没人写信,写信变为发Email了,现在连Email都没有很多人用了,变成用MSN、微信和QQ。原来还用bb机,现在变成了用手机。最开始过年大家发短信,中国电信每年过年短信收入极高,现在大家都用微信发红包。有了智能手机后,人们的整个生活都发生了改变,以交通为例,以前出租车很拽,现在滴滴一下,即使很偏的地方,车也可以马上就到。出版也发生了改变,已开始全面进入数字出版时代,原有的报纸,除了党媒,很多都已生存不下去,因为信息都可以网上查到,没有必要再看报纸,期刊也如此,以后都是数字化的聚合出版物。现在已从文本时代进入图片时代,很快将全面进入视频时代。以前是自拍一张照片,以后可能就是自拍一段视频,现在很多女孩都在玩一个应用,自拍一段视频,自动给你美容,增加了各种式样的视频特效。信息传播从2G、3G、4G到5G,应用模式也相应变化,以后中老年人可能还在用短信、微信,年轻人都在玩视频、Facebook、Ins,我们要认识到这种趋势,才能够做好对不同层次的人群的服务。总而言之,信息技术的发展对人类社会产生了巨大的影响和变化,改变了人类的生活方式。
四、新一代信息技术
第一个是云计算。现在享受的这些信息变革,其背后都有强大的数据中心,由服务器、交换网络、交换机、存储设备来完成。以前每个单位都去建设这样的设施,现已提出云计算的概念。什么是云计算?就好像现在用的电和水都由电网和水务公司提供,以后的服务器、存储资源等也由一些服务机构提供,用户需要时只需租用,并按照使用量付费即可,这就是云计算。云计算已应用在很多工作环境中,比如云存储的网络云盘,其实刚开始时网络云盘都是免费的,现在免费多已不好用,收费的效果较好。还有云桌面,比如说我有笔记本电脑、办公室电脑,还有家中的电脑,我希望在办公室用的这些桌面环境回到家里还是一样,就可以用云计算里面云桌面来实现,到哪里工作都是一样,哪怕是在火车上都可以持续地工作,这也是云计算的一种应用。
第二个是物联网。所谓物联网,就是每一个物品都在网上连接。为什么需要IPV6,因为IPV4不够用,家中的台灯、冰箱、电饭锅、空气净化设备,哪怕是一个热水器,全部都可以网络管理,如此,我们的生活就进入全面的物联网时代。其实手机就是物联网的一个非常典型的代表。物联网和大家息息相关的一个事情就是ETC。ETC是第一个能够让大家感受到物联网的事物,开车从那里经过,车里有个由电力供应的芯片就发出信号,和ETC上的接收器进行切割,ETC实际是一种RFID无线射频感应装置。在淘宝上购买衣服,有可能会收到一个很硬很长的标签,那就是一个RFID,里面是一个芯片,芯片里记载了衣服从生产到卖出全过程的数据。有了物联网,有了移动物联网,移动物联网里面的所有的数据就会形成大数据,这就是进入大数据的过程。这些技术也可以在方志馆里使用,每本书里放一根RFID标签,可以实现智能盘点借还,还可以知道这本书在哪里。武汉方志馆可能现在还在用条码,如果书里面放RFID标签,就可以通过无线感应很快地获取书籍信息。这些所有的物联网综合在一起的大数据,非常有用。2013年,中国开始进入大数据时代,现在在大数据领域已经世界领先。我2007年在美国时,感觉美国非常先进,大学生会把周边的饭店、公交的信息集合变成一个网页,在网上搜索非常方便,但现在中国要吃饭就打开大众点评网,哪家好吃不好吃都看得到,美国人现在还做不到,我们已经实现了。2013年时,人们每天上传分享一张照片,这个数据每两年翻一番,2013年到2017已经翻了16倍以上。大数据相当于以PB来计算,每一个数据级别都是1024倍地往上跳,大数据决定了未来能够去探知为什么这个事情能提供很多的可能性。通过文本、图像到视频的过程,也是大数据的变化过程,一个文本一万个字可能也就10K这样的数量,2000万像素的数码相机,一张图片可能就是10M,录一分钟的视频,甚至会达到几个G这么大,数据的容量不断变化。
人工智能是现在最热门的信息技术,是中国发展的一个重点方向。大约在1997年,人类和计算机比赛象棋,人类输给了IBM的深蓝电脑,当时许多人觉得机器再厉害也是由人控制的。那时的计算机的计算能力很差,深蓝电脑可能还不如现在手机的运行能力,现在的手机速度已经非常之快,有了很强大的计算能力。我最初在学校工作时,占满房间的巨大服务器的计算能力可能还不如两年前的一个手机,这样的机器当时还要几百万元。人工智能已涉及到很多方面,手机上就有许多人工智能,只是人们不知道而已。很早以前,IBM公司想开发一台人工智能的电脑帮企业进行管理,电脑做出后,要卖给企业,可是没有企业要购买,为什么?因为那些高管们认为如果购买了电脑,他们就会失业。到了20世纪90年代,有了电脑,有了网络,有了上述基础设备后,人工智能才具备了可能性。现在已有一些机器人,如跳舞机器人、饭店的点菜机器人等。有句话特别好笑,说一个再优秀的蓝翔技工,其水平也不如一台机器人,因为机器人的精准性绝对比人厉害。当机器人学会思考,学会学习,又不会死亡,机器人可能会反过来控制人类,所以很多人就在思考人工智能会不会把人类毁灭掉这样一个问题,但事实上这个事情可能是很复杂的逻辑。《最强大脑》和《一站到底》两个节目中有两个机器人,一个名为小度,一个名为汪仔。汪仔回答问题可以让人类四道题,《最强大脑》里的小度在图像识别上比最厉害的人类还要厉害。人工智能在图像识别和语音识别上很厉害,最近,百度公司跟我们谈合作,谈到使用百度公司的人工智能的软件,把你的声音录半个小时后就可以合成你的声音,读任何文字,读任何片段,比如说你给你妈妈写一封邮件,软件把这封邮件读出来后,你妈妈听了就会认为这就是你说的,这就是人工智能的可怕。大家开车时会听到林志玲的语音导航,说前方拥堵请绕行,其实都是合成的。如果根据一张图编写一个故事,人工智能已经可以编写故事,可以创作一篇浪漫的小说,机器人虽然写得并不好,但是已经很有意思,我觉得未来有很多种可能性,未来地方志系统也有可能用到人工智能写方志。
五、地方志信息化建设
《全国地方志事业发展规划纲要(2015—2020年)》明确提出要加快地方志信息化建设,我把全国各个省的地方志网站看了一遍,发现湖北省的地方志信息化还是属于比较高的水平,感到很欣慰。但是整个地方志的数字化水平还是相对落后,大部分仍停留在TRS信息化阶段,2000年前,我们已把TRS废除,现在很多地方还在写TRS如何使用。纲要提出一些要求,提出了统一规划标准,分级建设资源共享,安全保密等原则,要加快建设支持民族地区的地方志建设,逐步形成地方志数据库,用一些新的信息技术对地方志进行不同载体的征集(这些载体包括音乐、视频等),要推动信息标准化实现资源共享,而资源共享的基础是数字化,还要面向社会提供优质的服务。地方志“十三五规划”里提出的上述要求,内容非常丰富,对传统文化的传承具有很重要的意义。关于数字化的标准,国家虽有一些标准,但仍比较混乱。从编目角度看,现在书目管理可能还是以中国图书馆分类法为准,此中有一个方志的编目标准。关于图书管理,我认为还是要因地制宜,不一定要大,可以基于现在已经做到的事去发展,比如说每个区域的名人,每个区的专题数据库的建设等。
我认为对方志进行数字化,要结合方志的特点。现有的数字化基本可以分为古代的古籍和现代的方志两类。一类是手写的,比较复杂;一类是刻版印刷,能够通过计算机分析。现在OCR文字识别的水平已经非常之高,在对方志进行数字化的时候,一定不能只停留在对它进行扫描的过程,未来更多是要把它知识化,有知识节点,有知识语言,能够让信息直观检索,可以获取。所有的文字数字化过程后都要能够进行定义,能够进行编目,而不只是一个过程。图像、视频、内网图像扫描的标准一定要高,图像分辨率最少要做到300dpi。一定要存两种格式,第一种格式就是原版文件格式,可能某一天你就会需要再出版出来,没有原版的话出版的东西很不清晰;第二个是能够在网络上发布的版本,这是压缩的。版印书籍如能够OCR一定要OCR,现在的软件很厉害,有一些古籍的文字都可以进行OCR。如果条件允许,手写的文字也要逐步数字化,未来这些资源才能更加有用。一定要支持全文检索,要能够比较好地规范控制,要能够形成一些专题数据库,可以跨度检索,可以进行有效资源整合等。华中科技大学、华中师范大学和中国地方志指导小组办公室合作开发的一套地方志检视系统,可以通过地理信息系统去揭示方志,很值得大家参考。未来不只是去做一个数据库,还要把地理信息系统引入,可以更好去揭示方志,这个地方的一些数据只要鼠标移过去就可以显示出来,可以更直观地为政府服务,为企业服务。
六、方志馆信息化建设——硬件环境
方志馆的信息化可以分成两个部分,一是硬件,一是软件。关于硬件,以武汉大学图书馆建设为例,签到和桌面,网络均可以管理,无线网全覆盖,这是基本的场所标准。如果能够用到云计算,可能就不需要机房。武汉大学图书馆的机房比较标准化,但还不够先进,现在更先进的机房是冷柜式,一个房间内空调直通,有UPS不间断电源,机柜里的电脑通过PDU炮筒连接在一起,每一个机柜都有两个电源。机房内部路线是标准化的走线方式,上走网、下走电,规范化的网络条件。核心交换机的精密空调是机房的非常重要的基础设施,空调不好也会影响到机房的使用,要注意它的承载能力。要有监控系统,要避免淹水、电力波动等情况,要用机房环境监控系统。未来,方志馆可能会有自助服务,武汉大学图书馆就有自助借书还书设备,具备自助复印、自助上机等环境。要有支持所有可能性的阅读终端,武汉大学图书馆有报刊阅读机、存包柜、PC机、检索机等。还有团体研究室,在网上被称为“别人家的情侣自习间”,配有电脑和多媒体,阅读环境明亮,电脑配置很高,有看3D的设备,有门禁、防盗监测仪、数字标牌等。文字信息的获取率比较低,看到后很难理解,如果是一张图片,获取到信息的速度就非常之快,获取信息的效率大概有70%,将来的书大量的内容会是图片。武汉大学图书馆新建的信息科学分馆,新的IT设备就更多、更好,3D打印设备、27寸媒体阅读器、双屏计算机、Kindle等,学生都可以直接借来使用。有个学生大一就获得了武汉大学第一届3D比赛的冠军。他在刚进校三个月时,独立完成了他的3D作品,作品全由小名片打印出来,用榫卯的结构绑在一起,这是一个非常不错的思路和做法。所有的零部件都由3D打印出来,再拼装在一起,并用视频描述了如何完成作品的过程。我想告诉大家,创新可能会决定很多东西。很多年轻人想到的、做到的比我们好很多。很多专家看到这样的学生,感觉他的综合能力非常强,很是惊讶。第二届3D比赛第一名的3D打印作品很大,花了两个月时间,核心就是对匠心的一种体验。作者决定两个月之内其他事都不做,只做向武汉大学行政楼致敬这样的事情,作品非常棒,由于体积太大,目前还没有找到办法把它展示出来。
七、方志馆信息化建设——软件环境
软件环境要从几个方面去讲,一是门户,我推荐一种名为Durpal的软件,美国白宫就用它来构建网站,这是个开源软件,可能基数还会比较高,有比较好技术能力的人可以探索尝试一下,免费使用。关于图书管理软件,如果要建数据库,我认为可以考虑独创适合中国特色的软件。DSpace是一个免费的、开源的全球化数据库建库软件,市面上要花钱的软件能做到的,它都能够做到,也是很不错的一个软件。我们不只要建门户,做数据库,还要考虑协同工作,微软的office365很好。像这种协同工作平台,如果跨地区合作,都要在平台上建立账号,为了一个目标,同时修改word文档,做PPT,或者做一个项目,协同工作平台会帮你管理项目完成的全部过程。
最后,和大家聊聊未来的方志馆怎么借力于人工智能。首先,可以在刷脸入馆方面做些尝试,刷脸后就可以知道谁进了馆,享受了一些什么样的服务。第二,可以制作一个地方志咨询导航机器人,为到访方志馆的人提供服务,包括哪个房间提供这样的服务、哪里有所要的资源等信息,甚至可以带读者到合适的查阅点去。第三,是制作知识图谱,把方志里面最核心的知识点取出来,形成一个很大的网络,便于使用,最后能够形成智慧方志,这应该是未来五年、十年的奋斗目标。要把目标定得更高一点,实际上就是说要把人工智能和机器智能有效地结合在一起,决不能停留在人工写标语、写摘要,要让机器自动去做,让机器去做标注,去进行文本化,还可以让社会大众为方志加注标签等等,我们只不过是建立一套标准,让数据更加的准确,关联数据,等等。
我在网上读到一篇2015年的文章《习近平身边不离“志”》,讲的是习近平总书记在厦门工作期间,专门去读“厦门志”的故事,习近平总书记到任何地方都喜欢先去研究那个地方的地方志。地方志的建设是弘扬中华传统文化的重要组成部分,地方志的数字化建设是智慧城市、“互联网+政务服务”的基础信息设施之一,地方志的事情不是小事,做的是整个“互联网+政务服务”的基础信息设施,数据是未来智慧化城市的重要组成部分。地方志的计划变成现实是一个长期的过程,但有很好的机会可以实现弯道超车。现在谈智慧图书馆,谈智慧城市,地方志很快就可以谈智慧方志,这就是一种弯道超车。地方志不需要经过很长的时间,可以直接跨步走进智慧方志的时代。
原创文章,作者:nbdnews,如若转载,请注明出处:https://www.nbdnews.cn/01/14/39/28390.html