够用,但不好用。
这样的东西在周至眼里当然是不合格的,最多最多只能算是地基,离百尺高塔还差着老远的功夫。
信息工程就是这样,算法和协议的思路,往往比基础工作还要重要,如果指导思想发生了错误,等到工程进展到不敷使用,才想着改弦易辙,在已经叠房架屋的情况下,再要开展,将付出巨大的代价。
后世中文编码的巨大混乱情形,就是这种教训的最好注脚。
这些思路,是在四叶草的研发思想,周至提出来的“如何三问”原则思想指导下梳理出来的。
“如何三问”听着玄奥,其实很简单质朴,就是对于任何需求,我们要问三层以上的问题。
比如典籍数字化工程,按照一般的思路,好不好用?
答案肯定:不好用。
那第一个如何就来了:如何让它好用?
答案也简单:除了将一部部书籍扫描成文本文档外,还要在这个基础上,建立起一个庞大的标签体系和智慧搜索引擎。
那第二个如何就来了:如何建立起一个庞大的标签体系和智慧搜索引擎?
答案就是需要一个能够根据文档内容,自动化地分析提取特征标签的标签采集软件;要完成智慧搜索引擎,又需要一个球网状的数据拓扑关联系统。
那第三个如何就来了:我们如何开发这个标签采集软件和球网状的数据拓扑关联系统。
答案就是软件硬件并行,软件上,利用现在最新的数学统计学原理,引入计算机模型当中,开发出一套特征提取算法和特征联动算法,并将这套算法作为指导思想,完成软件开发。
硬件上,要克服现有计算设备算力不足的情况,就利用网络时代的助力,将广域网上的所有算力资源都最大程度地利用起来,研发出基于互联网基础的分布式算力应用系统。
这套理念现在还比较初步,但是根据这个理念建立起来的数字化《字海》,却非常的清晰明白,周至还牵头发明了一套论述体系,通过三维图层的方式来讲解一页字卡上,各项内容之间的复杂关联关系。
这隔着图示讲解下,韦一心和冷玉龙就能够看见平面化的字卡,变成了一个类似秸秆蝈蝈笼子,或者说像折叠式灯笼打开后的样子,各个图层之间通过算法将每一层的特征标签连接起来,构成了字卡的立体结构。
对于这一套思维体系,学文科的人理解起来甚至比学理科的还要容易,跟计算中心的曾教授,周至还要
本章未完,请点击下一页继续阅读!