王正阳陪着秦毅往研究所内走去,聊到汉语操作系统、汉语编程相关的内容,他的眉毛都皱成了川字。
“汉语操作系统和汉语编程虽然是一个老话题了,以前也有很多前辈在研究这个东西,但是一直以来我们都没有任何的进展,你也不要太过着急,仔细的理清楚思路,办法总比困难多。”
秦毅笑着安慰。
汉语编程和汉语操作系统并不是什么新鲜的东西,从计算机传到我们国内开始,我们国家就有人去研究这个汉语操作系统和汉语编程。
原因很简单,因为汉语是我们的母语,我们日常生活也好,工作往来也好全部都是使用汉语,而计算机领域内的东西几乎都和英语有关,基础和框架都是建立在英语的基础上。
这对于我们国家的计算机技术和互联网产业的展都非常不利,如果能够使用汉语去编程、构造汉语操作的话,对于我们国家计算机和互联网产业的展都非常有帮助。
不过,汉语编程和汉语操作系统的研究可谓是坎坷无比,异常的艰辛。
从早开始的时候,仅仅只是为了研究一个汉语输入法,国家这边就召集了很多研究人员、科学家去仔细的研究。
因为汉语和英语是完全两个不同的语种,彼此之间的差别实在是太大了。
汉语属于汉藏语序的文字,是从最早的象形文字衍变而来;英语则是属于印欧语序,由26个源于拉丁字母的字母组成。
因为两种语言的巨大差异,在计算机和互联网刚刚传播到我们国内的时候,我们往计算机内输入汉字非常的慢,还必须依靠拼音字母来输入汉字。
后来经过科学家和研究人员的辛苦研究,明了五笔输入法,汉字输入度瞬间飙升,再后来,随着研究输入法的人越来越多,各种各样的智能输入法相继出现,汉语输入的问题得到了很好的解决。
但是在汉语编程和汉语操作系统上面的研究,一直以来都没有任何实质性的突破,目前全球主流和使用最广的编程软件全部都是英文软件。
至于操作系统,那更是英语的天下,不管是微软的indos系统还是苹果公司的系统,那也都是基于英语基础上的操作系统。
投入很多,研究这方面的人也很多,却是始终没有什么实质性的突破,以至于有些人甚至将责任怪到汉语的头上。
认为汉语是劣等语言,无法适应时代潮流的展,国家应该全面淘汰汉语,学习印度将官方语言改为英语,这样才能够更好的和世界接轨,赶上时代潮流的展。
当然关于这种故意贬低自己,抬高别人的荒谬说法最后都不攻自破,随着智能手机的出现,大家陡然就现,在手机上面输入信息,汉语用九个字母键就足够了,度非常快,但是英语的输入就非常慢,而且极容易出现错误。
以至于英语输入的时候,大家竟然渐渐地有向汉语学习的趋势,使用更加简洁的方式来表达意思。
“我也不怎么急,只是一直以来没有什么进展,整个人都非常烦躁。”
听到秦毅安慰的话,王正阳微微苦笑。
能够进入星河科技研究院,他的工资待遇非常不错,富足的小康生活是完全没有任何的问题,生活上没有什么烦恼的事情。
可是这工作上面,研究这汉语编程和汉语操作系统,长期没有什么进展之下,整个人都变的非常的烦躁,一度甚至都想要辞职不干了。
“跟我说说,这汉语编程和汉语操作系统方面到底有那些问题?”
秦毅笑了笑,其实汉语编程和汉语操作系统的研究方面,秦毅多少也是知道一些的,并且自己也是去认真的学习和研究过。
在科技塔之中,秦毅也是仔细的研究了宇宙之中诸多文明的语言和文字,找到了很多和汉语差不多的语言,仔细的研究他们的计算机操作系统和编程系统。
而科技塔作为高级文明的作品,对于不懂语言和文字之间的系统、编程之类的也是有详细的说明,各种各样的文字该如何去出,如何去理清思路都有一个指引。
这一次过来,秦毅也是打算将这些思路和方法传授给大家,不然,等虚拟机都研究出来了,这汉语操作系统和汉语编程系统都未必已经研究出来。
“从哪里说起好呢~”
王正阳带着秦毅来到了研究所里面,来到一间会议室当中,会议室里面坐满了研究所的研究汉语编程和汉语操作系统的人。
王正阳仔细的整理了一番自己的语言,想了想说道:“先从语言说起吧,汉语相比起英语来,有很多优势。”
“汉语文字精炼,言简意赅,冗余度低,以最少的符号表达最丰富的含义,我们从信息学的角度予以阐述,汉字、西文字母作为语言文字的最基本单位,用以构成词汇、句子,传达一定的信息,是信息的载体,如何对每一个汉字、字母所负载的信息进行度量?”
“现代信息学用熵来衡量平均信息量,熵表示指定符号出现的不肯定性。西文字母采用的拼音文字字母有3o个左右,汉语以方块字为书写单位,数目成千上万,显然其随机出现的不肯定程度比西文字母的不肯定程度要大得多,从这一角度讲每个汉字载荷的信息量远远大于一个字母的信息载荷量。”
“我们经过统计计算,得出法语字母的零阶熵值为3.比特,西班牙字母零阶熵值为4.o1比特,英语字母的零阶熵值为4.o3比特