第166章解析小C的初步成果 - 学习使我富裕 - 青色的岩 - 二次元小说 - 30读书
当前位置: 30读书 > 二次元 > 学习使我富裕 >

第166章解析小C的初步成果

距离苏航的证明发布已有一月余。

一封邀请函从大洋彼岸飘洋过海来到了汉城大学。

“苏航,今天下午有空来办公室一趟,有件事情要和你说说。”

董利教授给苏航发了一条消息。

苏航回了个收到的表情包,然后继续敲代码。

上次已经和祝庆田、岳明两人达成共识。

在苏航的要求下,将会和麒麟联合开发一个倾向于工程领域的操作系统。

将会应用于智能建造领域。

设想是很美好的。

工地上重要岗位人手一台平板。

里面的搭载程序也很简单。

主要是内部通讯、设计图编辑查看、实时位置共享、任务分配、工期安排等方面。

根据工地摄像头对每一个人智能扫描,危险区域自动提醒,任务分配后才能专人进入任务场所。

将会提高施工安全性。

平板、定位装置都将是定制的。

所以系统也将是定制的。

至于苏航的功能,也将会在和麒麟的负责人沟通后视情况写入系统中去。

首先就是小c的自然语言识别、读写。

这里的自然语言主要还是中文。

麒麟系统本身就是倾向于中文环境开发的,很多的内部设置和打印规范都是按照国标来的。

有规范,那小c更容易进行识别。

这一块,苏航做得比较快。

这里的自然语言识别读写也是机器学习的一种。

如果资源足够,苏航大可以像谷歌一样,上亿的数据集砸下去,然后硬生生炼出一个自然语言识别程序。

就像是

如果数据集更加规范有序,进一步让程序能够自动生成文章也不是不行。

但是小c明显不是这样的。

当初小c所有的数据不过是字典词典和一些书籍,对了,还有团团和主流媒体的文章等等。

数据量少,而识别相契合度高,说明小c有着更加先进的算法。

尤其是自然语言有着大量的隐性信息。

汉语尤其如此。

比如,这是什么意思?

根据不同的语气就有不同的解读方式。

所以,对于模糊的汉语识别是非常困难的。

但是,理解诗词韵味对小c而言也许有些困难,但是结合语境理解自然语言的含义却是不在话下。

通过对小c的代码分析,苏航大概摸索清楚了小c的“逻辑”。

数据的价值不仅取决于量,还取决于质。

就像有些人可以见微知著,数据量虽少,但是却能够通过分析发挥更大的作用。

纯粹的用大量数据进行“筛选”,用淘汰的方式来选择合适的拟合路径,对算力的浪费是极大的。

小c则不一样。

在收集到数据后,首先建立了特殊的读写数据库。

就像是小学生学组词造句一样,小c也把每一个汉字给建立了知识图谱。

让数据变成了结构化的知识!

与其说是数据库,不如说是知识库。

不过这个知识库服务的对象不是人,而是小c,或者说,服务于机器。

其以算法为骨、以数据为肉,以内在逻辑为筋脉,体现了机器对于数据的理解。

如此下来,即使数据规模不大,但是却及其富有逻辑层次。

苏航回忆起最初使用小c的时候,虽然它不是很聪明,但是它可以清楚的认知到,什么是会的,什么是不会的。

这意味着它已经有了一个搭建好的逻辑平台、算法骨架,它清楚哪里有空缺,甚至会从已有的知识体系中去寻找解决方法。

而在后续允许登入部分网站后,小c的数据库得到了充实,形成了一个初步的知识网络,并且可以实时更新。

字体大小
主题切换