返回第0071章 我懂了  二将首页

关灯 护眼     字体:

上一页 目录 下一页

退出阅读模式,即可阅读全部内容

天晚上季青临打电话提醒他时他才想想起,要不然都快忘记了。

他们小组分到的课题是文本分类与聚类。

“分类”的英文叫classification,是利用机器学习中使用的最多的一大类算法,通常也把分类算法叫“分类器”。

这个说法其实非常形象,就是一个黑盒子,有个入口,有个出口,在入口丢进去一个“样本”,在出口期望得到一个分类的“标签”。

比如,一个分类器可以进行图片内容的分类标签,我们在“入口”丢进去一张桃谷绘里香的照片,在“出口”得到“女优”这样一个描述标签。

这就是一个分类器最为基本的分类工作过程。

而“聚类”英文叫Clustering,这个用专业术语来解释有些麻烦,我们可以把它叫做“物以类聚”。

打个比方,我们在小时候被父母用看图说话的方式来教咿呀学语的时候就有过类似的体会了,图片上画了一只猴子,于是我们就知道了这是一只猴子;

图片上画了一辆汽车,于是我们就了解了,这是一辆汽车,等等。

等我们上街或者去动物园的时候,猴子不是画上的猴子,而且各种各样的猴子也长得各不相同,我们会把它们当成一个一个的新事物去认识吗?

不会。我们只会把它们统称为猴子。

我们看汽车也一样,大小,颜色,样式,形形色色五花八门,它们在我们眼里是一个个新的事物吗?

不是。它们都叫汽车。

这就叫聚类,也叫物以类聚。

现在大数据分析里面对相关技术应用比较成熟。

就这样窝在沙发里看资料,不知不觉两个小时过去了。

中午一个人懒得做饭,叫了外卖。

吃过了休息了半个小时,本打算继续研究资料的,突然又觉得自己很傻。

这种课题对小白来说根本没什么意义,又不能给它成长带来任何好处,如果有必要的话,小白随时可以生成几十种具有国际先进性的分类与聚类的模型。

至于他,更没有必要学这种东西。

就算学,短期内也只能掌握一个皮毛。

他现在需要学的是人工智能的方向性知识。

想到这里,陈序把资料一扔。

去他奶奶的,浪费时间,浪费精力。

看了看时间,才不到一点钟。

起身走到阳台上极目远眺,

『加入书签,方便阅读』

上一页 目录 下一页