第499章 AI进度_游戏公司？这分明是科技巨头-爱下电子书

第499章 AI进度

陈腾将AI部门负责AIGC部门的负责人给喊了过来。

所谓AIGC，是ArtificialIntelligenceGeneratedContent的首字母拼音。

翻译过来，就是“人工智能生成内容”。

顾名思义，AIGC这类AI的作用，就是生成一些内容。

2022年以后大火的GPT，就是最广为人知的AIGC。

除此之外，还有AI作画、AI生成视频，都在AIGC的范畴之中。

在AIGC大火的时候，许多人认为一个全新的时代将要到来。

画画、写作、作曲……这类创作性的工作，由AI就能够完成。

然而理想很丰满，现实很骨感。

陈腾在这些AI工具大火的时候，也玩过几次。

只不过再尝试几次之后，就会发现这些AI工具存在着重大的缺陷。

文字类AI生成的内容牛头不对马嘴。

上一秒说过的话，下一秒就会忘记，记忆短得像是七秒钟记忆的鱼一样。

在算力达到一定程度之前，AI对于上下文内容的记忆能力永远都小得可怜。

不过用来写些没什么意义的检讨、总结、日报周报，还是相当不错的。

以及在写代码的时候，生成一些简单的代码。

图片类AI生成的内容同样存在一些问题。

比如说早期一直被诟病的手部细节，比如说只能生成动漫类型的图片。

一旦生成写实类的图片，就会显得非常失真。

用来做辅助工作还行。

要是想要靠AI独立地完成一些任务，还有很长的路要走。

2022年的AI水平尚且如此，2015年的AI水平就更加不用说了。

不过现在能迈出第一步，陈腾还是非常感兴趣的。

“老板，您找我？”

眼前的男人四十岁不到，叫做魏龙，是国内人工智能领域的一位专家。

他从腾达做手机语音助手的时候，就来到了腾达。

在语音助手这一块，做了相当多的工作。

技术水平是有口皆碑的好。

“对，我听朱岩哲说你们推出了一个AIGC的测试版本？”

“是的，目前我们的对话大模型暂命名为DH，版本号为0.1。”

“DH？”

“对话的首拼。”

“原来如此。”陈腾笑了笑，“那这个DH0.1现在大概处于什么样的水准？”

“对话的智力水平……大概只有幼儿园小朋友的水平吧。”

陈腾微微点头。

这个水平，的确不高。

也难怪版本号是0.1，而不是1.0。

“你觉得如果我们这个DH0.1如果需要提升，目前最欠缺的是什么？”

“数据。”魏龙毫不犹豫地回答道，“绝对是优质的数据，我们这个模型的水准还是不错的，就是数据实在是太少了。”

“数据吗……”

陈腾倒是没怀疑魏龙说的模型水准。

因为这个DH模型的基础，其实是【LSM人工智能语言学习大模型】。

就是陈腾上次五连抽，在系统上抽到的那个。

系统出品，怎么都不会太差劲的。

在抽到这个大模型之后，魏龙手下的技术团队又基于这个模型做了一定程度上的改进。

所以模型水准陈腾是非常信任的。

不过模型的学习能力强是一回事，数据又是一回事。

如果将模型比作一个人，优秀的模型就是天赋很高的天才。

可就算是顶级的天才，没有高质量的学习资料，能学到的东西也有限。

现在腾达的这个DH模型，缺乏的就是学习资料。

“我们现在的数据源有哪些？”

“就是各大平台上网友们交流的一些数据，比如短视频平台的评论区，直播平台的弹幕。不过这些数据的质量，实在是太低了。”

陈腾微微点头。

魏龙说的很有道理。

短视频平台的评论区，有相当多的一部分评论都是没什么意义的回复。

这个没意义，指的是对AI训练没意义。

比如颜值博主的评论区什么“好美”“好漂亮”的夸赞。

对于AI训练来说，意义不大。

经过筛选处理过后，能用的数据少得可怜。

陈腾又想到了GPT。

实际上第一代的GPT是在2018年推出的。

但是第一代的GPT在市场上，并没有搅动什么风云。

因为智能水平太低了，根本没有人乐意与这样的AI对话。

直到四年之后，足足喂了四年的数据，这才有了许多人愿意对话聊天的GPT。

可见AI的学习与发展，是一条十分漫长的路。

“如果按照现在的学习速度，你觉得我们的AI需要多长的时间，才能通过图灵测试？”

所谓图灵测试，就是让一个人去问AI问题。

看看这个人，能否发现正在与自己聊天对话的是AI。

能发现是AI，则未通过图灵测试。

未能发现是AI，则通过图灵测试。

这个测试方法在学术界具备一定的争议。

有人觉得这是一个很好的测试手段，有人则觉得这种测试手段没什么必要。

但是不管怎么说，图灵测试都可以作为一个AI智能程度的一个指标。

能通过图灵测试的人工智能不一定特别有用，但至少具备一定的智能程度。

“如果按照现在的学习速度，通过图灵测试的话大概需要两年吧。如果数据的量充足且优质，也许两三个月甚至更短的时间就能通过图灵测试了。”

魏龙有些无奈地说道。

优化模型、输入数据。

他们搞人工智能的，无非就是在做这两件事情。

“我倒是有一个想法，可以试一试，我们可以在互联网上，将DH0.1伪装成普通的用户，让真人用户和DH0.1对话试试。”

“可是DH0.1现在的水准，恐怕和正常人聊上几句，就会让人觉得聊天内容牛头不对马嘴了。”

“那有什么关系？”陈腾反问，“你现在上网去和人讨论问题，牛头不对马嘴的情况难道遇到的少吗？”

魏龙：“……”

还真别说，他确实在互联网上见证过生物多样性。

“那我们就伪装成真人，去和用户聊天？”

“嗯，你去找蒋华，让他配合你们弄些人机账号出来吧。”

“好的。”

“什么时候你们觉得这个对话模型有资格被称之为DH1.0了，我们就向用户正式开放我们这个对话模型。”

“如果能和大量真人进行对话，我觉得一年以内，甚至半年的时间我们就能达到1.0版本。智力水平，应该有七八岁小孩子这么高。”

“那还不错。”

陈腾对七八岁小孩子的智力水平还是认可的。

至少能对话了。

如果在这个基础上再进步，那就真的可以商业化了。