一键总结音视频内容

Attention is All you Need

好用吗?智谱清言 GLM-4 的介绍

下面是对智谱清言 GLM-4 的一个简要介绍,包括它的一些特点和应用。

GLM-4 的基本概述

首先,让我们来看看 GLM-4 的基本图形:

GLM-4 的基本图形

我觉得这个图做的也不错,对吧?

GLM-4 的实际应用

现在,让我们来看看 GLM-4 的实际应用。

刷屏现状

今天下午,GLM-4 在我的朋友圈和各种群组里一直在刷屏。它主要是基于这篇文章:

今天下午 02:30,新智元发布了一篇新文章,介绍了 GLM-4。

这篇文章一直在转发和讨论,人们对它的能力表示很关心。

GBTS 的支持

GLM-4 现在已经支持国产的 GBTS,这是一个重大进步。

GLM-4 的能力

GLM-4 具有许多能力,包括:

  • GPT-4 的 90%-99% 的能力
  • 大海捞针测试

关于大海捞针测试,如果你使用过我之前的 kimi chat,你应该可以找到它的介绍。

这些能力让我对 GLM-4 的兴趣倍增,所以我决定深入了解它。

GLM-4 的实际应用

当然,我对 GLM-4 中一些特性表示了很大的兴趣,例如:

  • 基础功能
  • 绘图长文档的阅读数据分析
  • 高级联网

我决定从这些方面开始测试 GLM-4,看看它是否能够提高我们用户的效率。

GLM-4 的界面

这是 GLM-4 的主界面:

GLM-4 的主界面

你需要点击 GLM-4 才能查看它的功能。

GLM-4 的基础功能

当你打开 GLM-4 时,你可以看到它的基础功能,例如:

  • 问答联网查询
  • 画图插件
  • 识图 等等

GLM-4 也具有这些功能,就像 GPT-4 一样。

GLM-4 的翻译能力

我首先想到的是 GLM-4 的翻译能力,尤其是长文的翻译。我最近一直在测试另一款国产的大语言模型 kimi chat,它的上下文长度比 GLM-4 更长。

我试图用 GLM-4 来翻译一篇中文的长文,看看它是否能比 kimi chat 给出一个更完善的翻译。

GLM-4 的图形应用

我还对 GLM-4 的图形应用表示了很大的兴趣,因为我使用 AI 来画图,包括我的公众号文章的封面和我的视频的封面。

我输入了提示词 "驴肉火烧",看看 GLM-4 是否能够理解这个中文短语,并给出一个符合我期望的图形应用。

GLM-4 的数据分析能力

最后,我对 GLM-4 的数据分析能力表示了很大的兴趣,因为我使用 AI 来分析数据。

我输入了一个提示词,让 GLM-4 分析一个数据集,看看它的数据分析能力如何。

总之,GLM-4 是一个强大的工具,可以提高我们的效率和生产力。我很高兴能够对它进行测试,并分享我的体验和见解。



🚀 GLM-4 的体验和见解

1. 随机森林的交叉验证

<img src="evaluate-model.png" alt="evaluate model">

我们使用随机森林作为模型,进行交叉验证以评估它的性能。最终得到的结果如下:

  • 随机森林的交叉平均准确率:59.59%

这是一个相对较好的开始,但还有改进的空间。

2. 改进性能的方法

我不喜欢大模型,因为如果你的话,我来怎么怎么样?所以,我们来分析一下这个模型:

  • 自动处理整个流程
  • 自动纠正出现的错误

59% 的准确率不高,但我觉得可以的。现在,我们来改进这个模型的效果。

3. 改进模型的步骤

  1. 特征工程

    • 添加一些基于时间的特征
    • 例如:将一个贷款的月数放入模型中,以提高性能
  2. 添加两个新的交互特征

  3. 定义超参数

    • 执行网格搜索
    • 评估最优的模型

4. 问题和建议

我建议 gr m4 给出具体问题的原因,而不仅仅给我一个代码并告诉我说这出错。这样,我才能判断如何处理这个问题。

我希望它的相关提示信息能够更加详细,至少给出相关的错误类型和一些分析,避免我在那里瞎摸索。

5. 高级联网的功能

我一开始不知道高级联网是干嘛的,但后来我明白了 perplexity 的功能。它可以访问大量的资料,然后综合资料与大语言模型的能力给你应答。

6. 联网阅读的尝试

我尝试了多种搜索方式,但未能找到关于天津师范大学的王树义老师在B站上最近发布的视频的具体信息。我看到这都懵了。

7. gr m4 的改进建议

我觉得在这一次上,gr m 真的是缩短了 jb t store 的发布进度。现在在 gr m4 上也能创建自己的智能体了。

我觉得这还是非常有意思的,只是我还没有来得及进行这个方面的测试。

我觉得有一些令人惊艳的部分绘图,绘制的质量也挺好。数据分析现在做的不错。尤其是他自己给你做了一个这样的预测模型,证明他在相关的软件包的这个配置上的执行。我觉得都做的比较好。

但是,我们需要改进以下几个方面:

  1. 输入文本的长度:能不能真的给我做到 128K?
  2. 错误处理方式:我建议能够提升稳定性,至少假设你还是得崩溃,你能不能别把前面的输出全都给我去除?
  3. 稳定性:我建议能够减少这种崩溃的次数,以提高稳定性。
<img src="gm4-model.png" alt="gm4 model">

我是王树义老师,如果你有任何反馈或问题,请在下方评论。