一键总结音视频内容
Attention is All you Need
好用吗?智谱清言 GLM-4 的介绍
下面是对智谱清言 GLM-4 的一个简要介绍,包括它的一些特点和应用。
GLM-4 的基本概述
首先,让我们来看看 GLM-4 的基本图形:
我觉得这个图做的也不错,对吧?
GLM-4 的实际应用
现在,让我们来看看 GLM-4 的实际应用。
刷屏现状
今天下午,GLM-4 在我的朋友圈和各种群组里一直在刷屏。它主要是基于这篇文章:
今天下午 02:30,新智元发布了一篇新文章,介绍了 GLM-4。
这篇文章一直在转发和讨论,人们对它的能力表示很关心。
GBTS 的支持
GLM-4 现在已经支持国产的 GBTS,这是一个重大进步。
GLM-4 的能力
GLM-4 具有许多能力,包括:
- GPT-4 的 90%-99% 的能力
- 大海捞针测试
关于大海捞针测试,如果你使用过我之前的 kimi chat,你应该可以找到它的介绍。
这些能力让我对 GLM-4 的兴趣倍增,所以我决定深入了解它。
GLM-4 的实际应用
当然,我对 GLM-4 中一些特性表示了很大的兴趣,例如:
- 基础功能
- 绘图长文档的阅读数据分析
- 高级联网
我决定从这些方面开始测试 GLM-4,看看它是否能够提高我们用户的效率。
GLM-4 的界面
这是 GLM-4 的主界面:
你需要点击 GLM-4 才能查看它的功能。
GLM-4 的基础功能
当你打开 GLM-4 时,你可以看到它的基础功能,例如:
- 问答联网查询
- 画图插件
- 识图 等等
GLM-4 也具有这些功能,就像 GPT-4 一样。
GLM-4 的翻译能力
我首先想到的是 GLM-4 的翻译能力,尤其是长文的翻译。我最近一直在测试另一款国产的大语言模型 kimi chat,它的上下文长度比 GLM-4 更长。
我试图用 GLM-4 来翻译一篇中文的长文,看看它是否能比 kimi chat 给出一个更完善的翻译。
GLM-4 的图形应用
我还对 GLM-4 的图形应用表示了很大的兴趣,因为我使用 AI 来画图,包括我的公众号文章的封面和我的视频的封面。
我输入了提示词 "驴肉火烧",看看 GLM-4 是否能够理解这个中文短语,并给出一个符合我期望的图形应用。
GLM-4 的数据分析能力
最后,我对 GLM-4 的数据分析能力表示了很大的兴趣,因为我使用 AI 来分析数据。
我输入了一个提示词,让 GLM-4 分析一个数据集,看看它的数据分析能力如何。
总之,GLM-4 是一个强大的工具,可以提高我们的效率和生产力。我很高兴能够对它进行测试,并分享我的体验和见解。
🚀 GLM-4 的体验和见解
1. 随机森林的交叉验证
<img src="evaluate-model.png" alt="evaluate model">我们使用随机森林作为模型,进行交叉验证以评估它的性能。最终得到的结果如下:
- 随机森林的交叉平均准确率:59.59%
这是一个相对较好的开始,但还有改进的空间。
2. 改进性能的方法
我不喜欢大模型,因为如果你的话,我来怎么怎么样?所以,我们来分析一下这个模型:
- 自动处理整个流程
- 自动纠正出现的错误
59% 的准确率不高,但我觉得可以的。现在,我们来改进这个模型的效果。
3. 改进模型的步骤
-
特征工程
- 添加一些基于时间的特征
- 例如:将一个贷款的月数放入模型中,以提高性能
-
添加两个新的交互特征
-
定义超参数
- 执行网格搜索
- 评估最优的模型
4. 问题和建议
我建议 gr m4 给出具体问题的原因,而不仅仅给我一个代码并告诉我说这出错。这样,我才能判断如何处理这个问题。
我希望它的相关提示信息能够更加详细,至少给出相关的错误类型和一些分析,避免我在那里瞎摸索。
5. 高级联网的功能
我一开始不知道高级联网是干嘛的,但后来我明白了 perplexity 的功能。它可以访问大量的资料,然后综合资料与大语言模型的能力给你应答。
6. 联网阅读的尝试
我尝试了多种搜索方式,但未能找到关于天津师范大学的王树义老师在B站上最近发布的视频的具体信息。我看到这都懵了。
7. gr m4 的改进建议
我觉得在这一次上,gr m 真的是缩短了 jb t store 的发布进度。现在在 gr m4 上也能创建自己的智能体了。
我觉得这还是非常有意思的,只是我还没有来得及进行这个方面的测试。
我觉得有一些令人惊艳的部分绘图,绘制的质量也挺好。数据分析现在做的不错。尤其是他自己给你做了一个这样的预测模型,证明他在相关的软件包的这个配置上的执行。我觉得都做的比较好。
但是,我们需要改进以下几个方面:
- 输入文本的长度:能不能真的给我做到 128K?
- 错误处理方式:我建议能够提升稳定性,至少假设你还是得崩溃,你能不能别把前面的输出全都给我去除?
- 稳定性:我建议能够减少这种崩溃的次数,以提高稳定性。
我是王树义老师,如果你有任何反馈或问题,请在下方评论。