Meta 发布最强开源大模型 Llama3.1

发表于： 2024-07-24 分类于：大模型

字数： 1755 阅读：≈ 4分钟评论：

大陆时间 2024 年 7 月 23 号 23:10，美国人工智能公司 Meta 发布最新的 Llama 开源模型 llama3.1 ，共有 8B 70B 和 405B 三种参数版本。

新一代大语言模型具有以下优势：

更大的上下文窗口: 支持 128K token 上下文窗口，能够更好地理解复杂的问题和上下文。
多语言支持: 同样支持多语言的功能 (8 种），能够有效处理不同语言的问题和任务。
改进的推理能力: 具备更强大的推理能力，能更好地解决复杂的问题和做出合适的决定。
工具使用: 支持使用各种工具来实现更高级别的用例和功能。

模型评估

Meta 在本次发布中对 Llama 3.1 进行了全面性能评估，涉及 150 多个多种语言基准数据集。此外还进行了广泛的人类评估，比较 Llama 3.1 与竞争对手的模型在真实世界场景下的表现。

与 GPT-4、GPT-4o 和 Claude 3.5 Sonnet 相比， Meta 的旗舰模型与业界领先的闭源模型具有相同水平的竞争力。

Llama 3.1 的 8B 小模型超越同数量级的闭源/开源模型。

开源协议与应用

Meta 更新了模型的许可协议，允许使用 Llama 模型（包括 405B 模型）的输出来改进其他模型，这是 LLM 开源领域的首创，将促进大语言模型的发展。Meta 就利用了 405B 参数模型来提高较小型模型的后训练质量。

Llama 3.1 模型可应用的场景有：

客服系统：提供更好的客户服务体验和帮助用户解决问题。
内容生成：创建更多种类和质量的内容，满足不同的需求和偏好。
问答系统：提供快速准确的答案和帮助用户解决问题。
语言翻译：支持多语言的翻译功能，帮助用户理解不同语言的文本和信息。

新的机会正在到来！

使用 Ollama 运行 llama3.1:8b

下载模型

$ ollama pull llama3.1:8b
pulling manifest
pulling ff07ca852139... 100% ▕██████████████████████████████████████████████████████████████████████████████████████████████████████▏ 4.7 GB
pulling cdbcae7e69d5... 100% ▕██████████████████████████████████████████████████████████████████████████████████████████████████████▏  571 B
pulling f1cd752815fc... 100% ▕██████████████████████████████████████████████████████████████████████████████████████████████████████▏  12 KB
pulling 56bb8bd477a5... 100% ▕██████████████████████████████████████████████████████████████████████████████████████████████████████▏   96 B
pulling 7f5b37e43ea5... 100% ▕██████████████████████████████████████████████████████████████████████████████████████████████████████▏  485 B
verifying sha256 digest
writing manifest
removing any unused layers
success

简单测试

$ ollama run llama3.1:8b "为什么天空是蓝色的？" --verbose
我们现在知道，天空是蓝色的，因为它反射了太阳光。这个基本的物理现象很好地解释了大自然中蓝色的一切。

太阳光线分为所有可见颜色的光波——从红到紫。蓝色的光波比红色的短，但也比绿色的长。地球大气层在我们头上时，会吸收所有的红色和橙色光线，然后把这些能量转换成热能。这个
过程叫做散射。

蓝色的光波因为其波长较短，所以能穿过大气层，而不被吸收掉。当我们看天的时候，我们实际上是在看到大气层反射的蓝光。

所以，天是蓝色的，因为大气层把红色的、橙色的和黄色的光波都阻挡了，只让我们看到蓝色光线。

total duration:       2.342940467s
load duration:        11.383278ms
prompt eval count:    16 token(s)
prompt eval duration: 63.679ms
prompt eval rate:     251.26 tokens/s
eval count:           193 token(s)
eval duration:        2.225761s
eval rate:            86.71 tokens/s

可以看到 llama3.1:8b 能根据问题的语言自动回复中文，不需要再主动要求用中文回复，这和 Meta 博客中说的支持多语言是一致的。

附：马克·扎克伯格 (Mark Zuckerberg) 的 AI 理念

马克·扎克伯格在一封公开信中分享了他的看法：

我们相信，开源将确保全球更多人有机会享受人工智能的益处，并且不会集中在少数人的手中。这也意味着技术可以更平等和安全地被部署到整个社会。

开放源码是未来

通过开放源码，我们希望能够使更多人能够享受 AI 带来的好处，减少权力集中在少数人的手中，并且让技术更平等和安全地被部署到整个社会。

安全和责任

我们也注重安全和责任。我们希望能够确保 AI 技术被部署到整个社会中，且不会带来任何危害或伤害。这也是我们继续努力推动开放源码成为行业标准的原因之一。

公开信全文