Meta推出Llama2作为LlamaAI模型的继任者

标签：

Meta 宣布推出新的 AI 模型 Llama 2。它是 Llama 模型的继任者，性能较上一代有所提高。

Llama 2 是一组 AI 模型，可以根据提示生成文本和代码，类似于其他对话系统。

Llama 2 可免费用于研究和商业目的，并且可以在 AWS、Azure 和 Hugging Face 的 AI 模型托管平台上以预训练的形式进行微调。但 Llama 并未向所有人开放，因为 Meta 由于担心滥用而选择限制对模型的访问。

Meta 在白皮书中重点介绍了 Llama 2 的功能，以下是 Llama 2 和 Llama 之间的一些基本功能和差异。

Llama 2 与 Llama 有何不同?

Llama 2 有两个版本，Llama 2 和 Llama 2-Chat。Llama 2-Chat 针对互动对话进行了优化。Llama 2 和 Llama 2-Chat 具有不同程度的复杂性：70 亿个参数、130 亿个参数和 700 亿个参数。

“参数”是从训练数据中学习的模型的组成部分，本质上决定了模型执行任务(在本例中生成文本)的能力。

Llama 2 接受了 2 万亿个 token 的训练，这些 token 是文本的基本单位。例如，“fan”、“tas”和“tic”代表“fantastic”一词。Llama 2 使用的代币数量是 Llama 的两倍(1.4 万亿)。更多的代币通常会带来更好的结果。

训练数据来源

Meta声称它依赖于向公众开放的在线资源来获取训练数据，但没有透露确切的来源。它表示，它不使用来自公司自己的产品或服务的数据，而是专注于本质上“事实”的文本。

骆驼2整体表现

Meta 指出，在一系列基准测试中，Llama 2 模型略逊于最著名的闭源竞争对手 GPT-4 和 PaLM 2，其中 Llama 2 在编码方面远远落后于 GPT-4。

“Llama 2 在许多外部基准测试上都优于其他开源语言模型，包括推理、编码、熟练程度和知识测试，”Meta 在博客文章中表示。

Meta 声称 Llama 2 在一组大约 4,000 条旨在探究“有用性”和“安全性”的提示中给出了相同的回答。

Meta 还承认，Llama 2 与所有创意 AI 模型一样，在某些方面存在偏见。例如，它往往比“她”代词更频繁地产生“他”代词。由于训练数据中存在有文本，它在性测试上并没有超越其他模型。

在 Meta 自己的“有用性”和性测试中，Llama 2-Chat 模型的表现优于 Llama 2 模型。但他们也往往过于谨慎，模型更愿意拒绝某些请求或回复过多的安全信息。