【Metaの新LLM】Llama3とは？【Llama2との違いは？】

こんにちは！みうです！

Metaから新しいOSSのLLM、Llama3が公開されました！

こちらについて、公開されている情報を解説します！

公式のページ

meta社の解説

Huggingface

結論から言うと、LLMあまり大きな違いはないようです。

私の感覚だとマイナーチェンジ。GPT4-1106から、GPT4-0125にアップデート、位の印象を受けました⚾️

では、具体的な変更点を見てみましょう

ここがいちばん大きな変更点のようです！

学習データ自体は公開されておらず、地味な変化ではあるのですが、精度には抜群に貢献する変化です🍎

モデルアーキテクチャは、以下の2点が変更点のようです。

GQAはLlama2でも採用されていた効率的にattention計算する機構です。

Tokenizerと併せてどちらも、性能をあげると言うより、コスパ良く推論することを重視しているようです

公式サイトには、モデルアーキテクチャとありますが、結局はそこまで大きな変更ではないようです

高いらしいです！

ただ私の知識だとこのベンチマークがどうなのかは分かりません。また、GPT4とも比較しておらず、おそらく比較の上で負けているため、意図的に公開していない比較なのかなと思います。

これは、想定通り、このままだと微妙そうです。

Hugging chatの画面

日本語で質問しても英語で返答してしまいます。これはSFTのデータが英語に偏っていることが原因です。

日本企業による日本語追加学習が楽しみですね♪

以下の内容は現在作成中だそうです。

は今後発表予定との事です！