【新AI】Microsoftが新AI「Phi-2」を発表!特徴や性能を解説

【新AI】Microsoftが新AI「Phi-2」を発表!特徴や性能を解説

【新AI】Microsoftが新AI「Phi-2」を発表!特徴や性能を解説

12月12日、Microsoftは新しいAI「Phi-2」を発表しました。先日はGoogleが「Gemini」というAIを発表して話題になる中、Microsoftも新AIを開発し、競争が激しくなっています。

この記事では、「Phi-2」の特徴や性能についてまとめました。

コンテンツ [表示]

  1. 1新しいAIモデル、「Phi-2」が発表!独自の特徴は?
  2. 2Microsoftがこだわったポイントは?
  3. 3「Phi-2」の性能。「Gemini」との性能比較も
  4. 4まとめ

この記事のポイント

  • 「Phi-2」の独自の特徴
  • Microsoftがこだわった点
  • ほかのAIモデルとの性能比較あり

新しいAIモデル、「Phi-2」が発表!独自の特徴は?

Phi-2プレゼンテーションの様子

公式サイト(https://www.microsoft.com/en-us/research/blog/phi-2-the-surprising-power-of-small-language-models/)から引用

12月12日、Microsoft社は新しいAIモデル、「Phi-2」を発表しました。「SLM」と呼ばれる小規模言語モデルで、データ容量が少ないながら高い精度を誇るAIモデルです。

言語モデルAIの世界では、以前から言語モデルのスケーリング則(Scaling Laws for Neural Language Models)という法則が提唱されていました。2020年にOpenAI社が発表した法則です。

この法則は、基となるデータが巨大であるほど、回答が正確になるというものです。パラメータや計算量が多かったり、データ源が大きかったりすると、それだけ間違った回答をする可能性が減るのです。

この法則に従って、大量のデータを内蔵したAI、大規模言語モデル(LLM)がいくつか制作され、その正確性から多くの人を驚かせてきました。ChatGPTに使われているGPT-3やGPT-4は、そうしたLLMの一つです。

一方で、こうした大規模なモデルには制約がありました。多くのデータを貯蔵する巨大なデータセンターを作る必要があるほか、コストも莫大という課題があるのです。ChatGPTもオンラインのみの提供になっている通り、個人や小規模の団体が、LLMを所有することは難しかったのです。こうした背景から、小規模かつ高性能なAIモデルが必要とされてきました。

今回発表された「Phi-2」は、その要求に応えうるモデルです。Microsoft社が開発してきた小規模言語モデル、「Phi」シリーズの後継で、小規模ながら高い精度を誇っています。

Microsoftがこだわったポイントは?

「Phi-2」を開発するにおいて、Microsoft社がこだわった点が二点あります。1つ目は、AIが回答する基となるデータの質。もう1つが、前世代の「Phi-1.5」に、必要なデータを追加したうえで容量を抑えることです。

Microsoft社は言語モデルを作成する際、基となるデータの質にこだわっています。「Phi-2」では、「教科書に載せられるレベル」の質のデータが使用されました。また、「Phi-1.5」からデータを引き継ぎつつ、正確性のためにデータが追加されており、パラメータが13億から27億に増えています。

「Phi-2」の性能。「Gemini」との性能比較も

「Phi-2」は比較的小規模ながらも高い性能を発揮するようになりました。Microsoftの公式サイトには、他のAIモデルとの性能比較があります。

Phi-2と他AIの性能比較表

公式サイト(https://www.microsoft.com/en-us/research/blog/phi-2-the-surprising-power-of-small-language-models/)から引用

Phi-2が他よりも少ない容量である一方、他のAIと同等か、それよりも高い成績を残していることがわかります。ちなみに「BBH」とはBig-Bench Hardの略で、難易度の高い推論テストのことを指します。

特に、Googleが先日発表した「Gemini Nano」との比較では、「Phi-2」の高いパフォーマンスが示されています。「Gemini Nano」よりサイズが小さい一方で、推論テストやコーディングテストなどの試験で、より高い成績を記録しています。

geminiとphi-2の性能比較表

公式サイト(https://www.microsoft.com/en-us/research/blog/phi-2-the-surprising-power-of-small-language-models/)から引用

  • BoolQとMMLUは文章理解テスト
  • MBPPはコーディングテスト

また、「Gemini」は物理の問題を解くことができますが、「Phi-2」も同じ問題を正解できました。回答の中で誤っている部分を指摘し、正答を導き出すことができたのです。

ただ、「Gemini」は、画像や音声など、テキスト以外のデータも処理できるという強みがあります。「Gemini」は手書きの回答用紙を読み取って回答しましたが、「Phi-2」はテキストデータからのみの推論です。「Gemini」は様々な種類のデータを統合して処理できる点が強みで、特長は異なります。

まとめ

Microsoftが公表した、「Phi-2」の情報をまとめました。

先日はGoogleの「Gemini」が発表されて話題となるなか、Microsoftも新しいモデルを発表するなど、AIをめぐる競争はさらに激化しています。

加速していくAIの進化に注目です。

neru
ライター

neru

大学生時代に英文学を専攻していたライターです。学生時代からゲームやVtuberといった領域に興味を持っており、情報収集をしてきました。現在は英語のスキルを活かしつつ、英語×エンタメ最新領域を掛け合わせたリサーチ活動や、記事執筆を行っています。好きなものはラーメン、サッカー観戦、音楽鑑賞。

おすすめの記事

Recommended Articles
  • ゲーム企画の伝え方 〜より良い企画を作成するために抑えるべきポイント〜

    2024.02.13

  • 【完全版】ChatGPTを使いこなすための汎用プロンプト16選

    2024.03.22

  • ChatGPTを使ったゲーム企画書の書き方|すぐに使えるプロンプトと実例

    2024.03.22