###
はじめに
前回に続いて、2024年に公開された論文「Resolving Code Review Comments with Machine Learning」に基づいて、大規模言語モデルをコードレビュー支援に適用したGoogle社内の事例を紹介します。この論文では、Google社内では、コードレビューのプロセスに大規模言語モデルによる支援を組み込んでいることが報告されています。今回は、モデルの精度向上に向けたチューニングについて解説します。
レビュープロセスへの適用の流れ
前回の記事で説明したように、コードレビュー支援に使用する大規模言語モデルは、レビューコメントから対応するコードの修正案を予測します。このモデルは、予測結果とあわせて結果に対する信頼度を出力するようになっており、信頼度が事前に決めたしきい値以上のものだけを使用します。これを現実のレビュープロセスに適用する場合、次のような処理をレビューツールに組み込みます(図1)。
図1 レビューツール上での処理の流れ(論文より抜粋)
図1に並んだ箱を上から順に説明すると次のようになります。
(1) レビュアーが入力したコメントを受け取る。
(2) レビュアー以外のツールが自動挿入したコメントやすでに解決済みのコメントを除外する。
(3) モデルの予測に対する信頼度がしきい値以下のものを除外する。
(4) その他の除外ルールを適用して、最終的に残ったものをツールの画面上に表示する。
(5) 開発者が修正案の存在に気づいて内容を確認する。
(6) 開発者が修正案を採用する。
この続きは以下をご覧ください
リンク
御社のプレスリリース・イベント情報を登録するには、ZDNet Japan企業情報センターサービスへのお申し込みをいただく必要がございます。詳しくは以下のページをご覧ください。